LAASO的非癌症形态,LASSO的诊断分析
尔云间 一个专门做科研的团队

首先是准备两个数据集,一个是分组的数据,另一个是基因表达数据。
分组数据是两分组,用0和1表示。基因表达数据就是基因的表达量了,不过这里要注意的是行为样本,列为基因。
library(glmnet)#载入所需R包
y <- read.table(file = "Y.txt",header = T,sep = "\t",row.names = 1)#载入分组数据
x <- read.table(file = "X.txt",header = T,sep = "\t",row.names = 1)#载入表达数据
x<-as.matrix(x)#建立矩阵数据
y<-as.matrix(y)#建立矩阵数据
y[1:5,]#数据预览
x[1:5,]#数据预览
set.seed(20201015)
fit = glmnet(x, y, family = " binomial")#执行LASSO分析,这个参数就是用于二分组时的分析参数,做预后分析的时候就是cox
par(mar=c(5,5,3,2),cex = 0.8)
plot(fit,cex.axis=1)#绘制LASSO曲线图
cvfit = cv.glmnet(x, y, family = " binomial")#执行交叉验证
par(mar=c(5,5,3,2),cex = 0.8)
plot(cvfit,cex.axis=0.8)#绘制交叉验证图
coef.min = coef(cvfit, s = "lambda.min")#提取lambda取最小值时的LASSO系数
active.min = which(coef.min != 0)#提取不为0的LASSO系数
index.min = coef.min[active.min]
index.min
coef.min
最后得到两张图,如下图所示:
图一

图二

小果的这个数据最后是得到了5个基因,这样就可以对这些基因继续进行分析了。

这就是今天的主要内容了,希望对小伙伴们的分析有帮助,小果觉得这个还是挺实用的,小伙伴们觉得如何呢?小伙伴们有问题欢迎来和小果分享讨论啊。
推荐阅读
shengxinguoer
生信果
生信硬核知识解答
和小果一起学生信