欢迎光临散文网 会员登陆 & 注册

LAASO的非癌症形态,LASSO的诊断分析

2023-01-19 11:29 作者:小云爱生信  | 我要投稿

尔云间  一个专门做科研的团队

原创 小果 生信果


首先是准备两个数据集,一个是分组的数据,另一个是基因表达数据。


分组数据是两分组,用0和1表示。基因表达数据就是基因的表达量了,不过这里要注意的是行为样本,列为基因。


library(glmnet)#载入所需R包
y <- read.table(file = "Y.txt",header = T,sep = "\t",row.names = 1)#载入分组数据
x <- read.table(file = "X.txt",header = T,sep = "\t",row.names = 1)#载入表达数据
x<-as.matrix(x)#建立矩阵数据
y<-as.matrix(y)#建立矩阵数据
y[1:5,]#数据预览
x[1:5,]#数据预览
set.seed(20201015)
fit = glmnet(x, y, family = " binomial")#执行LASSO分析,这个参数就是用于二分组时的分析参数,做预后分析的时候就是cox
par(mar=c(5,5,3,2),cex = 0.8)
plot(fit,cex.axis=1)#绘制LASSO曲线图
cvfit = cv.glmnet(x, y, family = " binomial")#执行交叉验证
par(mar=c(5,5,3,2),cex = 0.8)
plot(cvfit,cex.axis=0.8)#绘制交叉验证图
coef.min = coef(cvfit, s = "lambda.min")#提取lambda取最小值时的LASSO系数
active.min = which(coef.min != 0)#提取不为0的LASSO系数
index.min = coef.min[active.min]
index.min
coef.min

最后得到两张图,如下图所示:


图一


图二

小果的这个数据最后是得到了5个基因,这样就可以对这些基因继续进行分析了。



这就是今天的主要内容了,希望对小伙伴们的分析有帮助,小果觉得这个还是挺实用的,小伙伴们觉得如何呢?小伙伴们有问题欢迎来和小果分享讨论啊。


推荐阅读



shengxinguoer

生信果


生信硬核知识解答

和小果一起学生信


LAASO的非癌症形态,LASSO的诊断分析的评论 (共 条)

分享到微博请遵守国家法律