尔云间生信代码|利用逐步回归法筛选特征基因构建Cox风险模型分析
科研有捷径,输入代码,一键获取科研成果!就是这么省事,来具体看下有多方便!
搜索http://985.so/a9kb查看全部代码(目前共计50+持续新增中),也可以点击右侧【目录】,可以看到更多有趣的代码;真香提示:文末可以知道如何获取代码~

COX比例风险模型(cox proportional-hazards model),是英国统计学家D.R.COX(1972)提出的一种半参数回归模型。该模型通常是用于医学研究中,分析一个或多个前定变量对患者生存时间的影响。与单变量分析常用的Kaplan-Meier 曲线和logrank tests 不同,COX模型是多因素生存分析的方法,并且,COX回归把生存分析方法拓展到同时评估几种风险因素对生存时间的影响,因此有更广泛的运用。
在进行特征筛选时,从大量候选变量中选择最终的预测变量有以下两种流行的方法:逐步回归法(stepwise method)和全子集回归(all-subsets regression)。逐步回归法step()里面的direction='forward','backward','both'的三种回归方式,就是分别向前逐步回归、向后逐步回归和向前向后逐步回归,本代码结合了向前逐步回归和向后逐步回归的方法(即direction='both'),变量每次进入一个,但是每一步中,变量都会被重新评价,对模型没有贡献的变量将会被删除,预测变量可能会被添加、删除好几次,直到获得最优模型为止。
使用方法:
Rscript Cox.R -uniSigExp=uniSigExp.txt
参数说明:
USAGE:
Cox.R -uniSigExp=<uniSigExp>
PARAMETERS:
-uniSigExp In the input file, the first column is the sample name, the second column is the sample survival time, the third column is the sample survivalstatus, and the fourth column and subsequent column is the gene expression matrix to be included in the analysis
操作步骤:
1、打开命令行界面,输入“Rscript Cox.R”调阅帮助文档,确定该程序所需的输入文件。
2、用户根据帮助文档中的参数说明内容,对参数进行设置。这里,必须输入参数有1个,即-uniSigExp,提供输入数据。该输入文件中第一列是样本名,第二列是样本的生存时间,第三列是样本的生存状态,第四列及以后是要纳入分析的基因表达量矩阵。
3、完成参数提交后,按下回车键,整个程序即正式开始进入执行。每步执行内容都会给出提示。程序执行完毕后,界面会显示”Program execution is completed"结束语。
结果展示:
1. multiCox.xls :多因素Cox分析结果文件

第1列为筛选出来的特征基因;
第2列coef 为系数beta;
第3列HR即hazard ratio,代表风险率;
第4-5列HR .95L和HR .95H为95%的置信区间;
第6列pvalue为p值。
2. risk.txt :每个患者的风险值结果

第1列为样本名;
第2列为患者的生存时间;
第3列为患者的生存状态;
第4-n列为每个特征基因的表达量;
倒数第2列riskScore为每个患者的风险值;
最后一列risk为该患者是的风险分组。
特别说明:本代码经申请软件著作权,仅转让使用权,不转让所有权
如需代码及示例数据等文件,请扫码聊天框回复 “B48”领取!

写在文末:
如果您近期想做生信方面的文章而苦于没有思路,或者不知道如何来入手生信分析,或者兑具体的某一个图有作图需求,都可以扫码咨询小云,我们有专业的技术团队,生信热点思路设计、生信分析、热点方向生信挖掘等,如有需要,可扫码下方二维码了解详情:
