尔云间生信代码|基于逐步多因素cox回归筛选预后标记基因并构建风险评分模型

临床预测模型是指使用数学模型来评估受试者当前患有某种疾病的概率或将来发生某种结局的可能性。通过该模型,利用已知特征来计算未知结局发生的概率。临床预测模型一般采用各种回归分析方法建模,回归分析的统计本质是寻找一种定量因果关系。简单地说,回归分析是评估变量X对结局Y的影响程度的定量描述。常用的方法有多元线性回归模型、Logistic回归模型和Cox回归模型。预测模型有效性的评估和验证是统计分析、数据建模和研究设计的关键。预后模型侧重于研究疾病在特定时间段内复发、死亡、伤残和并发症等结果发生的概率。这种模型在研究中非常常见,有利于找到预后相关的标记物,为临床治疗提供参考依据。
因此,本软件基于样本的生存信息,包括生存时间和生存状态,结合一组基因在各个样本中的表达值,通过多因素cox模型,采用逐步回归算法,预期找到对生存影响最大的基因组合,结合对应的回归系数构建预后模型,为后续下游分析提供参考。用户只需要输入样本的生存信息以及基因表达水平,软件将自行筛选出对生存影响最大的基因组合以及对应的回归系数,并计算得到各个样本的风险评分,同时根据风险评分中位值将样本分为高低风险组,观察两组的生存差异。
使用方法:
stepmuti_Riskscore.R -surdata=
参数说明:
USAGE:
stepmuti_Riskscore.R -surdata=<surdata>
PARAMETERS:
-surdata the gene expression level in all samples and survival information for each sample ,gene as column,sample as row ,The first two columns are survival time and survival status respectively.the input csv format.
操作步骤:
1、打开命令行界面,输入“Rscript stepmuti_Riskscore.R”调阅帮助文档,确定该程序所需的输入文件。
2、用户根据帮助文档中的参数说明内容,对参数进行设置。这里,必须输入参数只有1个:surdata,表示基因在各个样本中的表达水平以及样本的生存时间和状态信息,每个样本为一行,保存为以逗号分隔的csv文件,其中前两列分别为样本的生存时间和生存状态,从第三列依次往后为各个基因在样本中的表达值。
3、完成参数提交后,按下回车键,整个程序即正式开始进入执行。每步执行内容都会给出提示。程序执行完毕后,界面会显示"Program execution is completed"结束语。
结果展示:
1. multiCox.xls

该表格表示逐步多因素cox回归筛选的基因组合,coef表示回归系数,HR为风险比,HR.95L和HR.95H分别为95%置信区间,p.value为显著性
2. risk.txt
该表格表示最后筛选的基因组合在样本中的表达值以及每个样本通过模型分析计算出来的riskscore值。
3.forest.pdf

4.Risk_score.pdf

5.K-M.pdf

6.gene_pheatmap.pdf

7.ROC_RiskScore.pdf

特别说明:本代码经申请软件著作权,仅转让使用权,不转让所有权
如需代码及示例数据等文件,请扫码聊天框回复 “B51”领取!

写在文末:
如果您近期想做生信方面的文章而苦于没有思路,或者不知道如何来入手生信分析,或者兑具体的某一个图有作图需求,都可以扫码咨询小云,我们有专业的技术团队,生信热点思路设计、生信分析、热点方向生信挖掘等,如有需要,可扫码下方二维码了解详情:
