尔云间生信代码|基于癌症分类预测的标志物特征提取的SVM-RFE分析代码

2022-08-23 15:35 作者:尔云间 0人读过 | 我要投稿

科研有捷径，输入代码，一键获取科研成果！就是这么省事，来具体看下有多方便！

搜索http://985.so/a9kb查看全部代码（目前共计50+持续新增中），也可以点击右侧【目录】，可以看到更多有趣的代码；真香提示：文末可以知道如何获取代码~

支持向量机递归特征消除(简称SVM-RFE)是一种基于Embedded方法。广泛用于模式识别，机器学习等领域，SVM-RFE采用结构风险最小化原则，同时最小化经验误差，以此提高学习的性能。而SVM-RFE是一个基于SVM的最大间隔原理的序列后向选择算法。它通过模型训练样本，然后对每个特征进行得分进行排序，去掉最小特征得分的特征，然后用剩余的特征再次训练模型，进行下一次迭代，最后选出需要的特征数。因此，本代码SVM-RFE就是在癌症分类预测时用于标志物特征提取。

设置参数少，只需要输入有分类信息的基因表达数据，代码将自行执行序列后向选择算法，对每个特征进行得分进行排序并输出格式为CSV表格，同时还可以绘制特征的真实值和错误率变化曲线图。

使用方法：

Rscript SVMRFE.R -input=

参数说明：

USAGE:

SVMRFE.R -input=<input>

PARAMETERS:

-input the expression data,the first column is sample name,the second column is group,the third column is gene symbol,input txt format.

操作步骤：

1、打开命令行界面，输入“Rscript SVMRFE.R”调阅帮助文档，确定该程序所需的输入文件。

2、用户根据帮助文档中的参数说明内容，对参数进行设置。这里，必须输入参数有1个，分别是-input，表示表达数据，第一列是样本名称，第二列是分组，第三列是基因符号，输入txt格式。

3、完成参数提交后，按下回车键，整个程序即正式开始进入执行。每步执行内容都会给出提示。程序执行完毕后，界面会显示”Program execution is completed<span data-raw-text="" "="" data-textnode-index-1661239480900="84" data-index-1661239480900="781" class="character" style="margin: 0px; padding: 0px;">"结束语。

流程图：

结果展示：

svm-accuracy

该图表示每个基因预测真实值变化曲线

svm-error.

该图表示每个基因预测错误值变化曲线

feature_svm.

该表格表示每个基因的权重得分

如需代码及示例数据等文件，请扫码聊天框回复 “B38”领取！

写在文末：

如果您近期想做生信方面的文章而苦于没有思路，或者不知道如何来入手生信分析，或者兑具体的某一个图有作图需求，都可以扫码咨询小云，我们有专业的技术团队，生信热点思路设计、生信分析、热点方向生信挖掘等，如有需要，可扫码下方二维码了解详情：作者：尔云间 https://www.bilibili.com/read/cv18127077 出处：bilibili