尔云间生信代码|基于癌症分类预测的标志物特征提取的SVM-RFE分析代码
科研有捷径,输入代码,一键获取科研成果!就是这么省事,来具体看下有多方便!
搜索http://985.so/a9kb查看全部代码(目前共计50+持续新增中),也可以点击右侧【目录】,可以看到更多有趣的代码;真香提示:文末可以知道如何获取代码~
支持向量机递归特征消除(简称SVM-RFE)是一种基于Embedded方法。广泛用于模式识别,机器学习等领域,SVM-RFE采用结构风险最小化原则,同时最小化经验误差,以此提高学习的性能。而SVM-RFE是一个基于SVM的最大间隔原理的序列后向选择算法。它通过模型训练样本,然后对每个特征进行得分进行排序,去掉最小特征得分的特征,然后用剩余的特征再次训练模型,进行下一次迭代,最后选出需要的特征数。因此,本代码SVM-RFE就是在癌症分类预测时用于标志物特征提取。
设置参数少,只需要输入有分类信息的基因表达数据,代码将自行执行序列后向选择算法,对每个特征进行得分进行排序并输出格式为CSV表格,同时还可以绘制特征的真实值和错误率变化曲线图。
使用方法:
Rscript SVMRFE.R -input=
参数说明:
USAGE:
SVMRFE.R -input=<input>
PARAMETERS:
-input the expression data,the first column is sample name,the second column is group,the third column is gene symbol,input txt format.
操作步骤:
1、打开命令行界面,输入“Rscript SVMRFE.R”调阅帮助文档,确定该程序所需的输入文件。
2、用户根据帮助文档中的参数说明内容,对参数进行设置。这里,必须输入参数有1个,分别是-input,表示表达数据,第一列是样本名称,第二列是分组,第三列是基因符号,输入txt格式。
3、完成参数提交后,按下回车键,整个程序即正式开始进入执行。每步执行内容都会给出提示。程序执行完毕后,界面会显示”Program execution is completed<span data-raw-text="" "="" data-textnode-index-1661239480900="84" data-index-1661239480900="781" class="character" style="margin: 0px; padding: 0px;">"结束语。
流程图:

结果展示:

svm-accuracy
该图表示每个基因预测真实值变化曲线

svm-error.
该图表示每个基因预测错误值变化曲线

feature_svm.
该表格表示每个基因的权重得分
如需代码及示例数据等文件,请扫码聊天框回复 “B38”领取!
写在文末:
如果您近期想做生信方面的文章而苦于没有思路,或者不知道如何来入手生信分析,或者兑具体的某一个图有作图需求,都可以扫码咨询小云,我们有专业的技术团队,生信热点思路设计、生信分析、热点方向生信挖掘等,如有需要,可扫码下方二维码了解详情: 作者:尔云间 https://www.bilibili.com/read/cv18127077 出处:bilibili


