欢迎光临散文网 会员登陆 & 注册

尔云间生信代码|基于R包pRRophetic和基因表达矩阵估算样本对药物反应的敏感性软件

2022-10-19 09:08 作者:尔云间  | 我要投稿


病人对药物的反应情况通常是一个很复杂的现象,由遗传因素和环境共同决定着。所以研究者通常认为我们要想预测药物作用就得收集尽可能多的信息,比如使用全基因组范围的snp信息来预测复杂性状,但是癌症患者有个特性,就是他们的染色体通常是非整倍体,所以从肿瘤样本里面测序得到可靠的基因型其实是比较困难的。相反,量化所有基因表达情况是很容易的事,问题在于,通过芯片来量化基因表达情况的重复性不太好,尤其是不同公司的芯片。


 因此,开发pRRophetic包的作者选取了Cancer Genome Project (CGP) 数据库里面收录的 700多种细胞系的 138 种药物的作用情况,开发了用CGP数据库的表达矩阵进行药物反应预测算法。本软件利用基因表达矩阵,通过pRRophetic包内部算法,采用ridge包的linearRidge()函数做岭回归分析,从而完成对药物的敏感性预测,进一步结合样本分组文件,找到不同组别下敏感性差异的药物,为后续进一步研究提供参考。用户只需要输入基因表达矩阵、要研究的候选药物名称以及样本的表型信息,软件将自行计算出各个样本对各个药物的反应敏感性IC50值,同时结合样本分组绘制不同组别下IC50值的表达分布箱式图。


使用方法:

       pRRophetic.R  -Eset=  -drug_name=  -sampleLabels=  -control=  -case=


参数说明:

USAGE:

        pRRophetic.R -Eset=-drug_name=-sampleLabels=-control=,-case=

PARAMETERS:

        -Eset   the gene expression matrix ,gene as row,sample as column ,input txt format with tab-separated.

        -drug_name      the drug name of interested,the only one column is drug name that must be one of the 158 drug the package provide,input txt format with tab-separated.

        -sampleLabels   the sample classification labels ,the first column is sample name which is consistent with Eset column in order,the second column is the classification labels, input txt format with tab-separated.

        -control        the label of control group,strings.

        -case   the label of case group,strings.


操作步骤:

1、打开命令行界面,输入“Rscript pRRophetic.R”调阅帮助文档,确定该程序所需的输入文件。

2、用户根据帮助文档中的参数说明内容,对参数进行设置。这里,必须输入参数有5个,分别是-Eset,表示基因表达矩阵文件,以基因为行,样本为列,保存为以Tab键分隔的txt文件;-drug_name 表示各个候选药物的名字,只有一列,一个药物一行,前提是药物名称必须包含在pRRophetic包中提供的138种药物中,可以通过在R中输入?pRRopheticPredict()来查看;-sampleLabels表示样本表型信息,包含两列,第一列为样本名称,必须包含于或等于基因表达矩阵的样本,第二列为对应的表型或分组,列名为”group”;-control表示对照组的组名;-case表示疾病组的组名。

3、完成参数提交后,按下回车键,整个程序即正式开始进入执行。每步执行内容都会给出提示。程序执行完毕后,界面会显示”Program execution is completed"结束语。


结果展示:

1.*_boxplot of predicted IC50.pdf

该图表示各个药物IC50值在各组表型样本中分布箱式图,不同颜色表示不同的样本表型


2. *est.ic50.csv

该表格表示各个样本对一种药物的IC50值预测结果,第一列表示样本,第二列表示对应的IC50值


3. output_pvalue.txt

改表格表示药物IC50值在组间的差异显著性p.value值


特别说明:本代码经申请软件著作权,仅转让使用权,不转让所有权

如需代码及示例数据等文件,请扫码聊天框回复 “代码”领取!

写在文末:

如果您近期想做生信方面的文章而苦于没有思路,或者不知道如何来入手生信分析,或者兑具体的某一个图有作图需求,都可以扫码咨询小云,我们有专业的技术团队,生信热点思路设计、生信分析、热点方向生信挖掘等,如有需要,可扫码下方二维码了解详情


尔云间生信代码|基于R包pRRophetic和基因表达矩阵估算样本对药物反应的敏感性软件的评论 (共 条)

分享到微博请遵守国家法律