泛癌样图,对比7分多的SCI我提升了可视化效果及信息量
原创 光热生物 光热生物 2023-07-28 00:01 发表于安徽 光热生物 画图只画 发表级
这是一篇7分+的SCI,我们今天对它进行复现。其实我以前也写过泛癌相关性的文推文,如
泛癌分析要具有预后模型的思维
,我相信我挖掘的生物学信息及可视化方式还是有优势的。
复现文献标题
Integrated pan-cancer analysis and experimental verification of the roles of tropomyosin 4 in gastric cancer
复现文献全文链接
(https://www.frontiersin.org/articles/10.3389/fimmu.2023.1148056/full)
注意,
该文章作者的mRNA数据来自于UCSC Xena数据库,我的数据是参考iscience上的一篇泛癌文献:Systematic Analysis of the Aberrances and Functional Implications of Ferroptosis in Cancer. 因此 The TCGA cohort data: The mRNA expression data, copy number alteration thresholded data, masked copy number segmentation data, and DNA methylation 450K data were download from
Firehose
(http://gdac.broadinstitute.org). 该网站平台是由 Broad研究所开发的用于TCGA数据挖掘可视化的网络平台,提供基因表达,突变等综合挖掘分析功能,类似于cBioportal。
一、泛癌表达差异:RNA及蛋白水平差异分析、ROC诊断效能分析
、泛癌表达差异:RNA及蛋白水平差异分析、ROC诊断效能分析
注意,差异分析分为三个层面 1.TCGA联合GTEx(箱线图+解剖图) 2.TCGA差异分析
3.TCGA癌与癌旁配对差异分析
ROC诊断效能分析我采用了TCGA与GTEx配对后数据,因为正常样本更多,提高分析的说服力。 蛋白水平的数据来自于CPTAC,我把所有的数据都清洗好了,相对于用网站分析,可视化效果好了不少。
二、泛癌生存:OS/DSS/PFI/DFI logranktest及cox生存分析
热图直观的展示目标基因在肿瘤中是风险还是保护因素,这是我每一次工作量最大的一步,因为代码中根据HR值判断KM分析,这显然是不合适的。 遗憾的是,我不知道在不看KM图的情况下,如何判断高低表达组哪个生存更好,于是我根据平均生存期进行简单判断,然后再一个个手动check。
三、泛癌突变、拷贝数变异、甲基化等分析
四、泛癌相关性:与14种肿瘤状态的zscore打分相关性
可以看出这个基因与转移、EMT、血管生成显著相关,我挑选了EMT(top)进行了分肿瘤可视化
五、泛癌免疫浸润:免疫基因、亚型
六、泛癌免疫浸润:分细胞展示与免疫细胞的相关性
7、药物敏感性:采用3个数据库预测
--往期精选--
往期仍在整理中,以上就是我对这篇泛癌复现的内容,有些很大运算量的计算这次就不展示了,上面7张大Figure已经可以发不错的杂志,再补一张实验大图,冲击8分不是问题。
以前写标书或者阐述为什么做一个基因的时候,我们往往通过看大量的文献,然后去推测某某基因通过某某通路去造成一个现象。现在这种做法已经out了,通过生信我们可以用大数据去预测、说明一个基因的重要性,然后对接湿实验,从而逻辑自洽、有的放矢。
泛癌有个好处,如果自己分析的某一个基因在目标肿瘤中表现不是很好,可以通过泛癌来水工作量,最后挑肿瘤验证的时候选自己关注的肿瘤(你不可能所有的肿瘤全都验证)。
如需生信发表级定制分析,无论是单细胞、空间转录组、还是bulk转录组,无论是预后模型、还是泛癌,欢迎私信。
光热生物,画图只画,发表级!
凝聚青春正能量 放飞SCI微梦想
排 版 | 文 字 | 图 片|策 划 | 责任编辑 | 编 审 |光热生物
合肥光热生物科技有限公司 荣誉出品
生信定制、复现请私信
光热生物
喜欢作者