简单又实用!铁死亡+免疫浸润3+套路,零代码,15分钟教你复现!(附详细操作教程)
今天为大家带来一篇2021年1月发表在BMC Cancer(影响因子: 3.15)上的单基因纯生信文章。本文揭示了在肾透明细胞癌中,铁蛋白吞噬相关基因NCOA4的低表达与肿瘤愈后不佳以及免疫细胞浸润缺陷相关。

期刊简介

酸菜大大高度总结快速入门生信的方法就是,学习生信文章的“文章套路+数据复现”,现在我们就按照这个思路来解读并复现这篇文章吧。
文章套路
1.要素拆解
题目:Low expression of ferritinophagy-related NCOA4 gene in relation to unfavorable outcome and defective immune cells infiltration in clear cell renal carcinoma疾病:肾透明细胞癌 (clear cell renal carcinoma,ccRCC)表型:癌症愈后不佳 + 免疫细胞浸润缺陷数据来源:TCGA (KIRC) + GEO (GSE66271和GSE53757)分析策略:表达差异 + 临床意义 + 交互网络
2.数据解读
简单的来说,本文的思路是,比较ccRCC的癌症组织和正常组织中NCOA4的表达差异(图1,图2),分析NCOA4对于ccRCC的临床意义(表1, 图3, 图4),并进行NCOA4的蛋白互作信息和免疫相关分析(图5, 图6, 表2)。作者采用TCGA数据库和2个GEO数据库的数据相互佐证,使文章可信度更高。详细解读如下▼

数据复现
1.复现工具
(1)仙桃学术生信工具(https://www.xiantao.love)(小贴士:仙桃学术生信工具已经实现TCGA和GEO数据云端化,大家不用担心网络不好数据难下载了,也不用花费大量的时间和精力学习R语言了。在这里只要点击鼠标或者搜索关键词就能快速找到想要的数据,还能迅速实现数据整理、数据清洗、数据分析、可视化出图,生信文章变得so easy啦!)(2)HPA数据库(https://www.proteinatlas.org/)(3)STRING数据库(https://string-db.org/)(4)TIMER数据库(https://cistrome.shinyapps.io/timer/)(5)GEPIA2数据库(http://gepia.cancer-pku.cn/)
2.文章复现
本文一共6张图片和2个表格,让我们逐一实现吧。
表1 基线资料表▼

这个表格基本每篇文章都出现,这里我们只简单介绍。
进入仙桃学术生信工具:https://www.xiantao.love/products【】【高级版】->【立即使用】(注:免费版和基础版都可以进行统计和可视化,由于高级版功能最全,这里选择高级版作为范例)。▼

【分析工具】-> 【基线资料表】-> 【肾透明细胞癌】-> 【NCOA4】->调整参数-> 【确认】,即可得到基线资料表。此时即“保存结果”到云端的历史记录,也可用其他格式保存到电脑中。
▼(具体可参见仙桃学术丨绝了!一分钟零代码无痛搞定临床统计,这个神器简单又高级!)

图1 TCGA数据库中NCOA4在癌症组织和正常组织中的表达(箱状图)▼

看似五颜六色五彩缤纷的图,复现起来难度并不大,让我们一个一个复现每个小图吧~
图1a 泛癌中NCOA4在癌症和正常组织中的表达【表达差异】-> 【非配对样本】-> 【泛癌】 ->【NCOA4】 ->【确认】-> 【保存结果】
▼(小贴士:建议后续需要拼图的图片均选择“保存结果”,这样可将保存的结果直接在“拼图工具”中进行拼图,省去了后面上传图片的步骤,咱们能偷懒就尽量偷懒,把时间花在更必要的地方,对吧~)

图1b ccRCC中NCOA4在癌症和正常组织中的表达
与图1a类似,仅需把疾病类型换成“肾透明细胞癌”即可。▼

图1c ccRCC中NCOA4在不同年龄段的表达▼

【临床意义】-> 【临床相关性】-> 【TCGA-KIBC】-> 【Age】-> 按照年龄段分组,按“+”可添加分组 -> 输入目的分子“NCOA4” -> 【确认】
(注:仙桃学术采用的年龄分组标准是按照中国国家癌症中心统计的患癌年龄分界,和原文4个年龄段的分组不尽相同。每篇文章采用的各分组指标可能都不太一致,只要把标准解释清楚即可。)▼

图1d-j ccRCC中NCOA4在不同性别、TNM分期、病理分期、组织分级、ccRCC分类的表达和图1c类似,只需更改选择分析参数,点击“确认”即可得到想要的图片。
拼图
得到图1的所有图片后,【拼图工具】-> 保存在云端的“所有图片”在左下角 ->拖拽到右边的空白页面-> 调整图片的大小和位置-> 选择“ABC标注”▼

图片接近辅助线的时候有磁吸功能辅助对齐,最下方可添加“参考线”来辅助图片对齐,得到满意的图片后,选择合适的格式“下载”保存,即可得到发表级别的图片了。▼

在下载的图片中已经自动标记好了字母。▼

图2 GEO和HPA数据库中NCOA4在癌症组织和正常组织中的表达(箱状图免疫组化图)▼

图2a GSE66271数据集中NCOA4在癌症组织和正常组织中的表达(小贴士:仙桃学术上线了数据集检索,目前可以检索GEO的数据集,并且还能直接进行一站式的下游分析,咱们又能偷更多的懒啦,撒花撒花~)(GEO数据集详细使用方法参见:重磅丨GEO数据集检索上线,解锁一站式分析的爽感~)
仙桃学术首页:https://www.xiantao.love/ -> 【数据集检索】▼

输入GEO数据集名称“GSE66271”-> 【检索】-> 【选择样本】 -> 勾选所有样本-> 【添加到样本库】-> 【进入我的样本库】▼

这里要对样本进行分组,先按“Title”对组织样本类型进行排序,这样就能正常组织在一起,癌症组织在一起;在正常组织前面打“√”,点击“加入分组1”,同样勾选癌症组织,点击“加入分组2”,把样本库中想要分析的样本分成两个组。添加好分组后,点击“提交分析”;分析完成后,就能下载结果了,我们这里只需要“表达谱CSV”和“结果报告下载”。
▼(小贴士:不同用户每天可以提交分析的次数是不同的,普通版2次/天,基础版5次/天,高级版10次/天。如果需要分析的数据较多,建议升级权限,要不然只能眼巴巴的盼着明天快来~)

(小贴士:这里提供了丰富的结果内容,包括箱式图、PCA图、UMAP图、火山图、热图等,看见一大波美图蹦出来,都能用在文章中,突然觉得自己有点牛气了哇~)
用Excel软件打开“表达谱CSV”,查找目的基因“NCOA4”,复制整行。▼

新建一个Excel表格,选择“粘贴”下的“转置”,把这行数据粘贴到表格的第一列。▼

再回到“表达谱CSV”文件,复制第一行的整行,并粘贴转置到新的Excel表格“GEO肿瘤正常”的第二列。▼


删除第二行,因为接下来要用的信息没有这一行。▼

点击“排序”下的“自定义排序”。▼

在弹出的排序警告中选择“扩展选定区域”。▼

选中“Gene.Symbol”按“确定”,所有数据就会按照“Gene.Symbol”的顺序来排序了。▼

解压“差异分析-自选样本分析报告”,打开“output”中的“样本表格.xlsx”,并用以上方法将所有数据按“GSM”来排序,这样两个数据中的基因符号就是一致的了。▼

将“样本表格.xlsx”中的“group”列和“GSM”列复制粘贴到新Excel表格中,检查一下“Gene.Symbol”列和“GSM”列是不是完全一致的。▼

如果完全一致,就可以把“Gene.Symbol”和“GSM”两列删除了,只留下“NCOA4”和“group”两列,并按照“group”将所有数据排序。▼

将分组2的NCOA4的数据剪切下来。▼

粘贴到第二列,删除其他多余数据,并重命名列名为“Normal”和“Tumor”。▼

保存文件-> 打开仙桃学术的生信工具-> 【基础绘图】-> 【分组比较】-> 上传刚刚保存的文件-> 调整图片参数-> 【确定】-> 【保存结果】
▼(小贴士:以上Excel的操作看似复杂,其实熟练以后一分钟就能搞定,远比从GEO数据库下载数据再进行基因分析效率高得多呢,大胆的来试试吧~)

用同样的方法画出“GSE53757”的图2b,【保存结果】。
图2c The Human Protein Atlas数据库中NCOA4在癌症组织的表达量低于正常组织
进入HPA数据库:https://www.proteinatlas.org/
输入目的基因NCOA4 -> 【Search】▼

选择“Tissue”,即正常组织标本。▼

选择“KIDNEY”▼

找到和文章中类似的图片,点击。▼

打开图片看大图,觉得合适,点鼠标右键“另存图片为”保存图片。▼

用同样的方法, 【PATHOLOGY】-> 【CANCER】-> 【RENAL CANCER】 ▼

找一个和文章类似的图片打开。▼

同样保存图片。▼

回到仙桃生信工具,【基础绘图】-> 【上传图片】-> 【确认】-> 【保存结果】,将2个HPA数据库中下载的图片都上传。▼

【拼图工具】-> 拖拽图片拼图-> 【下载结果】 ▼

图3 NCOA4高低表达组的KM生存分析▼

【临床意义】-> 【KM曲线图】-> 【肾透明细胞癌】-> 键入“NCOA4”->【确认】 ▼
(详见仙桃学术 |一分钟无代码搞定KM生存曲线分析)

同样的方法画出图3b,拼好图就好了。
图4 单因素和多因素分析的森林图▼

首先进行单因素和多因素Cox回归分析【临床意义】-> 【单因素|多因素Cox回归分析】-> 【肾透明细胞癌】-> 调整参数-> 【OS】-> 【确认】 ▼

下载Excel格式的表格,这里单因素和多因素结果是在一起的,我们需要分别保存。▼

选取结果前4列,另存为“单因素分析.xlsx”。▼

选取结果的第1,2,5,6列,另存为“多因素分析.xlsx”。▼

回到仙桃学术
【基础绘图】-> 【森林图】-> 上传数据-> 调整参数-> 【确认】▼

把4个图片拼接起来就是图4了。
图5 NCOA4的PPI蛋白互作网络▼

进入STRING数据库:https://string-db.org/
输入目的基因“NCOA4”-> 【SEARCH】 ▼

可保存图片,也可保存Excel数据,两者结合即完成图5。▼

图5 NCOA4相关免疫细胞浸润图▼

进入TIMER数据库:https://cistrome.shinyapps.io/timer/点击【Gene】 ▼

输入“NCOA4”-> 选择“KIRC”-> 【SUBMIT】-> 下载图片▼

表2 NCOA4与免疫细胞标志物的相关分析▼

仍然在TIMER中选择“KIRC”-> 填入“NCOA4”和需要进行相关分析的分子-> 选择【None】或【Tumor Purity】-> 【确定】-> 获得图片-> 将图中的“cor”值和“P”值填入表格。▼

进入GEPIA2数据库:http://gepia.cancer-pku.cn/【Correlation】-> 填入“NCOA4”和需要进行相关分析的分子->选择“TCGA Tumor”下的“KIRC Tumor”或“TCGA Normal”下的“KIRC Normal”-> 【Plot】 -> 获得图片-> 将图中的“P”值和“R”值填入表格。▼

全文总结
本文完成了“挑”、“联”、“靠”,采用多数据集相互验证,使用多数据库分析,内容较详实,论据较充分。如果能将分子机制或者免疫分析做得更深入,分子机制间的因果关系会更清晰通透。▼
