轻松5分+!淋巴结转移预后模型构建+干湿结合+机器学习,关联免疫浸润,思路简单易复现
预后模型那么多,为什么还能发5分+的文章?重点就在于要找到目标疾病的research gap!当然,布小谷也知道gap不是那么容易发现的,不然大家也不会为了发文章头秃。
那么不妨将几个点结合起来!布小谷今天就为大家带来一篇这样的文章。
癌症淋巴结转移往往有很差的预后,但很巧的是,这篇文章选择的癌症正好缺乏这方面的论文。布小谷真的好羡慕!希望小伙伴们也能有这样的好运气!
此外,作者采用机器学习算法不仅筛选了关键基因,还筛选了关键的免疫细胞,并将两者关联以探究相互影响。在生信分析的基础上这篇文章还进行了体外验证实验,内容丰富,是发高分文章的好模板哦~快和布小谷一起学习借鉴起来吧。

l 题目:通过生物信息学分析和实验验证鉴定与甲状腺乳头状癌淋巴转移相关的关键免疫基因
l 杂志:Front Oncol
l 影响因子:IF=5.738
l 发表时间:2023年5月
研究背景
甲状腺癌(THCA)是女性内分泌系统的常见肿瘤,而乳头状甲状腺癌 (PTC)是其常见的一种。虽然PTC的检出率逐年上升,但PTC淋巴结转移的发生率仍居高不下,这是肿瘤进展的重要指标和肿瘤分期恶化的标志。因此,寻找预测PTC早期转移的生物标志物以改善PTC并发淋巴结转移患者预后是很有必要的。
数据来源

研究思路
进行WGCNA分析以从TCGA数据库中鉴定与PTC淋巴转移密切相关的基因。从ImmPort数据库获得有关免疫相关基因 (IRG) 的信息。将两类基因取交集获得交叉基因,使用R包clusterProfiler 进行GO和KEGG分析。将交叉基因导入String数据库以构建蛋白质-蛋白质相互作用 (PPI) 网络。随后使用 Cytoscape获得交叉基因的PPI网络中的关键基因。利用LASSO回归和随机森林 (RF) 模型筛选出hub基因并进行验证以评估模型精度。使用R包 CIBERSORT,将表达谱数据用于免疫浸润分析。通过免疫组织化学收集和评估临床样本,以检测hub基因的表达。

主要结果
1. 通过WGCNA分析鉴定与淋巴转移相关的基因
使用WGCNA分析来自TCGA数据库的数据,得到基于相邻值差异的层次聚类分析的基因聚类树(图1B)。评估得到的12个模块间的关联,发现黑色模块与淋巴转移最密切相关,并含有1271个基因(图2)。


2. 获得IRG并构建PPI网络
将黑色模块与IRG取交集获得122个共同基因,导入String数据库以将其映射为一个PPI网络(图3A)。利用cytoHubba应用程序中的MCC 算法,得到前10个常见的IRG,包括CXCL8、CXCL2、PTGS2和ICAM1(图3B)。


3. GO和KEGG分析
对122个常见基因进行了GO和KEGG分析,以解释与免疫基因相关的淋巴转移的分子机制。GO分析显示淋巴转移与趋化性、信号受体复合物、受体-配体活性和其他生物学功能的调节在功能上相关(图4A-C)。KEGG分析显示细胞因子-细胞因子受体相互作用和自然杀伤 (NK) 介导的细胞毒性参与淋巴转移(图4D)。




4. 预后模型的建立与评价
根据LASSO回归和RF模型的结果筛选出3个hub基因,分别是MET、ICAM1和PTGS2。基于3个hub基因构建PTC淋巴转移预测模型,并绘制诊断列线图、校准曲线、临床决策曲线和基于风险评分的ROC曲线以评估预测模型(图5A-D)。校准曲线与相应的参考线没有显著偏差(图5B);临床决策曲线表明,在广泛的阈值范围内观察到较高的总体净收益(图5C);ROC曲线的AUC达到0.84(图5D)。此外,经过10倍和200次交叉验证后模型的平均AUC也达到0.84,这些结果表示这个模型对淋巴结转移具有良好的预测能力。


5. hub基因与关键免疫细胞的关联
使用R包CIBERSORT进行分析后,评估N0和N1样本中22种免疫细胞的百分比。使用t检验,结果表明有7种免疫细胞的淋巴转移和非转移之间存在显著差异(图6)。而利用LASSO回归对N0和N1样本的免疫细胞筛选,获得了10个与淋巴结转移相关的免疫细胞(图7A, B)。
将两者取交集获得7种免疫细胞,包括活化的NK细胞、单核细胞、巨噬细胞M0和M1、静息和活化的树突细胞以及嗜酸性粒细胞,它们被确定为淋巴转移的标志性免疫细胞(图7C)。相关性热图表明所有hub基因都与7种标志性免疫细胞呈正相关(图7E)。




6. hub基因的表达差异和生存分析
在KM plotter数据库中检索与甲状腺癌患者生存时间相关的3个hub基因的表达,结果表明淋巴结转移组MET和ICAM1的表达明显高于非转移组和正常组(P<0.001)。PTGS2在淋巴结转移组的表达明显高于非转移组(P<0.01) (图8A-C)。生存分析的结果显示MET的高表达与PTC患者死亡风险增加密切相关(图8D)。然而,ICAM1和PTGS2的高表达组和低表达组之间的存活时间没有显著差异(图8E, F)。



7. 免疫组织化学分析
为了在实验水平上进行验证,通过对淋巴结转移组和非转移组的病理切片进行免疫组织化学染色,分析了PTGS2、MET和ICAM1的表达。IHC染色结果显示,淋巴结转移组MET和ICAM1表达高于淋巴结未转移组。而PTGS2的表达在两组之间没有显着差异(图9A-C)。根据Spearman相关性分析,PTC淋巴结转移组ICAM1的表达与MET的表达呈正相关。

文章小结
这篇文章的亮点在于采用机器学习算法分别筛选了关键基因和关键的免疫细胞,并且创新性地构建了相关疾病的预测模型,弥补了这方面论文的不足。相较于纯生信分析,这里加上体外表达验证实验,稳扎稳打的验证十分有效地增加了文章的可信度。思路创新+干湿结合=王炸!小伙伴们不妨也试一下这个思路发一篇高分文章!