换个方式蹭微生物的热点,直取5分+纯生信!CTD数据库获取细菌脂多糖(LPS)相关基因~还

提到“微生物”可能大家最先想到的是“肠道菌群”,看到最多的微生物组研究方法就是16S测序/宏基因组测序~ ~
其实“微生物”可不是都要去做测序,还利用别人的测序数据做生信呀,这可比直接做测序的性价比高多了呀!
小云前面也分享过,已有研究表明肿瘤相关微生物群在癌症发展中(包括转移、免疫和耐药性)中起作用,并且微生物与肿瘤的串扰关系深受CNS顶刊的青睐,这就是有大佬背书啊!
再加上本身微生物做生信才刚起步,文章数量比较少,创新性超级高,属于新方向的发文红利期,上车直接就能占位高分文章,你心动了吗?

(不知道如何分析/创新的可以找小云,各种个性化分析思路等你来挑~)
除了直接分析微生物组数据或联合转录组数据分析肿瘤微生物与肿瘤免疫的串扰关系,还有一种迂回策略,也能与将细菌和肿瘤关联起来,那就是可以基于细菌脂多糖(LPS)相关基因进行分析,基因集合来自比较毒物基因组学数据库(CTD)(ps:CTD主要收集了化学物质与健康或疾病相关的暴露和效应关系,并以基因、蛋白、代谢等方面的生物学信息为基础,从分子角度探究毒物对人类健康的影响。小云之前解读过这个数据库,感兴趣可以点击文末链接。没想到还能获取到LPS相关的基因~)。
小云今天要分享的这篇文章就是基于LPS相关基因进行分析,选题新颖,分析思路创新,拿下5分+纯生信文章so easy,一起来学习一下如何换个方式蹭微生物的热点吧~

题目:生物信息学分析表明,细菌脂多糖相关基因参与前列腺癌的侵袭和复发,并与免疫逃逸有关
影响因子:5.738
发表时间:2023年4月

研究思路
本研究的目的是利用生物信息学的方法,基于细菌脂多糖(LPS)相关基因,探讨前列腺微生物在前列腺癌中的作用和机制。利用比较毒物基因组数据库(CTD)寻找细菌LPS相关基因。通过TCGA、GTEx和GEO获取PCa表达谱数据和临床数据。通过维恩图获得差异表达的脂多糖相关hub基因(LPS-related hub gene,LRHG),并利用基因集富集分析(GSEA)对LRHG可能的分子机制进行研究。采用单样本基因集富集分析(ssGSEA)研究恶性肿瘤免疫浸润评分。采用单因素和多因素Cox回归分析,建立预后风险评分模型和nomogram。

图1.流程图
主要研究结果
1. 分析脂多糖相关hub基因(LPS-related hub gene,LRHG)
基于GSE68555数据集分析肿瘤(T)、正常(N)和癌旁(AN)组织两两之间的差异表达基因(图2B-D)(分三组进行两两比较获取DEGs的方法比较新颖,可以学起来~)。然后分别与LPS相关基因取交集(图2E-G),得到LPS相关差异表达基因(LDEGs)。然后将TvsN的LDEGs、ANvsN的LDEGs和TvsAN的LDEGs取交集,得到6个差异表达的LRHG(图2H)。


图2. 基于GSE68555数据集识别差异表达LRHG
2. 差异表达LRHG的富集分析
分别在T和AN中进行Hallmark和KEGG功能富集分析。Hallmark富集分析显示,T中与LRHG相关的功能表型主要集中在肿瘤侵袭、脂质代谢、性激素反应、DNA修复和细胞凋亡方面(图3A)。KEGG富集分析发现与LRHG相关的功能表型集中在许多代谢途径中,包括脂肪酸代谢和花生四烯酸代谢(图3B)。

图3. LRHGs的功能分析
3. LRHG与肿瘤侵袭性表型的关系
作者通过研究LRHG在侵袭性前列腺癌(T3-4)和非侵袭性前列腺癌(T1-2)中的表达,进一步探讨LRHG与肿瘤侵袭的关系(图4A-F)。然后,根据T表达数据进行WGCNA,验证LRHG与肿瘤侵袭的关系。共筛选30个模块,其中青色模块与非侵袭PCa显著相关性(图4J-K)。在青色模块中发现了CD38和MT1X基因。


图4. LRHG与肿瘤侵袭表型
4. LRHG与免疫微环境的关系
采用单样本基因集富集分析(ssGSEA)免疫细胞特异性标记基因。采用Pearson算法检测LRHG与免疫细胞浸润的关系(图5C)。中枢记忆CD4+ T细胞与LRHG显著相关(6/6),其中与CRISP3呈正相关,与其他呈负相关 (图5D)。
(ps:免疫浸润分析可以用小云新开发的零代码生信分析小工具实现,云生信分析工具平台包含超多零代码分析和绘图小工具,上传数据一键出图,感兴趣的小伙伴欢迎来尝试哟,网址:http://www.biocloudservice.com/home.html )。


图5. LRHG与免疫微环境的评价
5. 构建预后风险特征和列线图
基于6个LRHG的表达计算风险评分,根据风险评分中位数,将PCa患者分为低风险评分组和高风险评分组。生存曲线显示低风险组的总PFS明显长于高风险组(图6A)。时间相关的ROC曲线进一步证明了模型的可靠性,1年、3年和5年的AUC值分别为0.73、0.69和0.66(图6B)。
作者结合生化复发、Gleason评分和风险评分构建了nomogram,用来预测PFS(图6C)。根据1年、3年和5年的校正曲线,nomogram可以成功预测PCa患者的PFS(图6D)。


图6. 构建预后风险特征和列线图
总结
这篇文章亮点就是基于细菌脂多糖(LPS)相关基因进行分析,换了个角度蹭微生物与肿瘤的热点,分析思路也很新颖!还可以借鉴作者分组交叉筛选关键基因的方法,后面属于常规的预后模型思路。没有加实验验证也发到了5分+。
目前肿瘤微生物做生信的比较少,所以创新性绝对没的说,轻轻松松拿高分。也可以从LPS相关基因切入,如此创新的分析角度,赶快学起来吧!
如果你还苦恼于生信分析没有思路,或者嫌分析方法太过简单、太过老套,想要创新思路的,或者对微生物等热点方向感兴趣的小伙伴快来联系小云吧!


