欢迎光临散文网 会员登陆 & 注册

脂质代谢+非编码RNA+干湿结合,多种机器学习算法筛选预后基因

2023-06-17 19:00 作者:生信鸟  | 我要投稿

生信文章好发不好发,关键看研究创新性有多高。常规思路,过时的研究对象,好发才怪呢。。。。

新颖的研究思路,巧妙的研究设计,前沿的研究方向,这些都是优秀文章的加持项。

嗯?这些你都知道,但不知道怎么去找呢?还没有参考思路?

快来关注生信鸟公众号吧!!这里可以满足你的所有发文章的要求,帮你实现快速发文的梦想,快来上车吧!!!

布小谷就拿今天这篇4.3分+的文章为例,给大家简单分析一下生信发文的思路和研究设计。本文将脂质代谢和microRNA结合起来研究miRNAs在前列腺癌中的预后价值,采用多种机器学习算法筛选有预后价值的miRNAs,另外采用干湿结合的研究方法,使故事更加真实。看着每张图都很简单,连起来后整个故事非常完整,逻辑清晰。

题目:脂质代谢相关miRNAs在前列腺癌症中的潜在诊断作用

杂志:Lipids Health Dis.

影响因子:IF=4.321

发表时间:2023年3月

研究背景

前列腺癌症(PCa)是世界上第二大男性实体肿瘤,其死亡率大大增加。脂质代谢对肿瘤生长的影响已经有研究,但脂质代谢紊乱与前列腺癌相关的机制在很大程度上仍然难以捉摸。

数据来源

研究思路

从TCGA-PRAD中筛选差异表达基因并与脂质代谢相关基因取交集,得到差异表达的脂质代谢相关基因(DE-LMRGs)。再从TCGA-PRAD中筛选差异表达miRNAs并与DE-LMRGs进行相关性分析得到差异表达的脂质代谢相关miRNAs(DE-LMRMs),然后与在GSE45604表达的miRNAs取交集得到稳定表达的DE-LMRMs。接着应用最小绝对收缩和选择算子(LASSO)、极限梯度增强(XGBoost)和支持向量机递归特征消除(SVM-RFE)算法来选择特征miRNAs,并构建脂质代谢相关诊断模型。随后使用qRT-PCR验证所选DE-LMRMs在前列腺癌和良性前列腺增生标本中的表达水平。此外,构建了转录因子-miRNA-mRNA网络。

主要结果

1. 前列腺癌中DE-LMRGs的鉴定

从TCGA-PRAD中鉴定出519个DEGs,包括157个上调和362个下调的mRNA(图1A)。与脂质代谢相关基因取交集得DE-LMRGs(图1C)。

图1 前列腺癌中DE-LMRGs的鉴定

2. 前列腺癌中DE-LMRMs的鉴定

从TCGA-PRAD中鉴定出56个DEMs,包括48个上调和8个下调的miRNA(图2A)。随后,以 R < -0.3和P < 0.05为标准对DEMs和DE-LMRGs进行相关性分析,得到47个与脂质代谢密切相关的DE-LMRMs,再与在GSE45604表达的miRNAs取交集得27个稳定表达的miRNA用于进一步分析(图2D) 

图2 前列腺癌中DE-LMRMs的鉴定

3. 前列腺癌关键诊断miRNA的鉴定和验证

为了筛选关键的诊断miRNA,首先进行ROC分析以初步缩小诊断miRNA的范围,得到25个miRNAs(图3A)。随后,通过LASSO回归、SVM-RFE算法、和XGBoost算法筛选并取交集到7个关键的诊断miRNA(图3G)。为了验证诊断特征的预测能力,对训练集和验证集绘制基于7个关键诊断miRNA的ROC曲线,结果显示AUC值分别为0.99和1(图3H和I)。具体而言,每个关键的诊断miRNAs在两个数据集之间也表现出优异的区分能力(图3J和K)。qRT-PCR结果显示,7种关键诊断miRNA在前列腺癌组织中的表达水平与前列腺增生组织相比存在显著差异(图4)。

图3 前列腺癌关键诊断miRNA的鉴定和验证

图4 前列腺癌和前列腺增生组织中7种关键诊断miRNAs的表达水平

4. TF-miRNA-mRNA网络与预后分析

通过StarBase和miRNET数据库预测关键miRNAs靶基因,并分别与上调和下调DE-LMRGs取交集,得到76个下调和2个上调的靶基因,将其用于构建miRNA-mRNA调控网络(图5A-B和D)。类似地,预测到miR-200c-3p的两个TF结合位点,即GATA3和SANI2(图5E-F)。随后整合miRNA-TF(图5F)和miRNA-mRNA网络(图5D)得到25个靶向mRNA以及miR-200c-3p的2个TF结合位点来构建TF-miRNA-mRNA网络(图5G)。

图5 TF-miRNA-mRNA调控网络的建立

文章小结

这篇文章将脂质代谢相关基因和非编码RNA联系起来筛选预后靶标,设计巧妙,采用干湿结合的研究方法使研究结构完整。这篇文章采用多种机器学习算法(LASSO、SVM-RFE和XGBoost)筛选预后基因,不仅使预后价值更加可靠,也减少了实验验证的工作量。整篇文章思路比较新颖,验证比较充分,发4分+也是手拿把掐。对这研究思路感兴趣的朋友,抓紧行动起来吧!

布小谷之声

如果您的时间和精力有限或者缺乏相关经验,并且对生信分析和思路设计有所需要的话,“生信鸟”非常乐意为您提供如下服务:免费思路评估、付费生信分析和方案设计以及实验项目实施等,有意向的小伙伴欢迎咨询布小谷哦! 

扫码咨询布小谷吧


脂质代谢+非编码RNA+干湿结合,多种机器学习算法筛选预后基因的评论 (共 条)

分享到微博请遵守国家法律