13分+纯生信只需5张图!DNA甲基化搭上流行病学,原来TCGA+GEO数据库还
看到“13分+纯生信”、“流行病学”,是不是第一时间想到临床公共数据库分析? 小云看到这篇文章的第一眼也以为是个“临床数据库分析”文章,结果非常出乎意料,文章用的是“TCGA + GEO数据库”,真是开了眼,现在这俩经典数据库都能这么玩了吗?下面跟着小云来好好探探底~ 这篇文章
把表观遗传组学中的“DNA甲基化”与流行病学做了创新性联合,依靠“TCGA + GEO数据库”中的甲基化数据、转录组数据与临床流行病学数据,两者搭配仅用纯生信分析就完美拿下了13分+的JAMA子刊!
文章是从种族和年龄这2个社会因素(临床流行病学特征)角度入手分析TNBC患者的DNA甲基化差异,小伙伴们想一想,
换成其他流行病学特征(比如性别、民族、吸烟与否、有无基础病等等)或者其他肿瘤,是不是就能立马复制出一片新文章?并且由于这个思路的高创新性,复现出新文章还是比较容易发高分的,所以感兴趣的小伙伴速速出击啦!
题目:非洲裔美国人和白人女性三阴性乳腺癌的表观遗传学特征
杂志:
JAMA Netw Open
影响因子:IF= 13.7998
发表时间:2023年7月
研究背景
三阴性乳腺癌(TNBC)是最具侵袭性的乳腺癌亚型,在年轻的非裔美国女性中似乎具有不成比例的高发病率和更差的预后。表观遗传修饰,如DNA甲基化(DNAm) 改变与乳腺癌的发生和发展有关。然而,表观遗传学在种族和年龄对TNBC发病机制的作用仍然知之甚少。在这项探索性研究中,作者试图确定年轻的非裔美国女性TNBCs是否存在与分子途径改变相关的表观遗传差异,这可能导致该患者群体中较高的发病率和较低的生存率。
数据来源
研究思路
基于TCGA队列,根据种族和年龄将患者分为4组,使用Wilcoxon检验计算不同组间的差异甲基化位点(DMSs)和差异表达基因,对比不同种族和年龄患者的表观表观遗传差异,并利用富集分析分析表观遗传学改变与通路的关系。最后,作者研究了年轻非裔美国女性中激素、肌肉和增殖途径相关基因的表达。
主要结果
1. 种族间的表观遗传差异
基于TCGA队列,根据种族和年龄将69名患者分为4组:包括16名年轻非裔美国人(年龄< 50岁)、18名老年非裔美国人(年龄≥50岁)、12名年轻白人(年龄< 50岁)和23个老年白人(年龄≥50岁)女性患者。种族间对比显示,非裔美国患者比其他种族和民族的患者患TNBC的比例更高(图1A)。使用Wilcoxon检验计算不同组间的差异甲基化位点(DMSs),在非洲裔美国人和白人TNBC患者中发现了164个DMS(图1D)。使用UMAP技术来可视化基于差异甲基化位点的TNBC样本的分布,结果显示了基于种族区分患者的适度能力(图1B)。随后,作者增加了年龄来进一步分层,并使用FigTree软件版本生成4个组之间基于DNA甲基化的Spearman ρ距离的系统发生树,显示年轻非裔美国人TNBC患者与其他患者群体的统计距离更远(图1C),表明其表观遗传特征与众不同。
图1 不同种族乳腺癌中DNA甲基化的差异
2. 年轻非裔美国患者表观遗传学改变与通路的关系
差异甲基化分析显示,在年轻的非裔美国人和其他人群中鉴定到1115个DMS,其中识别到80个高甲基化区域和1035个低甲基化区域(图2E)。等级聚类和UMAP分析显示,这些区域可以有效地将年轻的非裔美国患者与其他群体区分开(图2A)。然后利用位于非裔美国人年轻患者特异性低甲基化位点附近的基因进行了关联通路富集分析,发现与其他群体相比,年轻的非裔美国患者中激素、肌肉和增殖通路的富集比例明显增加(图2B)。此外,作者整合了基因表达谱并鉴定了2864个DEGs,其中1073个DEGs上调,1791个DEGs下调(图2C),这些 DEGs 中有相当一部分具有 emQTL,表明了表观遗传调控在维持年轻非裔美国人 TNBCs 特异转录组中的重要性(图2F)。与表观遗传学改变类似,激素、肌肉和增殖通路中的基因表达也发生了变化,AR的下调和ESRRA的上调是与激素代谢最相关的DEG之一,参与肌肉细胞代谢的转录因子 FOXC1 的显著上调, MYC 和 NOTCH1 这两个关键增殖介质也显著上调(图 2D)。
图2 年轻非裔美国人的DNA甲基化、基因表达和途径富集分析
3.
非裔美国患者的表观遗传学年龄差异
为了研究在年轻非裔美国女性TNBCs中检测到的表观遗传差异是否与年龄有关,作者比较了年轻和老年非裔美国女性肿瘤的DNAm模式,结果在年轻的非洲裔美国女性中发现了 106 个高甲基化和 2800 个低甲基化基因组区域(图3E)。UMAP分析显示,这些基因组区域的DNAm水平将年轻和年长的非裔美国患者区分开(图3A)。途径富集分析显示,与年长的非裔美国人患者相比,年轻的非裔美国人患者基因组区域附近的低甲基化基因也富集在激素、肌肉和增殖通路中(图 3B)。同样比较两组间的基因表达,结果显示与老年非裔美国人相比,年轻患者的TNBC肿瘤中有405个基因上调,914个基因下调(图3C),其中AR明显下调(图3D),这表明在年轻非裔美国人患者中发现的激素、肌肉和增殖通路的表观遗传学和转录组学改变明显不同于年长非裔美国人患者。
图3 年轻与年长非裔美国女性的DNA甲基化、基因表达和途径富集分析
4.
年轻的非裔美国女性和白人女性之间的表观遗传学差异
接下来,作者又通过比较年轻的非裔美国人和年轻的白人患者的DNAm水平,检测年轻的非裔美国人的TNBC肿瘤中检测到的改变是否与种族有关,分析显示了1515个差异甲基化位点(519个高甲基化和996个低甲基化位点)(图4E)。UMAP分析显示,这些差异甲基化位点可以将年轻的非裔美国人和年轻的白人患者区分开(图3A)。富集分析显示,这些差异甲基化基因组区域与肌肉和增殖途径相关,但与激素通路无关(图 4B)。两组间差异表达分析显示,与年轻白人患者相比,年轻非裔美国人的TNBCs中有2137个基因下调,1625个基因上调(图4C),并且 DEGs涉及肌肉和增殖途径(图 4D)。参与激素反应的基因,如雌激素受体α(ESR1)和AR,在年轻非裔美国女性的TNBC中被显著下调。这一观察结果表明,虽然激素与 TNBC 表观基因组结果的关联在年轻女性中是相似的,不分种族,但在年轻非裔美国女性的 TNBC 中,ER 和 AR 反应等特定通路的活性较低。
图4 年轻非裔美国人与白人的DNA甲基化、基因表达和途径富集分析
5.
年轻非裔美国女性中激素、肌上皮和增殖途径相关基因表达分析
基于前期观察到年轻非裔美国女性TNBCs在激素、肌肉和增殖途径的富集差异,作者进一步分析了以上途径中关键基因的表达情况。结果显示,在TNBC患者中,年轻的非裔美国患者AR水平最低,在激素受体阴性和TNBC肿瘤中,与较低的AR表达水平同时出现的是较高的ESRRA表达水平,特别是在年轻的非裔美国人患者中(图5A)。肌上皮基因通路分析显示,FOXC1 (一种活跃于肌上皮细胞的转录因子)表达量显著上调,而 FOXA1 (在乳腺癌中参与乳腺分化并调节 ER 和 AR 的功能)显著下调(图 5B)。此外,年轻非裔美国人患者的 TNBC 还显示出增殖通路相关基因的上调,如 MYC和 NOTCH1(图5C)。
图5 年轻非裔美国女性中激素、肌上皮和增殖途径相关基因表达分析
小结
5张图的简单纯数据分析就能完成一篇Top级别13分+文章,看完心动了吗吗? 用超创新的思路将“DNA甲基化”与“种族、年龄流行病学特征”完美搭在一起,并且还是用的经典“TCGA+GEO数据库”,有种老树发新芽的感觉!用上这个思路,换个流行病学特征或者换个肿瘤,又是一篇高分文章,心动赶快行动起来吧,越早复现越容易发高分哦!