肿瘤分子分型 | Cell:揭秘东亚地区非吸烟人群肺腺癌的早期分子特征

肿瘤分子分型:通过NGS、蛋白质组等组学技术,对肿瘤进行分子谱的系统描绘,并根据分子特征谱,进行肿瘤的精准分类及精准诊疗研究。
分子分型已成为国家精准医疗战略的重点研究投入方向;也备受CNS顶刊杂志青睐。
为了帮助广大临床研究者了解肿瘤分子分型及诊疗研究的重大前沿进展,我们收集整理了近几年来发表于Cell、Nature、Cancer Cell等顶刊上的,基于蛋白质组及蛋白基因组的肿瘤分子分型相关研究论文。
【肿瘤分子分型专辑】为大家精细解读重磅研究与进展。

Proteogenomics of Non-SMoking Lung Cancer in East Asia Delineates Molecular Signatures of Pathogenesis and Progression
【癌种】:肺癌
【细分癌种】:非吸烟-肺腺癌
【地域】:中国台湾
【通讯单位】:中央研究院化学研究所(中国台湾,台北)
【发表时间】:2020年
【涉及组学】:全外显子、转录组、蛋白组、磷酸化修饰组
【文献出处】:DOI: https://doi.org/10.1016/j.cell.2020.06.012
主要成果:
1. 东亚地区第一个非吸烟肺腺癌的深层蛋白质组学景观
2. 确定了年龄、性别相关的内源性和环境致癌物诱变过程
3. 蛋白质组信息分类可在早期阶段区分出临床特征
4. 蛋白质网络确定肿瘤发生的重要特征、生物标志物和用药靶点
疾病背景:
【流行病学】:肺癌是全球最常见的恶性肿瘤和癌症死亡的主要原因,其发病主要归因于直接的烟草暴露。然而在全球,从未吸烟者的发病率仍然是一个严重的健康问题,尤其是在东亚女性当中。在英国大约10%-15%的肺癌患者会出现在从不吸烟的人群中;但在东亚,非吸烟人群中肺癌的发病比例会增加(尤其是女性)。在台湾人群中,从不吸烟患者占主导地位(53%),特别是女性(93%)。此外,早期发病是东亚肺腺癌(LUAD)的明显特征,特别是在从不吸烟者中。全球约有20%的I期患者在手术切除后仍复发。
【主要驱动基因】:EGFR
研究设计:
【主要样本】:LUAD病人经手术切除的癌 VS 癌旁组织
【样本状态】:新鲜冰冻
【样本数量】:103 paired
【治疗干预】:手术前未经放化疗等干预
【主要研究路线与内容】:
1. 单组学分析:
组别:癌 VS 癌旁,42% 男性、58%女性、 83%非吸烟者
WES:基因拷贝数、基因突变;与TCGA队列比较
TMT蛋白组 & MRM靶向蛋白组:蛋白鉴定与定量数量;蛋白组与mRNA相关性分析
TMT磷酸化蛋白组:修饰蛋白、修饰肽段鉴定与定量数量
2. 整合分析:
肿瘤的分子表达特征,及肿瘤发展过程中的动态演进:
1.mRNA-蛋白水平的表达与关联
2.NSCLC相关通路的蛋白-磷酸化调控分析
3.肿瘤进展的分子动态
蛋白基因组分析:基因突变与mRNA/蛋白/磷酸化的表达关联
1. 蛋白水平上的序列突变
2. EGFR突变与MAPK活性
3. TP53突变相关分析
内外致突变因素对突变谱及蛋白水平的影响:
1. 内外因素相关的突变特征分析
2. APOBEC特征性突变分析
3. APOBEC特征性突变在蛋白与磷酸化层面的传递
4. 内外环境因素与肿瘤新生抗原负荷
5. 受环境因素诱变的染色体区域分布
6. 致癌标志物富集对细胞功能的影响
分子分型:
1. 基于蛋白质组的分子分型与分子特征
2. 亚型1的疾病进程细分
3. 亚型的EGFR-L858R特征与生存期
4. 亚型相关的潜在标志物与药靶
基于蛋白质网络特征,识别蛋白质组亚型的候选标志物和药物靶点:
1. 蛋白质网络构建
2. 亚型的网络特征
3. 基于网络的潜在标志物与药靶
主要研究结果:
一、多种组学检测结果的统计

二、基因突变情况
1. 大多数肺癌肿瘤有EGFR突变(85%),其次是TP53突变(33%)和RBM10(20%)突变。与TCGA不同,C> T转化是台湾(以下简称TW)人群中最常见的。

B. The percentages of SNVs in the TCGA cohort
2.值得注意的是,RBM10和EGFR-L858R突变在女性中较频繁,而KRAS和APC则经常在男性中突变。KRAS和ATM是吸烟历史患者的显著突变。RBM10突变在老年女性中更为普遍。与其他队列比较,EGFR和RBM10以及两个细胞周期相关基因(CDC27和RB1)在本队列中具有更高的突变频率,而TP53、KRAS和KEAP1的突变在其他研究中更为普遍。

(D) Clustergrams of mutually exclusive mutated genes.
(E) Correlation plot of the mutation frequencies observed in the Taiwan cohort compared to previously published cohorts.
(F) Bar plots of mutational frequencies for genes with significant difference beTWeen the Taiwan cohort and previously published LUAD studies.
结论:鉴定了东亚人群非吸烟肺腺癌患者的主要突变基因及其特征,与先前的研究(主要包括吸烟者)存在显著差异。在不吸烟的人群中,排名最高的基因的突变频率也明显不同,这表明TW和TCGA LUAD人群之间的驱动因素显著不相同。
三、肿瘤的转录、蛋白、磷酸化的分子表达特征,及肿瘤发展过程中的动态演进
1. 转录-蛋白相关性分析:
(1)整体样本水平上:主成分分析(PCA)显示,在RNA和蛋白质水平,肿瘤和正常组织均清晰分离;与正常组织相比,肿瘤的变异更大;

(2)表达相关性分析表明:mRNA与蛋白在样本维度的Spearman相关性中值为0.31,基因表达维度的Spearman相关性中值为0.14;仅22%的蛋白质显示与同源RNA的显著正相关;
(3)通路功能方面:蛋白与mRNA具有一定的通路相关性,但在基础细胞功能方面的相关性较低;DNA复制、糖酵解、谷胱甘肽代谢和免疫相关途径在转录水平上调;而DNA修复、蛋白质加工和运输途径以及细胞粘附相关途径的下调,在蛋白质水平上更为明显。

(E) KEGG pathway enrichment analysis using the median log2T/N values of proteins (Benj. Hoch. FDR < 0.05)
2.NSCLC相关通路的蛋白-磷酸化调控分析:大多数蛋白质及其磷酸化位点受到差异调控,一些蛋白的表达水平下调,但磷酸化修饰水平却上调。Raf/MEK/ERK轴上的磷酸化位点在患者间表现出很高的变异性,这表明MAPK通路的调节因患者而异。

3. 肿瘤进展的分子动态
为了研究肿瘤进展的动态过程,按照将患者分为三个不同的分期组:IA期、IB期和RII期,并使用方差分析在蛋白质和RNA水平进行差异表达分析 ,并采用k-均值聚类进一步将差异表达的蛋白质和RNA分成两个簇 。对阶段性上调或下调的簇进行GO功能富集分析发现:在细胞间通讯、信号和质膜中起作用的蛋白质,如整合素、G蛋白偶联受体、离子通道、获得性免疫和抗原递呈,在进展过程中呈现总体负调控趋势;糖酵解、DNA复制、应激反应以及蛋白质加工周转和运输过程中的蛋白质在后期上调;另外DNA复制和修复过程的上调以及纤毛组装基因的丢失在RNA水平上最为突出。

(I and J) Scatterplot of significantly enriched UniProt keyword and Gene Ontology annotations with up- and downregulation trend based on their median abundance per pathology stage at (I) protein level and (J) RNA level
结论:细胞向更晚期癌症阶段的转化的特征是:复制过程中RNA到蛋白质的整体活化,以及参与质膜信号传导和通讯的蛋白质组学成分的负调控。此外,蛋白质组学和RNA特征代表了肿瘤发展过程中发生的生物过程重塑特点,多组学整合对于识别肿瘤进展过程中分子稳态失调非常重要性。
四、LUAD的蛋白基因组分析:基因突变与mRNA/蛋白/磷酸化的表达关联:
1. 在蛋白水平上的突变:鉴定到319个蛋白的337个突变的肽段。
(1)其中驱动基因15个,包括:TP53BP1D358E、RNF213E1272Q、D1331G和KRASG12C等;
(2)RBM10的截短突变对RNA和蛋白质水平有负调控作用,而KRAS,LABM1和PIK3CA错义突变仅与蛋白表达增加相关。

2.EGFR突变与MAPK活性变化:(1)EGFR 的突变 (L858R and Del19)对蛋白表达水平的作用不一,但与蛋白磷酸化增加有关。EGFRpY1197与MAP2K2-pT394、MAPK3-pT198/pT202表达一致,进而与pMAPK1及其他下游信号通路相关磷酸化蛋白水平有关。
(2)即使在EGFR野生型中,也存在一定程度的MAPK活性。
(3)在EGFR野生型病例中,KRAS突变者表现出高MAPK活性。
(4)在肿瘤转移期,MAPK表现出低活性。

(C) Scatterplots of co-phosphorylation within the EGFR-MEK-ERK axis (Spearman’s rank, p < 0.05).
(D) Ranked co-phosphorylation signature of the MAPK cascade aligned with clinical features.
3. TP53突变:TP53基因座是eQTL和pQTL热点区域。(1)TP53突变与细胞周期基因有强正相关,其中包括来自微染色体维持复合物(MCM)和TOP2A的6个亚基,提示TP53-TOP2A可能具有协同致死效应;(2)TP53突变与KIT致癌基因负相关;(3)TP53与参与DNA缩合和重组的蛋白质和DNA损伤蛋白的较高磷酸化呈正相关。

(E) TWo-dimensinal plot representing eQTLs and pQTLs with variants (x axis) and associated genes (y axis). The size of the points is increasing with the confidence of the association

(G) Scatterplot of the MAPK pathway score and KIT relative abundance across patients
(H) Heatmap of phosphosites related to DNA condensation, recombination, and DNA damage response proteins positively associated with TP53 mutations.
结论:进一步揭示了基因组特征如何协调LUAD中的蛋白质组和磷酸蛋白质组。研究结果显示MAPK级联内的蛋白质磷酸化协同作用由EGFR和KRAS突变正调控,并且与肿瘤分期和TP53突变负相关。TP53突变与细胞周期基因、参与DNA拓扑调控和DNA损伤反应的磷酸蛋白呈正相关,这与已知的合成致死相互作用是一致的。这些发现可能为后续相关研究及药物干预策略提供依据。
五、内外致突变因素对突变谱及蛋白水平的影响:
1. 突变特征分析:NMF(非负矩阵)法分析突变的三核苷酸序列基序的频率,确认了5个突变谱,并采用余弦相似性分析揭示内源性和外源性诱变剂在突变中的作用。
(1)与TW队列最匹配的突变特征是:5-甲基胞嘧啶的脱氨、APOBEC胞嘧啶脱氨酶、烟草诱变剂暴露,以及二苯并[a,j]吖啶(DBAC);此外还映射到烷基化剂二甲基肼(DMH),模拟太阳辐射(SSR)以及1,8-二硝基芘(1,8-DNP)诱变的特征;
(2)TCGA队列的三个突变谱匹配到了APOBEC和烟草COSMIC特征,以及二苯并蒽(DBA)、DMH和SSR的特征
(3)与TCGA队列相比,亚硝胺和硝基多环芳烃的特征仅在TW LUAD中显著,这与亚洲地区这两类致癌物的高暴露的流行病学证据一致。

2. APOBEC特征性突变分析
C>T转换的高比例与APOBEC突变特征有关,因此该研究重点关注了APOBEC特征性突变,并根据富集度评分将队列分为:高APOBEC突变特征组与低APOBEC突变特征组。
(1)44%的患者有较高的APOBEC突变特征,且女性(57%)高于男性(25%);

(2)高APOBEC突变特征和野生型 EGFR的女性患者比低APOBEC突变标签和EGFR激活突变的女性患者更年轻,平均年龄分别为52.9岁和66.3岁。具体而言:高APOBEC突变标签主要集中在74%的年轻女性(<60岁)和所有没有EGFR突变的女性中,而在男性患者中没有观察到类似的趋势;

(3)TCGA队列的生存分析表明,在所有患者、所有女性和没有EGFR激活突变的女性中,低APOBEC突变标签与总生存期延长有关。
(4)高APOBEC突变标签与接受联合免疫治疗(PD-1和CTLA-4)的晚期NSCLC队列的无进展生存期略有延长有关。同时与WT患者相比,EGFR或ALK突变患者的反应较差,这表明EGFR-WT患者是更好的免疫治疗对象。

3. APOBEC特征性突变在蛋白水平与磷酸化水平的传递
(1)蛋白质水平突变:在至少30%的患者中发现了APOBEC突变有关的APOBEC3家族的6个成员,且在女性患者中上调的更为显著,其中APOBEC3F和APOBEC3G的性别差异最显著(p<0.05);

(B) Expression comparison of APOBEC family at mRNA and protein levels in female and male patients (Welch’s t-test and pairwise comparison, p < 0.05)
(2)通路相关分析:在高APOBEC突变标签的女性患者的肿瘤中,参与DNA修复和复制的蛋白更为丰富,且这些蛋白的相对log2T/N值与APOBEC3成员呈正相关,特别是与3B、3D、3F和3G;

(3)激酶相关分析:激酶富集分析确定AurB、CK2、CDK1和CDK2是高APOBEC突变标签女性患者组中最高激活的激酶,为具有高APOBEC突变标签的女性患者提供了可行的干预候选方案。

篇幅较长,详细请见下一篇~