HIST3H2A 是胰腺癌的潜在生物标志物 基于 TCGA 数据的研究

摘要:
组蛋白 H2A 家族证明有很多变异与癌症发展相关。HIST3H2A 与胰腺癌之间的联系以前从未被注意到。我们的研究表明,HIST3H2A通过JAK STAT通路影响胰腺肿瘤免疫过程和患者预后,有望成为胰腺癌的生物标志物。
从癌症基因组图谱数据库(TCGA)和基因型组织表达(GETx)项目下载胰腺癌患者的基因表达谱和临床数据。使用R软件(Rx64 3.6.0)进行分析。基因集富集分析 (GSEA) 用于分析胰腺癌中 HIST3H2A 相关的信号通路。CIBERSORT 用于根据批量表达数据估计 22 种免疫细胞组分的组成模式。
HIST3H2A 在胰腺癌组织中的表达高于正常胰腺组织。Kaplan-Meier 生存分析表明,HIST3H2A 表达水平影响胰腺癌患者的预后。单变量 Cox 分析和多变量 Cox 分析表明 HIST3H2A 表达是胰腺癌的预后因素。Cor表达分析表明,与HIST3H2A表达趋势呈正相关的基因为DCST1-AS1、HIST1H2BD、SLC12A9-AS1。GSEA 显示 JAK-STAT 信号通路在 HIST3H2A 高表达表型中富集,而 IgA 产生、哮喘和趋化因子信号通路的肠道网络在 HIST3H2A 低表达表型中富集。此外,结果显示 CD8 T 细胞 ( P = .007)、活化的 CD4 记忆 T 细胞 ( P = .001) 和单核细胞 ( P = .002) 在低 HIST3H2A 表达组中更丰富。
HIST3H2A 是一种很有前途的预测胰腺癌预后的生物标志物,它可能是一个潜在的治疗靶点。HIST3H2A 可能通过调节 JAK-STAT 通路来调节胰腺癌中肿瘤免疫的进展。此外,HIST3H2A在胰腺癌中的作用可能与DCST1-AS1、HIST1H2B、SLC12A9-AS1有关。然而,需要更多的研究来验证研究结果。
关键词:HIST3H2A,JAK-STAT通路,胰腺癌,预后,治疗靶点
简介
胰腺癌是世界上最致命的恶性肿瘤之一。根据 GLOBOCAN 2012 年的估计,胰腺癌每年导致超过 331,000 人死亡,占所有死亡人数的 4.0%,使其成为男女癌症死亡的第 7 大主要原因。患胰腺癌的风险随着年龄的增长而增加,随着普通人群的不断老龄化,这种发病率趋势预计会增加。胰腺癌的估计 5 年生存率低于约 5%。[ 1 - 3 ]目前,胰腺癌的主要治疗方法是手术。由于缺乏可行的筛查方法和早期的特异性症状,大多数患者在晚期发现并失去了手术治疗的机会。不幸的是,转移性胰腺癌的有效化疗选择很少。此外,其标准治疗药物吉西他滨并未独立评估或与其他化疗药物联合评估对晚期疾病患者的生存率产生积极影响。因此,迫切需要我们进一步深入了解促癌基因和分子因素,寻找有效的生物标志物,提高胰腺癌的早期诊断率、治疗率和预测预后,从而大大延长胰腺癌患者的生命。 .[ 3 ]
核小体颗粒是真核细胞中染色质纤维的基本单位,其核心由组蛋白H2A、H2B、H3和H4组成。此外,H3 和 H4 中的 2 个单元形成一个被 H2A-H2B 的 2 个二聚体包围的四聚体。[ 4 ]细胞可以通过DNA甲基化、组蛋白变异、组蛋白共价修饰向染色质发送动态信号,从而调节基因转录、DNA修复,维持基因组完整性。[ 5 – 8 ]组蛋白有多种翻译形式,包括乙酰化、甲基化、泛素化和磷酸化。这些修饰调节许多信号通路、转录激活或抑制,[ 9 ]DNA 修复,染色体动力学。[ 10 ]在真核生物中,H2A、H2B 和 H3 已被证明具有变体,其中一些在真核生物中很常见、高度保守,其中一些在真核生物中特别进化。[ 11 ]目前,一些研究已将 H2A 的某些变体与癌症联系起来。H2A.Z 被认为主要是促肿瘤,而 macroH2A 和 H2A.X 被认为是肿瘤抑制因子。[ 12 ] H2A.Z 过度表达的频率与黑色素瘤、[ 13 ]肝细胞癌、[ 14 ]和乳腺癌的不良生存率有关。[ 15 ]MacroH2A 已被证明在膀胱癌、黑色素瘤、四核肿瘤、[ 16 ]和乳腺癌中具有肿瘤抑制作用。[ 11 ] H2A.X 基因的缺失和突变可导致严重的 DNA 损伤,并且与散发性乳腺癌、[ 17 ]头颈部鳞状细胞癌、[ 18 ]神经母细胞瘤、[ 19 ]和造血系统恶性肿瘤如慢性淋巴细胞白血病。[ 11 , 20 ]s139 磷酸化 H2A.X 是一种很有前途的癌症风险评估、早期检测、预后和治疗评估的标志物,可以定量检测细胞和组织中的 DNA 损伤。s139 磷酸化的 H2A.X 与肺癌、乳腺癌、肺癌、卵巢癌和结直肠癌有关。[ 21 ]磷酸化组蛋白 H2AX 现在被认为是癌前肝癌的生物标志物。[ 22 ] 尽管近年来关于经典H2A家族的组蛋白变异体和共价修饰与癌症之间的关系的研究较多,但由于经典H2A序列的变异较小,其与癌症的关系研究较少,且其功能意义不大。 H2A 目前还不清楚。
在这项工作中,我们试图揭示 HIST3H2A 在典型家族中在胰腺癌中表达的重要性。HIST3H2A的表达可能影响胰腺癌肿瘤免疫过程,从而影响胰腺癌患者的预后。我们比较了肿瘤组织和正常组织之间的 HIST3H2A mRNA 表达并将它们与临床参数相关联,然后我们分析了这些数据与患者总生存期 (OS) 和无病生存期 (DFS) 之间的相关性。此外,我们进行了 GSEA 分析和共表达分析,以探索该基因在胰腺癌中的特定分子机制。最后,我们应用一种反卷积算法来揭示胰腺癌中 22 个免疫细胞亚群的比例。
结果
患者临床参数
胰腺癌患者的临床资料来自TCGA数据库,包括年龄、性别、临床分期、分类、生命状态等(表 1)。

Clinicopathological characteristics of patient samples and expression of HIST3H2A in pancreatic cancer.
HIST3H2A 在胰腺癌中高表达
通过 Wilcoxon 秩和检验,我们比较了 178 个胰腺癌组织和 207 个正常组织。结果表明,HIST3H2A 在胰腺组织中的表达显着升高(图 3)。(图。1;1; P < .001)。

散点图显示了正常和肿瘤样本之间 HIST3H2A 表达的差异。
胰腺癌患者HIST3H2A表达与临床参数的相关性
我们通过R软件(Rx64 3.6.0)分析了HisT3H2A与患者临床参数的关系。Logistic回归分析结果表明,胰腺癌患者HIST3H2A表达升高与这些临床参数(年龄、性别、临床分期、T分期、N分期和M分期、生命状态)无关(表(表22)。

Correlation between HIST2H2A expression and clinicopathologic characteristics of pancreatic cancer patients.
HIST3H2A 可能是预测胰腺癌预后的独立危险因素
我们分析了 HIST3H2A 在胰腺癌预后中的相对风险。所有胰腺癌患者均按照 HIST3H2A 表达值中位数(HIST3H2A 高表达组和 HIST3H2A 低表达组)进行分类。我们排除了没有完整临床数据的患者。Kaplan-Meier 生存分析没有意义(图 1)。(图 2A)。2一个)。单变量 Cox 回归分析表明,与 HIST3H2A 低表达的患者相比,HIST3H2A 的高表达与胰腺癌患者的死亡风险显着增加相关(P < .05)(表(表3)。3)。一些临床参数,如年龄 ( P < .05)、N 分期 ( P < .05) 也与胰腺癌的预后相关(表(表 4)。4)。多因素 Cox 回归分析表明,HIST3H2A 可能是预测疾病预后的独立危险因素(P < .05),年龄(P < .05)、组织学分级(P < .05)、N 分类(P < 0.05)分别为包括

(A) 生存分析表明,HIST3H2A-low 的 PC 比 HIST3H2A-high 的 PC 预后更差;(B) HIST3H2A 表达作为肿瘤存活预测因子的 Cox 回归分析。
。


HIST3H2A相关胰腺基因组表达的Cor表达分析
为了研究与胰腺癌中 HIST3H2A 表达相关的基因,我们进行了 cor 表达分析。结果显示,与 HIST3H2A 表达趋势呈正相关的基因为 DCST1-AS1(P < .001)(图 1)。(图 3A),3A),HIST1H2BD(P < .001)(图。(图 3B),3B), SLC12A9-AS1 ( P < .001) (图.(图33C)。

Cor表达分析HIST3H2A相关胰腺基因组的表达。
JAK -STAT 信号通路和肠道免疫网络受 HIST3H2A 调控
为了进一步研究 HIST3H2A 在胰腺癌中的调控途径,我们进行了 GSEA 分析(表 (表4)4) 在已发表的 TCGA 胰腺癌数据库中。我们发现 HIST3H2A 的高表达与 JAK-STAT 信号通路呈正相关(图 3)。(图 4A),4A),而用于产生 IgA 的肠道免疫网络(图 1)。 (图 4B),4B)、哮喘(图。 (图 4C),4C)、趋化因子信号通路(图1)。 (图 4D),4D)、甘氨酸丝氨酸和苏氨酸代谢(图1)。 (图 4E)4E)在HIST3H2A低表达表型中富集,提示该通路可能参与了HIST3H2A的功能。

来自基因集富集分析 (GSEA) 的富集图。
胰腺癌中免疫细胞浸润的情况
为了进一步研究 HIST3H2A在胰腺癌中的肿瘤免疫功能,我们使用 CIBERSORT 算法估计 TCGA-胰腺癌免疫细胞浸润状态,并比较了较高 HIST3H2A 和较低 HIST3H2A 之间免疫细胞浸润模式的差异(图 1)。(图 5)。5)。结果显示HIST3H2A表达降低。结果表明, 在 HIST3H2A 表达较低的组中,CD8 T 细胞 ( P = .007)、活化的 CD4 记忆 T 细胞 ( P = .001) 和单核细胞 ( P = .002) 更丰富。尽管在 HIST3H2A 表达较高的组中,记忆 B 细胞 ( P = .001)、活化的 NK 细胞 ( P = .006) 和 M0 巨噬细胞 ( P = .002) 显着较高。这一发现表明免疫激活细胞在低 HIST3H2A 表达中显着丰富,这也巩固了 GSEA 在低 HIST3H2A 表达表型中的结果。

免疫细胞浸润的可视化,比较低 HIST3H2A 和高 HIST3H2A 表达组之间的 22 种免疫细胞亚型。绿色和红色分别代表较低的 HIST3H2A 和较高的 HIST3H2A 表达组。
讨论
JAK STAT 通路介导细胞因子、干扰素和生长因子的作用,并控制细胞中的基因表达。它将细胞外信号转导到调节细胞生长和分化的转录程序中,它还承担着额外的功能,参与细胞核中染色质构象和表观遗传标记的调节,并影响细胞质、线粒体和细胞核中的氧化磷酸化. [ 23 ]值得注意的是,JAK STAT通路在免疫系统中发挥着重要作用。JAKs 和 STATs 的突变会导致免疫缺陷。它导致无功能的T细胞和有缺陷的免疫球蛋白产生细胞的出现,从而阻碍了T细胞、NK细胞的发育和B细胞的功能。STAT3 和 STAT5 活性是人类 T 滤泡辅助细胞的生成所必需的。(T 滤泡辅助细胞可以诱导 B 细胞分化并产生抗体。)[ 24 ]JAK STAT 通路由白细胞介素 (IL)6、IL10/IL22 和 IL17/IL23 细胞因子家族成员激活并参与肠道免疫。过度激活 JAK 通路会抑制先天免疫和适应性免疫中的肿瘤免疫功能,从而促进恶性细胞的生长。[ 25 ]我们的研究表明,HIST3H2A 的高表达与 JAK-STAT 信号通路呈正相关。此外,通过分析肿瘤微环境中的免疫细胞浸润,我们发现免疫激活细胞(CD8 T 细胞和记忆激活 CD4+ T 细胞)在较高的 HIST3H2A 表达中明显不足。因此,我们推测 HIST3H2A 可能通过调节 JAK-STAT 通路来调节胰腺癌中肿瘤免疫的进展。在HIST3H2A生存曲线中,前3年趋势很明显,但到了晚期趋势不再明显,我们认为胰腺癌患者往往发展迅速,存活>3年的患者可能有更强的肿瘤免疫功能由于遗传因素,它们受HIST3H2A的影响较小。
LncRNA DST1-AS1 的高表达与较差的预后显着相关。LncRNA DCST1-AS1 通过调节 AKT/mTOR 信号级联促进细胞增殖和侵袭,抑制细胞凋亡和自噬。[ 26 ] HIST1H2BD的高表达与宫颈癌患者的预后显着相关。[ 27 ]H2A/H2B 在允许转录、DNA 复制和 DNA 修复的染色质过程中发挥重要作用。SLC12 基因家族编码电中性无机阳离子氯化物协同转运蛋白,它们是介导无机钠 (Na+) 和钾(k+) 阳离子运动的质膜蛋白,与氯离子 (cl+) 阴离子的运动紧密耦合。这些转运蛋白在人体生理学中发挥着几个重要作用。SLC12 蛋白家族包括 SLC12A8 和 SLC12A9,它们编码尚未赋予其功能的蛋白质。[ 28 ]由于对胰腺癌患者HIST3H2A的研究有限,因此HIST3HI2A与这些基因(SLC12A8和SLC12A9)之间的相互作用需要进一步的实验研究。我们使用生物信息学方法证明了这些基因的关联,通过影响肿瘤免疫过程进一步影响胰腺癌患者的发展和预后。
也就是说,这项研究也有一些局限性。首先,我们只分析了 TCGA 数据库和 GETx 项目,我们的结果需要在许多外部验证队列中进行验证;应该考虑来自不同队列的批次效应来确认这些有趣的发现。其次,我们没有确定 HIST3H2A 的最佳截止值。在这里,Siglec15 mRNA 表达的中值被认为是截止值。在我们的研究中,Kaplan-Meier 生存分析没有意义。然而,单变量 Cox 回归分析表明,与 HIST3H2A 低表达的患者相比,HIST3H2A 的高表达与胰腺癌患者的死亡风险显着增加有关。多变量 Cox 回归分析还表明 HIST3H2A 可能是预测疾病预后的独立危险因素。最后,需要进一步的实验来确定 HIST3H2A 的表达谱、JAK-STAT 信号通路和免疫细胞浸润之间的关系。
材料和方法
数据库
数据包括 178 个胰腺癌组织和 4 个正常组织,患者临床信息(包括 futime、fustat、年龄、性别、病理分期和组织学分级)和 HIST3H2A 表达水平从癌症基因组图谱(TCGA)数据库下载(https ://genome-cancer.ucsc.edu )。此外,我们将 203 个正常胰腺组织收集到 TCGA 数据库中进行方差分析。
这些数据是从公共数据库下载的,因此不适用于额外的道德批准。
统计分析
我们通过 R 软件 (Rx64 3.6.0) 执行所有统计分析。首先,我们提取基因表达谱和胰腺癌患者的数据,然后我们注释基因矩阵并删除临床信息不完整的患者。其次,我们根据 HIST3H2A 的表达将患者分为 2 组(高和低),并使用 Kaplan-Meier 方法校正表达和患者的 OS 和 DFS。第三,通过Wilcoxon秩和检验、Kruskal-Wallis检验分析患者生存状态与临床信息的相关性,然后通过逻辑回归检验各因素的作用。单变量Cox分析用于选择可能的预后因素,多变量Cox分析用于验证HIST3H2A表达与生存率之间的相关性。
基因集富集分析
我们通过GSEA确定了与HIST3H2A表达相关的基因集在哪个途径富集,并通过共表达分析分析了可能的分子间相互作用机制。每次分析进行 1000 次基因组排列。P值<.05和错误发现率<0.05的基因组被认为是显着富集的。
评估免疫细胞亚型分布
为了从胰腺癌的基因表达谱中量化浸润免疫细胞的相对比例,使用一种称为 CIBERSORT ( https://cibersortx.stanford.edu/ ) 的生物信息学算法来计算免疫细胞浸润。使用具有 1000 个排列的 22 种免疫细胞亚型的参考集估计了推定的免疫细胞丰度。使用 R 中的“vioplot”包绘制小提琴图,以可视化较高 HIST3H2A 表达和较低 HIST3H2A 表达之间免疫细胞浸润的差异。