纯生信非肿瘤8分+
题目
Analysis of signature genes and association with immune cells infiltration in pediatric septic shock

摘要:
背景
儿童感染性休克的早期诊断对预后至关重要。本研究致力于研究小儿感染性休克的特征基因及其与免疫细胞的关系。
方法
我们从 GEO 数据库中筛选了感染性休克儿童的数据集,并分析了差异表达基因 (DEG)。对这些 DEG 进行了功能富集分析。加权基因共表达网络分析(WCGNA)用于筛选关键模块。最后应用最小绝对收缩和选择算子 (LASSO) 和随机森林分析来识别特征基因。然后利用基因集富集分析(GSEA)探索与中枢基因相关的信号通路。随后使用CIBERSORT对免疫细胞浸润进行分类。
结果
从GSE26440中筛选出534个DEGs 。然后通过WGCNA将数据聚集到 17 个模块中,其中 MEgrey 模块与小儿感染性休克显着相关(cor=−0.62,p <0.0001)。应用LASSO和随机森林算法选择特征基因,包括UPP1、S100A9、KIF1B、S100A12、SLC26A8。这些特征基因的受试者工作特征曲线 (ROC) 分别为 0.965、0.977、0.984、0.991 和 0.989,这在 GSE13904 的外部数据集中得到了验证. GSEA分析表明,这些特征基因参与了正相关的果糖和甘露糖代谢以及淀粉和蔗糖代谢信号通路。CIBERSORT 表明这些特征基因可能参与免疫细胞浸润。
结论
UPP1、S100A9、KIF1B、S100A12、SLC26A8 在小儿感染性休克中表现出显着的诊断性能,并参与免疫细胞浸润。
关键词:儿童,感染性休克,加权基因共表达网络分析,特征基因,免疫细胞浸润
结果
鉴定败血症和对照之间的 DEG
使用“limma”包分析来自感染性休克儿童和正常对照儿童的 DEG。最终筛选出534个DEGs,其中上调基因346个,下调基因188个(图 2A). 热图显示感染性休克儿童与健康组之间前 50 个上调和前 50 个下调的 DEG(图 2B).

小儿感染性休克中 DEG 的鉴定。(A) Volcano 在小儿感染性休克和健康人群之间显示出 DEGs 的表达。(B)热图显示前 50 个上调的 DEG 和 50 个下调的 DEG。
功能富集分析
GO分析包括三类(图 3A),即 BP、CC 以及 MF。BP 分析显示细胞因子产生的正调节、白细胞介导的免疫和对外部刺激反应的正调节显着丰富。在CC分析中,分泌颗粒腔、细胞质囊泡腔和囊泡腔占据前三位。此外,免疫受体活性、碳水化合物结合以及内肽酶活性在 MF 中起着重要作用。如 KEGG 分析所示,富集前 3 位的途径主要是补体和凝血级联反应、金黄色葡萄球菌感染以及造血细胞谱系(图 3B).

DEGs的功能富集分析。(A)分别在 BP、CC 和 MF 分析中排名前 10 位的功能富集。(B) DEG 的 KEGG 分析。
加权基因共表达网络的构建
使用R软件中的WGCNA包对感染性休克患儿和健康受试者进行分析,建立无标度共表达网络,软阈值确定为10,无标度指数为0.85,相对有利的平均连通性(图 4A、B). 聚类树状图显示在图 4C. 最后,数据被聚类成 17 个模块(图 4D). 计算了每个模块与感染性休克儿童之间的相关性。结果表明,MEgrey 模块与患有败血症休克的儿童显着相关(cor=-0.62,p <0.0001)。其中,MEgrey模块包含1567个基因,被认为是脓毒症休克患儿相关的关键模块。MEgrey 模块中的 DEG 和基因之间的重叠显示在图 4E.

GSE26440 的WGCNA分析和候选中枢基因的鉴定。(A) WGCNA 的软阈值功率。(B) WGCNA 的平均连通性。(C) WGCNA 的聚类树状图。(D) WGCNA 的集群模块。(E)维文图显示了 MEgrey 模块中 DEG 和基因之间的相互作用。
通过LASSO 和随机森林算法选择特征基因
应用两种机器算法从感染性休克儿童的候选关键基因中筛选出特征基因。对于 LASSO 分析,选择了 23 个特征基因(图 5A、B), 而在随机森林分析中, 45 个特征基因被确定为相对重要性大于 0.25 (图 5C、D). 这些筛选出的特征基因显示在表格1. 通过这两种算法的相互作用,最终确定了五个特征基因,包括 UPP1、S100A9、KIF1B、S100A12、SLC26A8(图 5E).

签名基因的机器算法。(A) LASSO 模型的惩罚图,误差条表示标准误差。(B) LASSO 图显示参数系数大小的变化随着 k 惩罚值的增加而缩小。(C)随机森林模型的错误率置信区间。(D)随机森林模型中基因的相对重要性大于 0.25,(E) LASSO 和随机森林算法的交互作用。

特征基因在预测感染性休克中的诊断功效
筛选出的特征基因在脓毒症休克患儿中的表达高于健康儿童,提示这些基因可能在小儿脓毒症休克中发挥潜在作用。图 6A-E). 此外,这些特征基因的受试者工作特征曲线(ROC)的曲线下面积(AUC)分别为UPP1的0.965、S100A9的0.977、KIF1B的0.984、S100A12的0.991、SLC26A8的0.989(图 6F-J). 我们还在外部验证队列中评估了每个特征基因在预测小儿感染性休克方面的诊断效率。与GSE26440一致,这些特征基因在感染性休克儿童中高度表达(图 7A-E). ROC的AUC值分别为UPP1的0.954、S100A9的0.959、KIF1B的0.987、S100A12的0.975、SLC26A8的0.982(图 7F-J). 这些现象表明筛选出的特征基因在预测小儿感染性休克方面具有显着的诊断效率。

GSE26440中特征基因的表现。(A–E)小儿感染性休克和健康人群之间特征基因的表达。(F–J) ROC 显示了特征基因的诊断性能。

GSE13904中特征基因的表现。(A–E)小儿感染性休克和健康人群之间特征基因的表达。(F–J) ROC 显示了特征基因的诊断性能。
GSEA分析
我们通过GSEA 分析评估了与特征基因相关的信号通路。排名前 10 的信号通路显示在图 8. 结果表明,UPP1与脂肪酸生物合成、果糖和甘露糖代谢、半乳糖代谢、甘氨酸、丝氨酸和苏氨酸代谢、卡波西肉瘤相关疱疹病毒感染、尼古丁成瘾、泛酸和CoA生物合成、卟啉代谢、淀粉和蔗糖代谢显着相关, 酪氨酸代谢。S100A9的表达与脂肪酸生物合成、果糖和甘露糖代谢、半乳糖代谢、甘氨酸、丝氨酸和苏氨酸代谢、矿物质吸收、尼古丁成瘾、泛酸和辅酶A生物合成、卟啉代谢、淀粉和蔗糖代谢、系统性红斑狼疮、耶尔森氏菌显着相关感染。KIF1B的表达与脂肪酸生物合成、果糖和甘露糖代谢、半乳糖代谢、甘氨酸、丝氨酸和苏氨酸代谢,矿物质吸收,尼古丁成瘾,泛酸和辅酶A生物合成,卟啉代谢,淀粉和蔗糖代谢,酪氨酸代谢。S100A12的表达与精氨酸生物合成、脂肪酸生物合成、果糖和甘露糖代谢、造血细胞谱系、白细胞跨内皮迁移、矿物质吸收、中性粒细胞胞外陷阱形成、破骨细胞分化、泛酸和CoA生物合成、淀粉和蔗糖代谢显着相关。SLC26A8的表达与果糖和甘露糖代谢、半乳糖代谢、甘氨酸、丝氨酸和苏氨酸代谢、炎症性肠病、尼古丁成瘾、卟啉代谢、淀粉和蔗糖代谢、系统性红斑狼疮、味觉转导、TNF 信号通路。综上所述,这些基因均与果糖和甘露糖代谢信号通路以及淀粉和蔗糖代谢信号通路呈正相关。

儿科特征基因的GSEA。(A) UPP1 在小儿感染性休克中的 GSEA。(B) S100A9 在小儿感染性休克中的 GSEA。(C) KIF1B 在小儿感染性休克中的 GSEA。(D) S100A12 在小儿感染性休克中的 GSEA。(E) SLC26A8 在小儿感染性休克中的 GSEA。
免疫细胞浸润
根据免疫细胞浸润评估免疫学特征。与正常儿童相比,感染性休克儿童具有更高的调节性T细胞(Tregs)、M0巨噬细胞、M1巨噬细胞、活化的肥大细胞、中性粒细胞浸润和更低的幼稚B细胞、CD8+T细胞、滤泡辅助性T细胞、γδT细胞, 静息树突状细胞, 静息肥大细胞浸润 (图 9A). 所有hub基因均与CD8 + T细胞、滤泡辅助性T细胞、γδT细胞、静息树突状细胞和静息肥大细胞的浸润呈负相关,与M0巨噬细胞和中性粒细胞的浸润呈正相关。S100A9、S100A12、SLC26A8与幼稚B细胞呈负相关,而UPP1、KIF1B与Tregs呈正相关(图 9B). 只有 SLC26A8 与活化的肥大细胞呈正相关。

免疫细胞浸润与特征基因相关。(A)小儿感染性休克和健康人群之间的免疫细胞浸润。(B)特征基因与显着不同的免疫细胞浸润之间的关联。“ns”表示 P ≥ 0.01。*P < 0.01、**P < 0.001 和 ***P < 0.0001。