Q1 IF: 9.186生物信息学和机器学习分析和验证儿科脓毒症的诊断生物标志物和免疫细胞浸

儿科脓毒症 DEG 筛选
两组患者的临床特征见补充表2。研究过程如图 所示。共有556个DEG,包括381个上调基因和175个下调基因

GSEA
GSEA 对患有败血症的儿科患者和健康对照受试者进行了研究,以研究生物信号通路。显示了 HALLMARK 分析确定的前五个术语(补充图 2a)。凝血、补体、IL6-JAK-STAT3 信号、炎症反应和通过 NFκB 的 TNFα 信号在小儿脓毒症患者中显着增强(P调整后 < 0.05)。
DEGs的功能富集分析
我们进行了功能分析,以更深入地了解 DEG 的生物学功能。DO分析结果显示,这些DEG与肺部疾病、动脉硬化、肝炎、动脉粥样硬化、动脉硬化性心血管疾病、细菌感染性疾病、原发性细菌感染性疾病、阻塞性肺病、结核病和支气管疾病有关。GO富集分析显示DEG具有免疫反应调节信号通路、免疫反应的激活、细胞因子产生的正向调节、白细胞介导的免疫、T细胞激活和髓系白细胞激活。KEGG 分析与造血细胞谱系、金黄色葡萄球菌相关感染、Th1 和 Th2 细胞分化以及 Th17 细胞分化
儿科脓毒症共表达基因模块的鉴定
在儿科败血症数据集中,我们使用 WGCNA 来定位由许多基因共表达的基因模块。首先,两个数据集中的样本被分为两组,即儿科脓毒症组和正常组,没有观察到异常值。然后,基于> 0.8的尺度独立性,选择13作为软阈值功率β,以确保具有生物学意义的无标度网络。通过基因树状图的层次聚类分析和动态分支切割方法,基因被分为12个模块。浅青色、蓝色和浅绿色模块与儿科败血症显着相关,并被选择进行进一步分析。总共 1582 个基因与儿科脓毒症基因意义和模块成员显着相关。
诊断标志物的筛选和验证
通过利用维恩图比较DEG和关键模块基因的重叠区域,我们能够识别出402个重叠基因区域。我们使用了三种机器学习算法来识别特征基因:RF结合特征选择来确定错误率、分类树的数量以及按相对相关性降序排列的18个基因之间的联系;使用LASSO回归分析从统计显着的单变量变量中选择16个预测基因。三种算法将 CYSTM1、MMP8 和 CD177 识别为重叠基因。使用 rms 包,我们基于标志性基因 CYSTMI1、MMP8 和 CD177 开发了用于诊断小儿败血症的列线图模型。根据决策曲线分析(DCA)的结果,诺模图模型提供了更好的临床效益。CYSTM1、MMP8 和 CD177 的 AUC 分别为 0.988、0.973 和 0.986,ROC 曲线表明它们作为有价值的生物标志物的可能性,表明 生物标志物具有很高的预测值准确性。在 GSE13904 验证集中,CYSTM1、MMP8 和 CD177 的表达在小儿脓毒症组中显着高于对照组(P < 0.01). CYSTM1、MMP8 和 CD177 的 ROC 曲线分别为 0.968、0.964 和 0.957,表明它们在 GSE13904 验证集中作为有价值的生物标志物的可能性


免疫细胞浸润结果
通过 CIBERSORT 算法,与正常样本相比,小儿脓毒症样本中单核细胞、M0 巨噬细胞、M1 巨噬细胞、M2 巨噬细胞、静息肥大细胞、活化肥大细胞、嗜酸性粒细胞和中性粒细胞以及幼稚 B 细胞、CD8+ T 细胞的比例普遍较高细胞、静息CD4+记忆T细胞、活化CD4+记忆T细胞、Trges、静息NK细胞、活化NK细胞和静息树突状细胞相对较低(P <0.05)。根据相关性分析的结果,CYSTM1、MMP8和CD177与多种免疫细胞表现出显着程度的相关性
