欢迎光临散文网 会员登陆 & 注册

临床公共数据挖掘热潮又起!“NHANES”数据库挑起大梁,发高分SCI 简直不要太简单!再

2023-04-17 15:20 作者:尔云间  | 我要投稿

近期,临床科研圈又悄悄刮起一股“临床公共数据库”挖掘的热潮,小伙伴们有没有注意到呀?

小云前面也提到了常用的、发文量比较多的比如SEER、NHANES数据库等,分析不难,并且又比较容易发高分,是个不可多得的发文好途径!(ps:前面介绍了SEER数据库和数据挖掘文章,感兴趣的小伙伴可以移步文末点击链接观看哦)

SEER数据库包含的都是肿瘤数据,那如果关注的是非肿瘤疾病该用什么数据库呢?

小云推荐“NHANES”数据库,目前全球范围内大概有 6.5 万篇文献与 NHANES 数据库相关,其中有2000篇左右文章直接使用 NHANES 数据库的数据发表,其中不乏10分+的高分文章。

已经有那么多篇文章发表了,我们还可以继续挖掘吗?

可以的!因为NHANES 数据库中的数据够全够多,所以它的挖掘潜力是巨大的!下面跟随小云先了解一下它吧!

什么是NHANES数据?

国家健康与营养调查(National Health And Nutrition Examination Survey,NHANES),是美国疾病控制和预防中心(CDC)旨在评估美国成人和儿童的健康和营养状况进而执行的一项基于人群的横断面调查研究计划。NHANES计划始于1960s,并自1999年开始成为一项持续计划,重点关注与健康和营养有关的一系列问题。

项目每年调查约5000人的全国代表性样本。研究小组由医生、医疗技术人员及健康调查员组成。参与调查遵循自愿原则,参与者将接受标准化的个人访谈和检查。NHANES访谈部分包括人口统计学、社会经济学、饮食和健康相关问题,检查部分包括医学、牙科和生理测量,以及由训练有素的医务人员进行的实验室检验。调查结果将用于确定主要疾病的患病率和疾病的风险因素,也是衡量身高、体重和血压等国家标准的基础,研究为营养和健康政策的制定提供了大量数据支持。数据库每两年进行一次调查,两年称为一个cycle year。网址:http://www.cdc.gov/nchs/nhanes/index.htm 

NHANES数据库内容

NHANES作为CDC连续开展的横断面研究,收集了人群中慢性病患病率的数据,通过调查,可估算出以前未确诊的情况、已知和报告的情况。同时调查风险因素,即一个人的生活方式、体质、遗传、环境中可能增加患病机会的因素,其中包括吸烟、饮酒、性行为、吸毒、身体健康状况和运动、体重、饮食摄入,还收集了关于生殖健康方面的数据,如使用口服避孕药和母乳喂养做法。

研究的疾病和健康指标包括:贫血、心血管疾病、糖尿病、环境暴露眼疾、听力损失、传染性疾病、肾脏疾病、营养、肥胖、口腔健康、骨质疏松、生育史和性行为、呼吸系统疾病(哮喘,慢性支气管炎,肺气肿)、性病、视力等,研究结果可用于确定慢性疾病的患病率和危险因素,便于研究者开展流行病学研究,并为政府公共卫生政策和卫生服务计划的制定提供依据。

下面以一个7分+的NHANES数据库分析文章给小伙伴们打个样,感兴趣的朋友学起来,这个快速发文渠道,再不上车就晚啦!

l 题目:有机磷杀虫剂暴露与美国成年人睡眠问题患病率之间的关系:基于NHANES 2007–2018的分析

l 杂志:Ecotoxicology and Environmental Safety

l 影响因子:IF=7.129

l 发表时间:2023年4月

研究背景

有机磷农药(OPPs)是农业中最广泛使用的杀虫剂,用于控制害虫、提高作物产量和改善食物的营养状况,OPPs及其代谢残留物的增加污染了空气、灰尘、土壤、食物和饮料。内分泌系统和睡眠问题密切相关,异常激素体内平衡可能会显著影响睡眠模式,OPP可能通过拮抗核受体和破坏相关蛋白,导致睡眠问题。已有报道了农药暴露和睡眠问题之间的联系,但尿液中的二烷基磷酸酯化合物(DAPs)和睡眠问题之间的关系尚未得到研究。

研究思路

从NHANES数据库收集了6295名18岁或以上参与者的数据。NHANES采用固相萃取-同位素稀释-超高效液相色谱-串联质谱法检测了尿液中的二烷基磷酸酯化合物(DAPs)代谢物,其尿液浓度作为OPPs暴露生物标志物。从数据库中收集关于短睡眠持续时间(SSD)、自我报告的睡眠问题和自我报告的睡眠障碍的数据。采用加权广义logistic模型,加权分位数和 (WQS)回归模型和基于分位数的g计算(QGC)方法被用来检测有机磷农药的尿代谢物和睡眠问题之间的关系。

主要结果

1. 纳入人群特征

59842名参与者被招募参与NHANES横断面研究。在排除了23,262名青少年(< 18岁)、754名没有协变量数据的参与者和29531名没有DAPs浓度的个体后,共有6295名参与者被纳入SSD分析,其中21人的睡眠时间数据不合格。共有6294名成人参与了自我报告的睡眠问题分析,3195名成人参与了自我报告的睡眠障碍分析。有1814例有SSD,44603例无SSD。SSD组和非SSD组在性别、种族、FIR、教育和一般健康状况方面表现出统计学显著差异(图1)。

图1 纳入人群特征

2. 各种DAP与睡眠问题的关系分析

NHANES报告了六种常见的尿DAP,包括二甲基磷酸酯(DMP)、二乙基磷酸酯(DEP)、二甲基硫代磷酸酯(DMTP)、二乙基硫代磷酸酯(DETP)、二乙基二硫代磷酸酯(DEDTP)和二甲基二硫代磷酸酯(DMDTP)。在该分析中,使用肌酐校正的DAPs浓度对尿液稀释进行校正,计算方法是将DAPs浓度除以尿液中的肌酐浓度。

多变量调整调查加权逻辑回归用于计算优势比(ORs)和相应的95 %置信区间(CIs )以评估连续DAP和睡眠问题患病率之间的关系。原始模型没有对任何协变量进行调整。模型1根据年龄和性别进行了调整,而模型2根据年龄、性别、种族、FIR、教育和一般健康状况进行了调整(表1)。然后将DAP分成四分位数,使用模型2检测它们与SSD的关联(表2)。通过上述所有协变量调整,使用具有四个节点的限制性立方样条回归模型测试了每个DAP和SSD之间的非线性关联(图2)

结果显示,尿DETP、DMTP、DEDTP和DMDTP的对数转换水平高的参与者的SDD患病率更高;相反,DEP和SSD之间存在负相关(表1)。以最低四分位数作为参照后,DETP、DMTP、DEDTP和DMDTP最高四分位数的参与者的SDD患病率显著高于最低四分位数参与者;在DEP观察到显著的负相关(表2)。SSD与DEP、DMP、DMTP和DMDTP的尿液浓度之间存在非线性关系(图2)。亚组分析显示,DAPs与SSD之间的关联在各组之间是一致的,没有发现明显的相互作用(图3)。(ps:逻辑回归分析也可以用小云新开发的零代码生信分析小工具实现,云生信分析工具平台包含超多零代码分析和绘图小工具,上传数据一键出图,感兴趣的小伙伴欢迎来尝试哟,网址:http://www.biocloudservice.com/home.html

表1 对数转换的DAPs和SSD患病率之间的不同模型的加权关系

表2  DAPs的四分位数与SSD患病率之间的关系

图2限制性立方样条图分析DAPs与SSD关联

图3 DEDTP和DETP与SSD患病率之间的加权关系的亚组分析。

DAPs间的相关性分析以及DAPs联合暴露对SSD患病率的影响

分析6种DAPs代谢物间的Pearson 相关性(图4A)。为了估计六种DAP对睡眠问题的综合影响以及每种DAP的贡献,利用WQS模型和QGC方法分析六种DAP联合暴露SSD患病率的关系。图4B显示每个DAPWQS模型回归指数中的权重WQS模型和QGC分析结果均表明,联合暴露于DAPs导致成人SSD患病率显著增加(表3)


表3通过WQS回归和QCG分析研究DAPs联合暴露与SSD患病率之间的关系

小结

这篇文章利用NHANES数据库探索尿液DAPs代谢物和睡眠问题之间的联系,运用多种数据分析和统计学方法,公共数据挖掘直接到手7分+文章,性价比之高已经相当高啦!如果你也收集样本困难,但又需要发高分文章,不妨试试这个思路吧!发文速度也很快,用于毕业或单位评审非常哇塞哦


临床公共数据挖掘热潮又起!“NHANES”数据库挑起大梁,发高分SCI 简直不要太简单!再的评论 (共 条)

分享到微博请遵守国家法律