流行病学描述性研究思维导图

03描述性研究
描述性研究的概念
描述性研究,又称为描述流行病学,是流行病学研究方法中最基本的类型,描述性研究是指利用常规监测记录或通过专门调查获得的数据资料(包括实验室检查结果),按照不同地区、不同时间及不同人群特征进行分组,描述人群中有关疾病或健康状态以及有关特征和暴露因素的分布状况,在此基础上进行比较分析,获得疾病三间(人群、地区和时间)分布的特征,进而获得病因线索,提出病因假设。
描述性研究的种类
现况研究、病例报告、病例系列分析、个案研究、历史资料分析、随访研究、生态学研究、筛查、监测。
描述性研究的特点
1、描述性研究以观察为主要研究手段,不对研究对象采取任何干预措施,仅通过观察、收集和分析相关数据,分析和总结研究对象或事件的特点。
2、描述性研究中,其暴露因素的分配不是随机的,且在研究开始时一般不设立对照组。
3、暴露与结局的时序关系无法确定,对于暴露与结局间关系的因果推断存在一定的局限性,仅可做一些初步的比较性分析,但可为后续的分析性或实验研究提供线索。
描述性研究的用途
1、描述疾病或者健康状况的分布及发生发展的规律。
2、获得病因线索,提出病因假设。
现况研究的概念
现况研究是通过对特定时点(或期间)和特定范围内人群中的疾病或健康状况和有关因素的分布状况的资料收集、描述,从而为进一步的研究提供病因线索。从时间上来说,现况研究收集的是某特定的时间断面的资料,故又称为横断面研究。从观察分析指标来说,由于这种研究所得到的频率指标一般为特定时间内调查群体的患病率,故也称之为患病率研究。
现况研究的特点
现况研究不仅可以准确描述疾病或健康状况在某一人群中的分布,还可以同时探讨多个暴露因素与多种疾病之间的关系。
1、现况研究一般在设计阶段不设对照组。
2、现况研究的特定时间。
3、现况研究在确定因果联系时受到限制。
4、对研究对象固有的暴露因素可以作因果推断。
5、现况研究用现在的暴露(特征)来替代或估计过去情况的条件。
6、现况研究定期重复进行可以获得发病率资料。
现况研究的类型
现况研究根据涉及研究对象的范围可分为普查和抽样调查。
普查
普查即全面调查,是指在特定时点或时期内、特定范围内的全部人群(总体)作为研究对象的调查。这个特定时点应该较短。特定范围是指某个地区或某种特征的人群。
普查的目的
1、早期发现、早期诊断和早期治疗病人,如妇女的宫颈癌普查;
2、了解慢性病的患病及急性传染性疾病的疫情分布,如高血压普查和针对疫区开展的普查;
3、了解当地居民健康水平,如居民膳食与营养状况调查;
4、了解人体各类生理生化指标的正常值范围,如青少年身高、体重的测量等。
普查的优点
1、调查对象为全体目标人群,不存在抽样误差;
2、可以同时调查目标人群中多种疾病或健康状况的分布情况;
3、能发现目标人群中的全部病例,在实现“三早”(早期发现、早期诊断、早期治疗)预防的同时,全面地描述疾病的分布与特征,为病因分析研究提供线索。
普查的缺点
1、不适用于患病率低且无简便易行诊断手段的疾病;
2、工作量大,因此不易细致,难免存在漏查;
3、调查工作人员涉及面广,掌握调查技术和检查方法的熟练程度不一,对调查项目的理解往往很难统一和标准化,较难保证调查质量;
4、耗费的人力、物力资源一般较大,费用往往较高。
抽样调查
抽样调查是相对于普查的一种比较常用的现况研究方法,指通过随机抽样的方法,对特定时点、特定范围内人群的一个代表性样本进行调查,以样本的统计量来估计总体参数所在范围,即通过对样本中的研究对象的调查研究来推论其所在总体的情况。
抽样调查特点
与普查相比,抽样调查具有节省时间、人力和物力资源等优点,同时由于调查范围小,调查工作易于做得细致。
但是抽样调查的设计、实施与资料分析均比普查要复杂;同时资料的重复或遗漏不易被发现;对于变异过大的研究对象或因素和需要普查普治的疾病则不适合用抽样调查;患病率太低的疾病也同样不适合用抽样调查,因为需要很大的样本量,如果抽样比大于75%,则不如进行普查。
抽样调查的基本要求是能将从样本获得的结果推论到整个群体(总体),为此,抽样必须随机化,样本量要足够。
现况研究的用途
现况研究除可用于掌握目前群体中疾病或健康状况的分布,提供疾病病因研究的线索外,现况研究的主要用途还包括:
1、确定高危人群。
2、评价疾病监测、预防接种等防制措施的效果。
决定现况研究的样本量大小(计数资料)的因素
1、预期现患率(p);
2、对调查结果精确性的要求:即容许误差(d)越大,所需样本量就越小;
3、要求的显著性水平(α):α值越小,即显著性水平要求越高,样本量要求越大。
抽样方法
抽样可分为非随机抽样和随机抽样,前者如典型调查。随机抽样的样本获得须遵循随机化原则,即保证总体中每一个对象都有已知的、非零的概率被选为研究对象,以保证样本的代表性。若样本量足够大、调查数据可靠、分析正确,则可以把调查结果推论到总体。
常见的随机抽样方法还有单纯随机抽样、系统抽样、分层抽样、整群抽样和多阶段抽样。
单纯随机抽样
也称简单随机抽样,是最简单、最基本的抽样方法。从总体N个对象中,利用抽签或其他随机方法(如随机数字)抽取n个,构成一个样本。它的重要原则是总体中每个对象被抽到的概率相等(均为n/N)。
在估算样本量时,该抽样方法既可根据总体率进行估算,也可根据总体均数进行估算。
在实际工作中,单纯随机抽样往往由于总体数量大,编号、抽样麻烦以及抽到个体分散而导致资料收集困难等原因而较少得到应用,但它是其他各种抽样方法的基础。
系统抽样
又称机械抽样,是按照一定顺序,机械地每隔若干单位抽取一个单位的抽样方法。
具体抽样方法如下:设总体单位数为N,需要调查的样本数为n,则抽样比为n/N,抽样间隔为K=N/n。每K个单位为一组,然后用单纯随机方法在第一组中确定一个起始号,从此起始点开始,每隔K个单位抽取一个作为研究对象。
系统抽样标准误的计算可用单纯随机抽样的公式代替。
系统抽样的优缺点
系统抽样的优点有:
1、可以在不知道总体单位数的情况下进行抽样。
2、在现场人群中较易进行。
3、样本是从分布在总体内部的各部分的单元中抽取的,分布比较均匀,代表性较好。
系统抽样的缺点主要是:
假如总体各单位的分布有周期性趋势,而抽取的间隔恰好与此周期或其倍数吻合,则可能使样本产生偏倚。
分层抽样
分层抽样:是指先将总体按某种特征分为若干次级总体(层),然后再从每一层内进行单纯随机抽样,组成一个样本。分层可以提高总体指标估计值的精确度,它可以将一个内部变异很大的总体分成一些内部变异较小的层(次总体)。每一层内个体变异越小越好,层间变异则越大越好。分层抽样比单纯随机抽样所得到的结果精确度更高,组织管理更方便,而且它能保证总体中每一层都有个体被抽到。这样除了能估计总体的参数值,还可以分别估计各个层内的情况,因此分层抽样技术常被采用。
分层抽样分类
分层抽样又分为两类:一类叫按比例分配分层随机抽样,即各层内抽样比例相同;另一类叫最优分配分层随机抽样,即各层抽样比例不同,内部变异小的层抽样比例小,内部变异大的层抽样比例大,此时获得的样本均数或样本率的方差最小。
整群抽样
整群抽样是将总体分成若干群组,抽取其中部分群组作为观察单位组成样本,这种抽样方法称为整群抽样。若被抽到的群组中的全部个体均作为调查对象,称为单纯整群抽样;若通过再次抽样后调查部分个体,称为二阶段抽样。
整群抽样的特点
1、易于组织、实施方便,可以节省人力、物力;
2、群间差异越小,抽取的群越多,则精确度越高;
3、抽样误差较大,故通常在单纯随机抽样样本量估算的基础上再增加1/2。
多阶段抽样
多阶段抽样是指将抽样过程分阶段进行,每个阶段使用的抽样方法往往不同,即将以上抽样方法结合使用,其在大型流行病学调查中常用。其实施过程为:先从总体中抽取范围较大的单元,称为一级抽样单位(如省、自治区、直辖市),再从每个抽得的一级单元中抽取范围较小的二级单元(县、乡、镇、街道)……以此类推,最后抽取其中范围更小的单元(如村、居委会)作为调查单位。
我国进行的慢性病大规模调查就是采用此方法。
多阶段抽样的优缺点
每个阶段的抽样可以采用单纯随机抽样、系统抽样或其他抽样方法。多阶段抽样可以充分利用各种抽样方法的优势,克服各自的不足,并能节省人力、物力。
多阶段抽样的缺点是在抽样之前要掌握各级调查单位的人口资料及特点。
现况研究资料收集的内容
一般包括以下几方面:
1、个人基本情况:年龄、出生日期、性別、民族、文化程度、婚姻状况、家庭人口数及结构组成、家庭经济状况等.
2、职业情况:具体工作性质、种类、职务、从事该工作年限、与职业有关的特殊情况等。
3、生活习惯及保健情况:饮食情况、吸烟史及量、饮酒史及量、个人对自我保健的重视程度及开展情况、医疗保健条件、体育锻炼情况等。
4、妇女生育情况:月经史、生育史、使用避孕药物及激素的情况等。
5、环境资料:生活环境和工作环境的某些数据,最好用客观的、数量化的指标表示。
6、人口学资料:抽样总体的人口数、按不同人口学特征分组的人口数,以便计算各种率,如患病率、感染率等。
现况研究资料的收集方法
(1)通过实验室测定或检查的方法来获得,如血糖的检测、血脂的检测等。
(2)编制调查表后对研究对象进行调查,进而获得暴露或疾病的资料。
(3)利用常规资料。具体可以采用:①常规登记和报告。②专题询问调查与信函调查。③临床检查及其他特殊检查的有关资料。
偏倚
偏倚是指从研究设计与实施到数据处理和分析的各个环节中产生的系统误差,以及结果解释、推论中的片面性导致的研究结果与真实情况之间出现的倾向性的差异,进而导致对暴露与疾病之间联系的错误描述。
现况研究的常见的偏倚
现况研究中,偏倚产生的原因主要有:
1、主观选择研究对象,即选择研究对象具有随意性,将随机抽样当作随意抽样;
2、任意变换抽样方法,如原本根据出院号来随机选择(抽样),之后又改用入院号等其他方法来抽样;
3、调查对象因不愿合作或其他种种原因不能或不愿意参加调查从而降低了应答率,若应答率低于70%就难以用调查结果来估计整个研究总体的状况(称为无应答偏倚);
4、所调查到的对象均为幸存者,使得调查结果有一定的局限性和片面性,不能全面反映实际情况(称为幸存者偏倚);
5、询问调查对象有关问题时,由于种种原因回答不准确(称为报告偏倚)或调查对象对过去的暴露史或疾病史等回忆不清,特别是健康的调查对象由于没有疾病的经历,而容易将过去的暴露情况等遗忘(称为回忆偏倚);
6、调查员有意识地深入调查某些人的某些特征,而不重视或马虎对待其他人的这些特征(称为调查偏倚);
7、在资料收集过程中测量工具、检验方法不正确,化验操作不规范等(称为测量偏倚)。
前4种情况最终导致研究样本缺乏代表性而使研究结果不能外推,均属于选择偏倚;后3种情况属于信息偏倚;此外,在数据分析中,混杂因素的存在也可以导致偏倚的发生。
现况研究的偏倚的控制
1、严格遵照抽样方法的要求,确保抽样过程中随机化原则的切实实施;
2、提高研究对象的依从性和受检率;
3、正确选择测量工具和检测方法,包括调查表的编制等;
4、组织好研究工作,调查员一定要经过培训,统一标准和认识;
5、做好资料的复查、复核等工作;
6、选择正确的统计分析方法,注意辨析混杂因素及其影响。
现况研究的优点
现况研究中常开展的是抽样调查。
1、抽样调查的样本一般来自人群,即从一个目标群体中,随机地选择一个代表性样本来进行暴露与患病状况的描述研究,故其研究结果有较强的推广意义,以样本估计总体的可信度较高。
2、现况研究是在资料收集完成之后,将样本按是否患病或是否暴露来分组比较的,即有来自同一群体自然形成的同期对照组,使结果具有可比性。
3、现况研究往往采用问卷调查或实验室检测等手段收集研究资料,故一次调查可同时观察多种因素,其在疾病病因探索过程中,为不可或缺的基础工作之一。
现况研究的缺点
1、现况研究与分析性研究的一个明显区别是其对特定时点即某一时间横断面和特定范围的规定,收集的信息通常只能反映调查当时个体的疾病与暴露状况,难以确定先因后果的时相关系。
2、现况研究调查得到的是某一时点是否患病的情况,故不能获得发病率资料,除非在一个稳定的群体中,连续进行同样的现况调查。
3、在一次现况研究中,如果研究对象中一些人正处在所研究疾病的潜伏期或者临床前期,则其极有可能会被误定为正常人,使研究结果发生偏倚,低估该研究群体的患病水平。
生态学研究
生态学研究又称相关性研究,是描述性研究的一种类型,它是在群体的水平上研究某种暴露因素与疾病之间的关系,以群体为观察和分析的单位,通过描述不同人群中某因素的暴露状况与疾病的频率,分析该暴露因素与疾病之间的关系。
疾病测量的指标可以是发病率、死亡率等;暴露也可以用一定的指标来测量,如从烟草局等有关部门获得的不同地区人群的烟草消耗量。
生态学研究的特点
生态学研究在收集疾病和健康状态以及某暴露因素的资料时,不是以个体为观察和分析的单位,而是以群体为单位的(如国家、城市、学校等),这是生态学研究的最基本特征。
该类研究虽然能通过描述不同人群中某因素的暴露情况与疾病频率来分析该因素与疾病的关系,但无法得知个体的暴露与效应(疾病)间的因果关系,如城市机动车数量的增长与居民肺癌发病率之间的相关性分析。
生态学研究是从许多因素中探索病因线索的一种常用方法,然而其提供的信息是不完全的,只是一种粗线条的描述性研究。
生态学研究的用途
1、提供病因线索,产生病因假设。
2、评估人群干预措施的效果。
生态学研究的类型
1、生态比较研究
生态比较研究是生态学研究中应用较多的一种方法。生态比较研究中最为简单的方法是观察不同人群或地区某种疾病的分布,然后根据疾病分布的差异,提出病因假设。一般情况下,这种研究不需要暴露情况的资料,也不需要复杂的资料分析方法。
生态比较研究更常用来比较在不同人群中某因素的平均暴露水平和某疾病频率之间的关系,即比较不同暴露水平的人群中疾病的发病率或死亡率的差别,了解这些人群中暴露因素的频率或水平,并与疾病的发病率或死亡率作对比分析,从而为病因探索提供线索。环境流行病学研究中常采用生态比较研究的方法。此法也可应用于评价社会设施、人群干预以及在政策、法令的实施等方面的效果。
2、生态趋势研究
生态趋势研究是连续观察人群中某因素平均暴露水平的改变与某种疾病的发病率、死亡率变化的关系,了解其变动趋势;通过比较暴露水平变化前后疾病频率的变化情况,来判断某因素与某疾病的联系。
生态学研究方法在实施中也常常将上述比较研究与趋势研究混合使用。生态学研究资料不需要特别的分析方法,可以将各群体(组)的研究因素的平均暴露水平与疾病频率之间作相关分析,也可以以各群体(组)的暴露作为自变量,以疾病的频率作为应变量,进行回归分析。由于在生态学研究中,一般可获得疾病的发病率,故在生态学研究资料分析中也可引入相对危险度、人群归因危险度等评价指标来进行分析。
生态学研究的资料收集(来源)
①地理信息系统的应用;②大数据的应用。
生态学研究的优点
1、生态学研究常可应用常规资料或现成资料(如数据库)来进行研究,因而节省时间、人力和物力,且可以较快得到结果。
2、生态学研究对病因未明的疾病可提供病因线索供深入研究,这是生态学研究最显著的特点。
3、对于个体的暴露剂量无法测量的情况,生态学研究是唯一可供选择的研究方法。
4、当研究的暴露因素在一个人群中变异范围很小时,很难测量其与疾病的关系。这种情况下,更适合采用多个人群比较的生态学研究。
5、生态学研究适合于对人群干预措施的评价。
6、在疾病监测工作中,应用生态趋势研究可估计某种疾病发展的趋势。
生态学研究的缺点
1、生态学谬误
2、混杂因素往往难以控制。
3、难以确定两变量之间的因果联系。
生态学谬误
在生态学研究中,生态学谬误是此类研究最主要的缺点。它是由于生态学研究以各个不同情况的个体“集合”而成的群体(组)为观察和分析的单位,以及存在的混杂因素等原因而造成研究结果与真实情况不符。因此,生态学研究发现的某因素与某疾病分布上的一致性,可能是两者存在真正的因果联系,也可能两者毫无关系。在对生态学研究的结果作结论时应慎重。
生态学谬误是生态学研究的最主要缺陷。生态学研究提示的病因线索既可能是疾病(或其他卫生事件)与某因素之间真实的联系,也可能是由个体到群体观察后所造成的一种虚假联系,反之亦然。当在群体水平上的生态学研究提示的联系线索与该人群中个体的真实情况不符时,就发生了“生态学谬误”。由于生态学研究是把高层次的群体水平上的信息、经验或发现直接推论到群体包含的低层次的个体水平,因此生态学谬误在生态学研究中常难以避免。
产生生态学谬误的主要原因
1、缺乏暴露与结局联合分布的资料。
2、无法控制可疑的混杂因素。
3、相关资料中的暴露水平只是近似值或平均水平,并不是个体的真实暴露情况,无法精确评价暴露与疾病的关系,造成对暴露与研究结局之间联系的一种曲解。
因个人水平有限,以上总结如有不当之处,请批评指正。