“我的研究是基于量表的调查,如何计算样本量?”
2023年以来浙中医大学郑老师开设了一系列医学科研统计课程,零基础入门医学统计包括R语言、meta分析、临床预测模型、真实世界临床研究、问卷与量表分析、医学统计与SPSS、临床试验数据分析、重复测量资料分析、结构方程模型、孟德尔随机化等10门课,如果您有需求,不妨点击下方跳转查看:
2023年郑老师多门科研统计课程:多次直播,含孟德尔随机化方法

无论是课题设计、还是毕业设计,对样本量的计算越来越重要,为此,本公众号也详细陈列了各种样本量计算的方法。但往往碰到实际的问题时,纸面的方法仍然给我们足够的帮助。
我碰到很多关于样本量的计算的咨询,觉得最需要解释也最有意思的问题就是:
郑老师,我在做一个基于医院病人的调查。问卷调查涉及了3个量表,那么我的调查样本量应该是多少?是不是量表总条目数的至少5-10倍?
这个问题中,有个“量表中条目数的5-10倍”,是很多人在查阅文献得到数据,那么实际上是否正确呢?
实际上,考虑这个问题要从多个角度去阐述,而重点是研究目的,否则查阅文献的结果会带来误导。
首先,我们要明确整个整个研究设计的主要指标或者主要结局指标是什么?是3份量表的哪一份?这个结局指标的是决定样本量计算的关键指标
其次,我们再要考虑量表中条目数和样本量的关系。一般情况下,为了实现量表具有较好的信效度,一份量表测量份数要达到总条目数的5-10倍以上(这是量表研究约定成俗的,文献出处暂时不可考)。因此如果我们有三份量表,量表条目分别是10、20、30,那么样本量应该以条目最大的量表为基础计算,至少是30*5,150份以上,但不是60*5!
第三,光总条目数和样本量,是远远不够的。基于总条目数计算样本量只是在量表测试中才有要求,而在应用中还要考虑更多的。还要考虑什么呢?必须考虑结局指标的类型、研究设计、和统计学方法!
结局指标类型方面,我们必须要基于主要指标开展研究与分析。主要指标一般是某一份量表的总得分,那么便是定量数据;也有可能是算出量表总得分后,再转换为二分类定性数据:比如我们基于量表调查患者抑郁情况,然后根据界值把人群划为抑郁者和非抑郁者。两种结局指标指标类型的样本量计算方法显然存在着区别。
在研究设计上,必须要甄别,这个研究是横截面调查(了解分布为主)还是病例对照研究和队列研究(了解病因为主),三种方法有不同的样本量计算方法。
统计方法对样本量也有影响,一般情况下,量表分析常见的方法,仍然是线性回归分析或者logistic回归分析,线性回归分析一般对样本量的要求是自变量个数的5-10倍以上,logistic回归分析一般要求是阳性例数是自变量个数的5-10倍。
总结,基于量表研究样本量计算较为复杂!如何选择,那便是从各种对样本量有要求的条件中,要求最大的那个样本量。为此,我做一个技术路线图来帮助诸位:

详情请点击下方:
https://mp.weixin.qq.com/s?__biz=MzAwOTYyMDY3OQ==&mid=2650405111&idx=2&sn=dfdb4973b707e8e6947bd5b900414852&chksm=8351855fb4260c49db345890827200949123faace3c48e5d06f608bedcf8933f68b44b2907be&token=482467525&lang=zh_CN#rd


2023年统计服务