“我的研究是基于量表的调查，如何计算样本量？”

2023-04-11 16:37 作者:郑老师妙趣横生统计学 0人读过 | 我要投稿

2023年以来浙中医大学郑老师开设了一系列医学科研统计课程，零基础入门医学统计包括R语言、meta分析、临床预测模型、真实世界临床研究、问卷与量表分析、医学统计与SPSS、临床试验数据分析、重复测量资料分析、结构方程模型、孟德尔随机化等10门课，如果您有需求，不妨点击下方跳转查看：

2023年郑老师多门科研统计课程：多次直播，含孟德尔随机化方法

无论是课题设计、还是毕业设计，对样本量的计算越来越重要，为此，本公众号也详细陈列了各种样本量计算的方法。但往往碰到实际的问题时，纸面的方法仍然给我们足够的帮助。

我碰到很多关于样本量的计算的咨询，觉得最需要解释也最有意思的问题就是：

郑老师，我在做一个基于医院病人的调查。问卷调查涉及了3个量表，那么我的调查样本量应该是多少？是不是量表总条目数的至少5-10倍？

这个问题中，有个“量表中条目数的5-10倍”，是很多人在查阅文献得到数据，那么实际上是否正确呢？
实际上，考虑这个问题要从多个角度去阐述，而重点是研究目的，否则查阅文献的结果会带来误导。

首先，我们要明确整个整个研究设计的主要指标或者主要结局指标是什么？是3份量表的哪一份？这个结局指标的是决定样本量计算的关键指标

其次，我们再要考虑量表中条目数和样本量的关系。一般情况下，为了实现量表具有较好的信效度，一份量表测量份数要达到总条目数的5-10倍以上（这是量表研究约定成俗的，文献出处暂时不可考）。因此如果我们有三份量表，量表条目分别是10、20、30，那么样本量应该以条目最大的量表为基础计算，至少是30*5，150份以上，但不是60*5！

第三，光总条目数和样本量，是远远不够的。基于总条目数计算样本量只是在量表测试中才有要求，而在应用中还要考虑更多的。还要考虑什么呢？必须考虑结局指标的类型、研究设计、和统计学方法！
结局指标类型方面，我们必须要基于主要指标开展研究与分析。主要指标一般是某一份量表的总得分，那么便是定量数据；也有可能是算出量表总得分后，再转换为二分类定性数据：比如我们基于量表调查患者抑郁情况，然后根据界值把人群划为抑郁者和非抑郁者。两种结局指标指标类型的样本量计算方法显然存在着区别。
在研究设计上，必须要甄别，这个研究是横截面调查（了解分布为主）还是病例对照研究和队列研究（了解病因为主），三种方法有不同的样本量计算方法。

统计方法对样本量也有影响，一般情况下，量表分析常见的方法，仍然是线性回归分析或者logistic回归分析，线性回归分析一般对样本量的要求是自变量个数的5-10倍以上，logistic回归分析一般要求是阳性例数是自变量个数的5-10倍。

总结，基于量表研究样本量计算较为复杂！如何选择，那便是从各种对样本量有要求的条件中，要求最大的那个样本量。为此，我做一个技术路线图来帮助诸位：

详情请点击下方：

https://mp.weixin.qq.com/s?__biz=MzAwOTYyMDY3OQ==&mid=2650405111&idx=2&sn=dfdb4973b707e8e6947bd5b900414852&chksm=8351855fb4260c49db345890827200949123faace3c48e5d06f608bedcf8933f68b44b2907be&token=482467525&lang=zh_CN#rd