欢迎光临散文网 会员登陆 & 注册

统计分析过程的常见七宗罪,你可曾犯其中几条?

2023-06-01 17:12 作者:郑老师妙趣横生统计学  | 我要投稿


                    2023年郑老师多门科研统计课程:多次直播,含孟德尔随机化方法  

随着统计教育的普及,对于科研工作者来说,统计分析看起来慢慢变得不再是问题了,统计描述、t检验、方差分析,乃至多重比较、卡方检验貌似都可以通过SPSS统计软件分析快速形成。但统计分析有一些问题还是容易犯错,有些是原则性的问题、有些则是小细节问题,我列举基本统计研究的几个问题,称之为七宗罪。

1、项目与论文研究设计,没有考虑样本量的计算

之所以把这个问题摆在第一位,是因为这个问题基本上十之八九就没有很好考虑,无论是一个项目的申报书、还是一个毕业论文的开题、一篇论文分析,均没有考虑好样本量的多少?经常采用30、40、60例这样齐整的样本量,怎么来得?自己想想的。更不要说动物试验了!其实动物试验也需要估算样本量,不能因为动物不值钱,动物也有伦理的!

比如有下文,没有样本量计算方法,怎么设定60例呢?为什么就是60例呢?即便60例足够,也不严谨!

2、所有定量数据,统计描述都用均数±标准差

你见过什么时候中文的学术论文,定量数据采用中位数和四分位数描述了?太少太少了!大家都喜欢用均数±标准差。但你没有考虑,均数能否代表着这一堆数据吗?你没有发现有些时候标准差远远大于均数?有时候数据有好一些异常值?固定思维模式要改改了,很多时候中位数和四分位数间距反而能够更好体现数据的特征。

一般情况下,判断数据是不是正态分布的简易方法是,当指标只能取正值或只能取负值时,“标准差接近或大于均值时数据不是正态分布成立”。

一旦出现现象,就不能用均数±标准差了,否则论文发表会被审稿人发现。

比如下文,用均数±标准差,显然不合适。

3、所有定量数据的比较,都采用t检验

早些年这一现象非常普遍,现在随着统计思维的普及,很多人知道了偏态数据差异性比较时候采用非参数秩和检验来代替。但总的来说,基本上采用t检验来进行两组定量数据的差异性比较仍然是固定思维?如果没有你数据分析之前没有考虑数据正态性的问题,没有考虑两组数据方差是否相似,那么就容易犯错。再次强调:严重偏态分布的数据用秩和!秩和!秩和! 

4、无论什么样的分类数据的比较,一直都是卡方检验

卡方检验是用来毕竟不同组数据之间率或者构成比有无统计学差异。没有错,率的比较是采用卡方。但有没有考虑过你的卡方条件是否符合呢?当样本量较小,或者某一行或者一列数据太少的时候,卡方检验不好使用,应该是用Fisher!这里说一下,建议以后少用卡方,多用Fisher,因为Fisher才是最准确的!哪一种场景下都没有错!
比如:下列表格,属于样本量较少的情况,应该用FIsher确切概率法

又比如:试验组和对照组的癌症特征比较,也应该用Fisher确切概率法


这里强力建议: 多分类数据差异性比较,Fisher确切概率法才是首选,不要过于依赖卡方检验

5、方差分析多重比较,用t检验

这宗罪早些年很多,如今已经被死死遏制在较低的犯罪水平,凡事讲到方差分析都要提到,两两比较不要用t检验!你现在还犯错?那不应该呀!两两比较要采用类似于LSD, Bonfferoni、tukey、SNK的方法,推荐使用Bonfferoni方法,相对保守的一种方法。 



详情请点击下方:

https://mp.weixin.qq.com/s?__biz=MzAwOTYyMDY3OQ==&mid=2650406199&idx=2&sn=71057a48b2557f63d6fd4a68d7eed4d7&chksm=8351809fb426098967254786d146c0d15cc854945bad333a67141a2fb8066acfeb3824cf5ae9&token=1911583451&lang=zh_CN#rd




统计分析过程的常见七宗罪,你可曾犯其中几条?的评论 (共 条)

分享到微博请遵守国家法律