对不满足正态分布的数据自动进行正态分布转换(R语言或Stata)
想起之前在做回归时,遇到回归中某些参数需要满足正态分布的情况,但可惜我的数据差了那么一点意思。
松哥统计(精鼎统计)在几个月前曾推送一篇关于stata的教程,使用了一个叫Ladder函数对数据进行9种正态转换,并且能输出各种转换后的正态检验结果,显然看起来非常不错,推送链接见https://mp.weixin.qq.com/s/0N6_IAtUM_pgynM6w-sobA

可是我本人用stata不多,R语言才是主力,那么R语言中有没有这样的函数包呢,果然也是有的,而且更强大,名字叫bestNormalize,

在进行多种正态转换后还可以对比并给出哪一种转换的效果最好,同时也有相关函数对转换后分析结束的数据逆转换为真实数据。

例如我对时间序列数据进行多重插补时会使用一个叫Amelia的函数包,但是它所使用的算法为EM,要求数据为正态分布,所以我把数据正态转换后再插补成无缺失值的数据就不是真实值了,在这种情况下利用bestNormalize可以基于相同的正态转换方法将插补后的完整数据还原为"真实"值
岂不美哉。
我搜了下国内没见有介绍这函数包推送,详细使用方法去看函数包的说明吧,或者哪天我录个屏简单教学一下。不知道有没有人有这个需求。