R语言如何绘制基线三线表?
一篇论文中最少不了的表格,莫过于基线表格。实际中,许多人习惯性使用SPSS进行统计描述、差异性分析,但是SPSS无法进行批量单因素分析,还需要手动筛选数据绘制三线表,费时又费力。而R语言的分析功能更强大但具有一定的门槛,因此,这里结合实操案例为大家介绍一个智能在线免费统计分析平台——风暴统计。

一、实操数据介绍
这里我们使用的是R语言自带数据集MASS中的birthwt,birthwt是一份与婴儿出生体重低相关的危险因素数据,其中包含的变量见下表,根据研究设计,以“low”作为分组变量。

二、风暴统计智能在线免费平台复现
(1)首先进入风暴统计网站的“风暴智能统计”模块,点击“一键生成规范三线表”,这里更推荐大家使用“简单粗暴版”,因为进行卡方检验时,可以自动检验变量适用于卡方检验还是fisher法,无需像SPSS一样,自行挑选结果。

(2)目前支持10M以内的csv格式。数据导入前如需进行预处理的(如:定量数据转分类数据、多分类转二分类、打标签等),推荐用SPSS进行操作,具体详见下方文章:

(3)点击左侧“一键三线表”,指定不同的变量类型。“简单粗暴版”可以自动检验分类变量使用卡方法或fisher法!并在“statistic”注明了检验统计量。

(4)导出word版结果,结果直接呈现三线表形式,包括表名与表头一步到位。如需细节打磨,word形式方便进行编辑!
word版结果如下:

三、R语言软件复现
这里主要使用compareGroups包,这个包可以按组对多个变量进行描述。根据这些变量的性质,酌情计算不同的检验(t检验、方差分析、Kruskall-Wallis、Fisher、秩和…),从而可以很轻松的制作出SCI论文基线资料表或单因素分析表,也能做出SCI论文中多个模型比较的多因素分析表,甚至是线性趋势(P for trend)。
(1)安装并加载R包
install.packages("compareGroups")
library(compareGroups)
(2)差异性分析
base_tab <- descrTable(low ~ age + lwt + race + smoke + ptd + ht + ui+ ftv,
data=bwt,method = c (lwt=2))
print(base_tab)
descrTable(y~x1+x2+x3+x4+x......,data=数据集名,method = c (偏态数据=2)),指定因变量与自变量,设置数据集名。
最后的method对指定偏态数据采用秩和检验,未指定连续变量采用t检验,分类数据采用卡方检验。

四、总结
风暴统计平台与R语言的统计分析结果一致,并且风暴统计平台提供了t值、Z值、卡方值的统计量,结果输出也更加快速,完全无门槛!大家在制作三线表时,不妨试用一下!

2.数据转换
在很多情况下,可以将定量数据转换为定性数据(二分类、多分类),有序数据转换成二分类。这是因为不同的数据,有不同的统计策略:·定量数据——t检验·转换为等级数据——秩和检验·转换为二分类数据——卡方检验
这里更推荐“重新编码为不同变量”,会产生新变量,而不改变原有变量。

3. 打标签
对变量打标签:很多时候变量名是英文字母,难以辨认变量是什么,需要对变量进行解释,那么在“标签”列,就可以进行中文注释,说明情况。

探索性数据分析,包括正态性检验、定量数据统计描述、定性数据统计描述、t检验、方差分析、卡方检验、秩和检验。
这些方法是帮助大家对数据的分布、及采用的一些统计学方法有个初步的认识!尤其是哪些数据是正态的、哪些是偏态的,尤其重要。