欢迎光临散文网 会员登陆 & 注册

巧用JMP公式,让新变量的生成更简单

2020-12-25 14:44 作者:JMP数据分析  | 我要投稿

在数据整理及分析中,我们经常遇到需要根据现有变量生成新变量的情况,比如将连续型的年龄划分为年龄段,将BMI的具体值转换为“标准”、“超重”等分组提取地址变量中的某个字段,提取时间变量中的年月日等等。

在常用的一些编程统计分析软件中,我们需要记住一些函数才能够实现。而在JMP中,这些需求都可以通过清晰直观的“公式编辑器”点击操作实现,某些甚至可以一键生成

今天这篇文章我们将介绍几个平时分析中最常用的情境,帮助大家直观感受JMP生成新变量的方便与快捷。

为了帮助更多的临床医师学习如何运用JMP高效地开展数据分析,提高日常工作和发表论文的效率,2020年8月起,JMP资深用户、JMP特约专栏作者、资深统计学家冯国双博士及其团队将在JMP数据分析平台为大家分享一系列统计及数据分析、JMP实战操作、JMP分析报表解读等干货内容,每期一个经典话题,帮助大家掌握一个新技能。值得注意的是,这些话题并非仅针对临床医师,对所有运用JMP软件开展数据分析的小伙伴都适用。本文为此系列文章的第7期。


01 如何利用"公式编辑器”生成新变量?

我们首先选取JMP自带样本数据库中的Diabetes数据,如图1。

图1 JMP样本库自带示例数据Diabetes

插入新变量

假设我们要根据BMI产生分类变量。

首先,创建一个新变量用来指示分组。这里有两种方式,第一种是在任何一个变量顶部变量名处单击右键弹出菜单选择插入列,如图2。

图2 插入新变量(方式1)

第二种是在空列处双击左键,如图3。

图3 插入新变量(方式2)

插入新变量后,我们可以在该列名处单击右键进行列信息的设置,包括变量名称及类型等(关于变量名称的转换,可点击这里回顾)。这里我们将该变量命名为[BMI分组],变量类型设置为名义变量。


编辑公式

假设将BMI分为三组:正常为<25,超重为25-<30,肥胖为>=30,我们需要利用条件公式,也就是常说的if-then创建新变量。那么在JMP中如何实现呢?

首先,我们在BMI分组变量名处右键菜单中选择【公式…】,即弹出针对该变量的公式编辑对话框,如图4所示。

图4 公式编辑器界面

通过JMP中的条件和比较两部分语句,我们可以生成BMI的分组变量,具体操作步骤如图5和图6。

图5 条件语句操作步骤(1)
图6 条件语句操作步骤(2)

注意:双箭头后面的0、 1、 2是我们给分类的命名,分类名称不局限于数字,我们还可以给分类命名为“正常”、“超重”、“肥胖”。

公式编辑完毕之后,点击应用,确定,即可生成BMI分组变量,如图7所示。

图7 生成BMI分组变量

可能有的朋友觉得这样编辑公式也很麻烦,希望有更简便的操作,那么有没有呢?答案是:有!那就是通过JMP的“新建公式列”也可以快速生成新变量。


02 如何利用“新建公式列”快速生成新变量?

JMP将一些常用的公式集合成了快捷选项,可以通过在变量名处单击鼠标右键触发,达到一键生成新变量的目的。但需要注意的是,不是所有的公式都有,比如上面讲到的按照一定条件分组的操作,还是必须将条件公式输入进去才能生成满足需求的新变量。

那么这个快捷选项怎么操作呢?我们这里举两个例子,示例数据是2019年我国部分城市空气气象数据,见图8。

图8 示例数据


一键提取日期变量中的月份等信息

在date变量名处单击右键,然后如图9所示依次选择新建公式列→日期时间→月,点击后,即生成月份列,并自动命名为【月】,如图10所示。

图9 一键提取日期中的月份(1)
图10 一键提取日期中的月份(2)

从图9中,我们还可以看到,步骤3中,除了可以选择月,还可以选择年、季度、周、星期等,可以一键提取出想要的日期信息,在我们进行时间序列相关的分析时,你会发现这些快捷选项非常实用。大家感兴趣的话可以每一个功能都实际操作一下看看效果。


一键实现变量变换

新建公式列选项中除了日期相关的提取,更多的是关于连续型变量的变量变换,如图11中,我们可以直接在新列中对选取列进行四舍五入、平方、对数变换、指数变换等操作。

图11 一键实现变量变换(1)

还有针对多列的计算,比如新建公式列→合并→求和,可以得到多个列的加和值,如图12,对其他选项感兴趣的朋友们也可以一一尝试下。

此外,我们甚至可能一键进行更复杂的变换,如图13所示,我们可以针对目标列进行一键中心化、标准化、显示秩次,甚至Box-Cox变换,当然这些操作都需要建立在一个清晰的分析目的基础上。

图13 一键实现变量变换(3)

今天的文章我们分享了如何根据现有变量在JMP中利用“公式编辑器”和“新建公式列”生成满足分析需要的新变量,希望可以帮助大家在数据清洗的过程中事半功倍。

需要强调下的是,这里只是列举了几个比较常用的情况,还有非常多且同样实用的但本文没有具体介绍的公式和选项,希望大家使用一些样本数据多进行尝试和练习,体会无需编程也能快速便捷实现数据处理的乐趣。

如果你也想体验JMP生成新变量的小技巧,欢迎复制以下链接到浏览器下载JMP试用,跟着文章练起来吧!

https://www.jmp.com/zh_cn/download-jmp-free-trial.html?utm_campaign=td7013Z000002sEGsQAM&utm_source=bilibili&utm_medium=social


巧用JMP公式,让新变量的生成更简单的评论 (共 条)

分享到微博请遵守国家法律