欢迎光临散文网 会员登陆 & 注册

R -- dplyr, tidyverse, 初级数据分析快速入门 (2)

2022-03-06 13:25 作者:六月忘了看太阳  | 我要投稿

一、对行列的修改

(二)、对整体的修改与调整

1.调整数据

·分组group_by

group_by(Species)

summarise(PL_mean=mean(Petal.Length),SW_mean=mean(Sepal.Width)

mutate(PL_mean=mean(Petal.Length),SW_mean=mean(Sepal.Width)

ungroup()

·排序arrange

arrange(Sepal.Length, desc(Sepal.Width)

·去重distinct 保留每个类第一次出现的数值

distint(Species,.keep_all=TRUE)

·字段拆分与合并

按照分隔符拆分;将分段的字符串合并到一个字符串中,合并各段字符串中间会有一个间隔。

join:将多个表进行连接操作

bind:按行/列合并数据集的函数

2.变量的转化

(1)将连续变量转化为分组变量

mutate(grade=case_when(

  subID>=4000~”forth”,

  subID>=3000~”third”,

  subID>=2000~”second”,

  subID>=1000~”first”

))

(2)将含有相同元素的变量统一转化名称

mutate(status=case_when(

  subID==”1”~”active”,

  subID==”0”~”inactive”,

  subID==”8”~”unknow”,

))

R -- dplyr, tidyverse, 初级数据分析快速入门 (2)的评论 (共 条)

分享到微博请遵守国家法律