R -- dplyr, tidyverse, 初级数据分析快速入门 (2)

一、对行列的修改

(二)、对整体的修改与调整
1.调整数据
·分组group_by
group_by(Species)
summarise(PL_mean=mean(Petal.Length),SW_mean=mean(Sepal.Width)
mutate(PL_mean=mean(Petal.Length),SW_mean=mean(Sepal.Width)
ungroup()
·排序arrange
arrange(Sepal.Length, desc(Sepal.Width)
·去重distinct 保留每个类第一次出现的数值
distint(Species,.keep_all=TRUE)
·字段拆分与合并
按照分隔符拆分;将分段的字符串合并到一个字符串中,合并各段字符串中间会有一个间隔。
join:将多个表进行连接操作
bind:按行/列合并数据集的函数
2.变量的转化
(1)将连续变量转化为分组变量
mutate(grade=case_when(
subID>=4000~”forth”,
subID>=3000~”third”,
subID>=2000~”second”,
subID>=1000~”first”
))
(2)将含有相同元素的变量统一转化名称
mutate(status=case_when(
subID==”1”~”active”,
subID==”0”~”inactive”,
subID==”8”~”unknow”,
))