欢迎光临散文网 会员登陆 & 注册

R -- dplyr, tidyverse, 初级数据分析快速入门 (1)

2022-01-21 21:28 作者:六月忘了看太阳  | 我要投稿

一、查看数据

(一)查看全部数据

  1. View(iris):用表格展示全部数据
  2. str(iris):总结数据主要信息

(二)查看行列数据

  1. dim(iris):显示行列数
  2. nrow(iris):显示行数
  3. names(iris):显示全部列名

(三)查看部分数据

  1. head/tail(iris)查看前/后几行
  2. head/tail(iris,10)查看前/后10行


二、选取部分数据

1.选取列

iris$Sepal.Length=iris[,1] 选取第一列数据

2.选取行

iris[1,] 选取第一行数据

3.选取行列相交的某个点

iris[2,3] 2行3列的数据


三、修改数据

(一)修改列

  • 生成新的列

1.iris$id=c(1:150)按照1-150的顺序为每一个数据生成 id

2.用mutate

mutate(id=c(1:150)) ||mutate(id=row_number()) 自动算出行数

3.用add_column(需要安装tibble)

add_column(column_new=1)

  • drop已有列

iris[,-1] drop第一列数据

  • 保留特定列
  1. select(列1,列2)
  2. select(-列1)保留除列1以外的列
  • 改列名

rename(新名字=旧名字,2,3)

(二)修改行

  • 生成新的行

add_row(列1=1,列2=2)

  • 保留特定行

subset(列1<=5&列2<=2.5) and

filter(列1<=5,列2<=2.5) and

subset/filter(列1<=5 | 列2<=2.5) or


%>%传递符

最后一个命令结束时无需%>%

R -- dplyr, tidyverse, 初级数据分析快速入门 (1)的评论 (共 条)

分享到微博请遵守国家法律