R -- dplyr, tidyverse, 初级数据分析快速入门 (1)

一、查看数据
(一)查看全部数据
- View(iris):用表格展示全部数据
- str(iris):总结数据主要信息
(二)查看行列数据
- dim(iris):显示行列数
- nrow(iris):显示行数
- names(iris):显示全部列名
(三)查看部分数据
- head/tail(iris)查看前/后几行
- head/tail(iris,10)查看前/后10行
二、选取部分数据
1.选取列
iris$Sepal.Length=iris[,1] 选取第一列数据
2.选取行
iris[1,] 选取第一行数据
3.选取行列相交的某个点
iris[2,3] 2行3列的数据
三、修改数据
(一)修改列
- 生成新的列
1.iris$id=c(1:150)按照1-150的顺序为每一个数据生成 id
2.用mutate
mutate(id=c(1:150)) ||mutate(id=row_number()) 自动算出行数
3.用add_column(需要安装tibble)
add_column(column_new=1)
- drop已有列
iris[,-1] drop第一列数据
- 保留特定列
- select(列1,列2)
- select(-列1)保留除列1以外的列
- 改列名
rename(新名字=旧名字,2,3)
(二)修改行
- 生成新的行
add_row(列1=1,列2=2)
- 保留特定行
subset(列1<=5&列2<=2.5) and
filter(列1<=5,列2<=2.5) and
subset/filter(列1<=5 | 列2<=2.5) or
%>%传递符
最后一个命令结束时无需%>%