R数据处理-绪论
R软件是一个包的集合。
包是关于函数、数据集、编译器等的集合,也是R语言的核心,可划分为基础包(Base)和 共享包(Contrib)两大类。
R软件下载:www.r-project.ohttp://www.r-project.orgrg
R语言区分大小写。
R语言路径使用 / 或 \\ , \ 为转义字符。
工作空间
工作空间就是当前R的工作环境,存储着所有用户定义的对象(向量、矩阵、函数、数据框、列表)。
程序包
R程序包下载:http://cran.r- project.org/web/packages
基本语法
数据类型
数值型 numeric:100, 0, -3.14
字符型 character:“China”, “china”
逻辑型 logical:TRUE, FALSE
因子型 factor:有次序信息的字符型
数据结构
标量:单位为1的向量
向量:用于存储数值型、字符型或逻辑型数据的一维数组,必须是同一数据类型
矩阵 matrix:二维数组,每个元素都有相同的模式(数值型、字符、逻辑型)
x[3,2] 表示矩阵x的第3行、第2列元素
x[c(1:3),c(2,4)] 表示x的第1-3行、第2与4列的元素
数组 array:与矩阵类似,但维度可大于2
数据框 data frame:R中最常用的一种数据结构, 类似数组,但允许不同列包含不同的模式(数值、字符、因子等)
因子 factor:表示一组数据中的类别,可以记录这组数据中的类别名称及类别数目
列表 list:一些对象的有序集合,是R中最复杂的数据结构,允许包含向量、矩阵、数据框和列表
运算符
算数运算符
^ 乘幂
/ 除
%% 模运算 (取余)
%/% 整数除法 (取整)
比较运算符
== 等于
!= 不等于
逻辑运算符
&& 标量的逻辑“与”运算
|| 标量的逻辑“或”运算
& 向量的逻辑“与”运算
| 向量的逻辑“或”运算
! 逻辑非
数据中心化和标准化