欢迎光临散文网 会员登陆 & 注册

R语言基础数据结构

2023-02-25 14:48 作者:修身立道  | 我要投稿

R拥有许多用于存储数据的对象类型,包括标量、向量、矩阵、数组、数据框和列表。它们在存储数据的类型、创建方式、结构复杂度,以及用于定位和访问其中个别元素的标记等方面均有所不同。

1.向量

向量是用于存储数值型、字符型或逻辑型数据的一维数组。执行组合功能的函数c()可用来创建向量。

#创建向量

a <- c(1, 2, 5, 3, 6, -2, 4) 

b <- c("one", "two", "three") 

c <- c(TRUE, TRUE, TRUE, FALSE, TRUE, FALSE)

a是数值型向量,b是字符型向量,而c是逻辑型向量。单个向量中的数据必须拥有相同的类型或模式(数值型、字符型或逻辑型)。同一向量中不能混杂不同模式的数据 标量是只含一个元素的向量,例如f <- 3、g <- “US”和 h <- TRUE。它们用于保存常量。

2.矩阵

矩阵是一个二维数组,只是每个元素都拥有相同的模式(数值型、字符型或逻辑型)。可通过函数matrix创建矩阵。

y <- matrix(1:20, nrow=5, ncol=4) 

##      [,1] [,2] [,3] [,4] 

## [1,]    1    6   11   16 

## [2,]    2    7   12   17 

## [3,]    3    8   13   18 

## [4,]    4    9   14   19 

## [5,]    5   10   15   20 

cells    <- c(1,26,24,68) 

rnames   <- c("R1", "R2") 

cnames   <- c("C1", "C2") mymatrix <- matrix(cells, nrow=2, ncol=2, byrow=TRUE,                   dimnames=list(rnames, cnames)) #按行填充 mymatrix 

##    C1 C2 ## R1  1 26 

## R2 24 68 mymatrix <- matrix(cells, nrow=2, ncol=2, byrow=FALSE,                   dimnames=list(rnames, cnames))#按列填充 

mymatrix 

##    C1 C2 

## R1  1 24 

## R2 26 68

3.数组 数组(array)与矩阵类似,但是维度可以大于2。数组可通过array函数创建

4.数据框

不同的列可以包含不同模式(数值型、字符型等)的数据,数据框的概念较矩阵来说更为一般。数据框将是你在R中最常处理的数据结构。


5.因子

变量可分为名义型、有序型或连续型变量。名义型变量是没有顺序之分的类别变量。。有序型变量表示一种顺序关系,而非数量关系。连续 型变量可以呈现为某个范围内的任意值,并同时表示了顺序和数量。

无序分类(名义型)变量和有序类别(有序型)变量在R中称为因子(factor)。因子在R中非常重要,因为它决定了数据的分析方式以及如何进行视觉呈现。

6.列表

列表(list)是R的数据类型中最为复杂的一种。一般来说,列表就是一些对象(或成分)的有序集合。列表允许你整合若干(可能无关的)对象到单个对象名下。例如,某个列表中可能是若干向量、矩阵、数据框,甚至其他列表的组合。可以使用函数list()创建列表



R语言基础数据结构的评论 (共 条)

分享到微博请遵守国家法律