R语言学习心得历程-第一周(暗中摸索、毫无章法)
1.使用data.table程序包读入数据的方法
①R语言软件菜单中找——程序包→设定CARN镜像,选择china(Guangzhou)安装即可,其他也可以。
②选择菜单中——程序包→安装程序包——选择→data.table,安装即可(因为要用到其中的fread函数)
③在使用fread函数之前,还需要运行程序——install.packages("bit64")
④安装之后就可以使用fread函数了,代码如下:
data<- fread("data.txt",header=FALSE,sep=",",encoding="UTF-8")
其中data.txt,是定义的数据文件名字,在使用fread函数之前需要将数据文件(即data.txt)放在软件固定存放点(可由代码—— print(getwd())——得到位置信息)
心得:数据的读入工作,是对数据进行的结构上的定义,是为了后续分析而做的准备,不同的函数,得出的数据结构是不同的。需要根据后续的分析,选择数 据读入的方法。
程序代码:步骤①②结束之后
>install.packages("bit64")
>library(data.table)
>data<- fread("data.txt",header=FALSE,sep=",",encoding="UTF-8")
>data
2.数据读入之后的简单代码操作
①View(data),可以用来可视化读入的数据;
②print(ncol),可以用来显示数据的列数;
③print(nrow),可以用来显示数据的行数;
④max()函数的应用,执行如下代码,可以得到V5(播放次数)的最大值:
v5<-max(data$V5)
print(v5)
⑤比④更详细的信息,可以用如下代码实现(利用subset函数):
details<-subset(data,V5==max(V5))
print(details)
⑥利用subset函数的条件筛选功能:
info<-subset(data,V5>1000)
print(info)