R教程 | R语言简介

前言
和大家一样,我也是R语言的学习者,本系列文章记录我的学习过程。学习是痛苦的,至少对我来说是这样。因此我尽量采用通俗一点的语言描述代码内容,希望大家能够愉快轻松的阅读本系列推文。
以往的R系列教程总是先从数据结构讲起,先说理论内容总是有些枯燥。所以我们改用Code first教学,直接讲代码。将有关数据结构、向量之类的理论内容融入在代码教学之中,遇到那些问题解决哪些问题。
大部分示例,来自于孙振球主编《医学统计学(第四版)》,公众号内部回复“R语言示例”,获得所有示例数据。
本片推文中,我们先认识一下R语言吧!
什么是R语言
R语言可以说是专门为统计学而生的语言。1992年,新西兰奥克兰大学的Ross Ihaka 和 Robert Gentleman为了方便的讲解统计学课程,因而设计了这门语言。两位教授的名字首字母都是R,因此将这门语言称作R语言。
R语言的优点
与Python一样,R是一个开源语言,这意味着他有活跃的人群共同开发,以便R语言变得更好,2020年R4.0.0发布时,CRAN上的宏包数量已经达到了16054个,几乎所有统计学操作都可以找到对应的R包应用。
与python的区别
python是一种通用的编程语言,不仅可以用于数据分析,也可以用于其他的计算机项目。而R是专门为统计学项目而生的。术业有专攻,尽管python的用途更广,但和深耕统计学领域二十余年的R语言相比,还是稍逊一筹。在学术领域,R语言几乎是统计学工作者默认使用的计算机语言。
R的缺点
数据管理:R的弱势在于数据管理,处理大文件时,使用R的速度会比较慢。这种情况下,可以在其他环境将数据处理好,再导入到R中进行分析。熟练的数据工作者通常擅长使用不同种类的统计软件,发挥各软件之所长。比如另一大统计软件SAS,在数据管理上就很有优势。
宏包的可靠性:R官网上有数以万计的宏包可供使用,但没有专门的人员进行质量把关,因此使用上要谨慎。另外,R的版本更新较快,可能会出现宏包不匹配的情况,低版本下编写的宏包可能不适用与更高版本的R语言。
以上是对R语言的一个简要介绍,之后要使用的案例数据请在公众号后台回复“R语言教程示例”下载
快来关注俺!!!