科研代码大全|小云大课堂:三分钟实学会字符串处理函数
大家好,本期小云将向大家介绍R语言中的字符串处理函数。跟着小云每天进步一点点吧!
1. paste函数:
用来把自变量连成字符串,中间用相应的分隔符(可以设置sep、collapse参数
举个栗子:

2. split函数
strsplit:用来把它的自变量按分隔符(split表示分隔符)分割成多字符串
举个栗子:

3.大小写转换:
toupper(x) tolower(x)

4. 字符串截取函数:substr(x,start,stop)
举个栗子:

5.字符串匹配:grep(pattern,x);grepl(pattern,x)
字符串替换:gsub(pattern,replacement,x,…)
举个栗子:

接下来我们介绍一下R语言的字符串匹配:正则表达式
正则表达式是描述文本串模式的一种方法。正则表达式中常见的元字符有:. \ () [] {} ^ $ * + ?
如果想在正则表达式中让元字符恢复其字面意思,则需要在该字符前添加一个反斜线\。又因为反斜线\本身也是一个元字符,所以我们首先需要添加一个反斜线\让反斜线本身回复其字面意思。所以在R语言中如果要在正则表达式中恢复元字符的字面意义,我们需要在元字符前添加双斜线。
举个栗子:
sub()函数用于替换字符串中模式的第一个匹配项

R语言中,出现在一个字符常量中的反斜线\用于标示转义字符串的开始。R语言中合法的转义字符串有下面一些:
\n 换行、
\r 回车符
\f 换页符
\t 制表符
\v 垂直制表符(tab)
等等
如果反斜线后的转义字符不在范围内,系统就会报错。例如,要在字符常量中输入反斜线,我们需要输入两个反斜线,即\\。
大家学会了吗?以上就是本期的内容啦!小云再给大家介绍一个单细胞分析的小工具:单细胞分析(http://www.biocloudservice.com/366/366.php),能够在线输入数据,并快速输出结果,大家一起来使用吧。欢迎来和小云交流讨论哦。