正则表达式基础
1.特殊单字符
英文的点()表示换行以外的任意单个字符,d 表示任意单个数字,w 表示任意单个数字或字母或下划线,s 表示任意单个空白符。另外,还有与之对应的三个 D、W 和S,分别表示着和原来相反的意思。
2.空白符
不同的系统在每行文本结束位置默认的“换行”会有区别。比如在 Windows 里是rn,在Linux 和 MacOS 中是 n。在正则中,也是类似于 n 或r等方式来表示空白符号,只要记住它们就行了。平时使用正则,大部分场景使用s 就可以满足需求,s 代表任意单个空白符
3.量词
在正则中,英文的星号(*) 代表出现 0 到多次,加号 (+) 代表 1 到多次,问号 (?) 代表0到1次,{m,n代表 m到n 次。
4.范围
在正则表达式中,表示范围的符号有四个分类,如下图所示
或,如 ablbc 代表 ab 或 bc
比如 ablbc 能匹配上 ab,也能匹配上 bc.
中括号[]代表多选一,可以表示里面的任意单个字符,所以任意元音字母可以用[aeiou] 来表示。另外,中括号中,我们还可以用中划线表示范围,比如 a-z] 可以表示所有小写字母。如果中括号第一个是脱字符 (^) ,那么就表示非,表达的是不能是里面的任何单个元素。比如某个资源可能以 http:// 开头,或者 https:// 开头,也可能以 ftp:// 开头,那么资源的协议部分,我们可以使用(https? lftp) /来表示。

