欢迎光临散文网 会员登陆 & 注册

【D1n910】正则表达式入门(四)

2019-06-10 02:32 作者:爱交作业的D1N910  | 我要投稿

正常操作,正常分析,大家好,我是D1n910

当你看完之前三期的内容

你会发现,这个该死的D1n910怎么那么慢,怎么教了这么久还没教完!

因为我实在是太菜了,俺也是在边学边写教程——通过要写教程,所以强迫寄己去学习。

还有一小部分就“学完”,加油加油加油(对你和我自己说)

十、反义

hello,hello,大家好,我是出久的死忠粉,我喜欢带有“出”和“久”的弹幕,只要没有“出”和“久”的弹幕,我都不要,通过反义就能够实现我们的需求。


通过通过上面的表,我们可以知道,使用"/^[^出久]*$/"就可以实现我们刚刚的需求了。

"/^[^出久]+$/"的意思是,从字符串开头(^)匹配【非“出”、“久”】([^出久])的字符,匹配零次或者无数次(*),一直匹配到字符串结尾($)。

* 如果不添加 "^" 或者 "$" 这两个元字符,会导致字符串中虽然有出久,不过如果有其他的非“出”“久”的字符串,还是会匹配成功。

十一、向后引用

通过之前的学习,我们学会了使用分组来重复匹配一组字符串,需要提到的一点是,分组内部本身也支持各种元字符,比如 “|” 这个元字符。

当我们希望对同一个字符串内容,在不同地方进行重复匹配。

举个例子,我们想要匹配同样的字符串出现多次的情况——我是《我的英雄学院》,绿谷出久和爆豪胜己的忠实兄弟粉丝。

我能够接受有粉丝把他们的名字单个组合在一起,出现一次,比如“胜久”,不过我不能够接受他们重复比较多的次数,比如“爆久爆久”,这是我不能接受的。

不过类似“爆久胜出”的,我能接受。

那我应该怎么屏蔽这样的弹幕呢?

单纯地使用"/(爆久){2,}/"只针对了爆久这种情况,对于“胜久”这种情况无可奈何。

思路很简单。

用“/([绿谷出久爆豪胜己][绿谷出久爆豪胜己])/"可以匹配“绿出”"绿谷"“绿豪”......“胜豪”,然后就用到了我们【向后应用】的概念,通过使用 "\1"来再次把刚刚匹配到的字符串内容拿来匹配!

向后引用的意思就是在后面可以引用前面匹配到的内容,主要用到了分组“()”的特性。对于分组“()”来说,它默认从左到右开始,以第一个左括号为默认分组序号1,第二个括号默认分组序号2...

1、观察下面这个例子,通过使用括号,我们分成了两个组,\1: (0|1),\2:(4321|456),因为\2对应的组已经匹配到了4321了,则它本身对应的字符串就是4321,而不能是456。

分组内也可以嵌套分组,只要按照“左括号”对应分组,“左括号”顺序对应【默认分组】序号即可,观察下面的例子。

2、我们希望分组拥有自定义的名称,而不是默认的序号表示,我们可以在左括号右边写"?<自定义分组名称>",引用的时候,使用"\k<自定义分组名称>"。下面是一个小例子:

当然,这也不妨碍默认分组的序号

3、如果我们不想括号有分组名称,包括默认分组名称,我们可以在对应左括号右边写"?:"

比如下面的例子,将默认分组名称序号1内部分组用"?:"去掉默认分组,那么下一个本来是第三个左括号的分组的默认序号久变成了2了。

上面描述的情况,就是捕获元字符的使用方式

注意:?'name'的自定义分组方式JS代码不能实现

正则表达式学习进度(11/18)

【D1n910】正则表达式入门(四)的评论 (共 条)

分享到微博请遵守国家法律