今天遇到个需求,在几十万行的文本中替换一些关键字。
这还不简单吗,直接正则硬搞,一堆胡乱操作之后,效果实现了,结果一万行的替换一下就要好几秒,这正则也太慢了(估计是我太菜了)。
然后百度一顿乱搜,发现了个**的库,叫FlashText,可惜是python的,我js也用不了。
不过还好,github上有大佬写好的js版本,一顿cv之后,还真跑起来了,效率吊打正则,几十万行秒替换。
百度搜了搜原理,好像是ac自动机之类的,看也看不懂,下辈子去学学。