为什么可以用[一-龥]来指代所有汉字
下面两个图,读者可以打开word,在插入-符号-其他符号选项中查到。
在Unicode 字符集中,基本汉字共20902个字,前10个为:“一丁丂七丄丅丆万丈三”,后10个为:“龜龝龞龟龠龡龢龣龤龥”。在后10个中我们常见的字,就是“龟”字,“龠龡龢龣龤龥”这几个很少使用。 [一-龥]里的“龥”(yù)字太难写、太难记,就使用[一-龟]来近似。所以,日常使用,基本上可以用“一”-“龟”来表示所有常用汉字。 使用正则表达式,要指代全部常用汉字,一般写成: [\u4E00-\u9FA5](上图中红色框住的部分) 同时,在微软word和WPS文字中,使用替换功能时,也都可以使用:
所有数字的集合:[0-9] 所有英文字母的集合:[A-z],这种写法还包含了"[\]^_`",这6个符号,见图3橙色部分