GB 18030中文编码字符集2022版有啥区别。


在新发布的GB 18030-2022中,对 GB 2312-1980 完全向后兼容,与 GBK 基本向后兼容,并支持 Unicode(GB 13000)的所有码位,将于 2023 年 8 月 1 日正式实施。
GB 18030-2022 共收录汉字 87887 个,比上一版增加录入了 1.7 万多个生僻汉字。
目前在用的还是2005年11月8发布,应用于2006年5月1的GB 18030-2005。
具体效果可以查汉子字符集编码表来看;
在GB 18030-2000中,收录的27533个汉字。


而在GB 18030-2005中则收录了70244个汉字。

可以看到在四字节部分,2005比2000多了CJK统一汉字扩充B的42711个汉字。
而2000的27533+42711刚好等于2005的70244个汉字。
GB 18030-2022
而在2022中,会收录汉字87887个,那么扩充C的字符数可以通过加减法得到,
87887-70244=17643
至于为什么要用GB 18030看下图就明白了:

