吐谷渾、pIqaD、水书…“最大”字体「典迹末境」Next:超统一码(更新中)NotoUni7.2
我喜欢写点置顶都没人看的文章。
虽然评论区偶尔有人留言“快去看up空间”,但其实后台能看到留言的也没一个点进来看置顶文章的,因此写文的目的实际上是给自己当前成果的归纳和备忘。

[ github.com/MY1L/Unicode#monu-last ]
Monu Last「典迹末境」,我b站的旧介绍视频:[1个对应111万4112个字符的字体],用途类似Last Resort「最后手段」字体。 Monu,Monument「典迹」缩略,起初是无衬线体“Montserrat”改,后来我的非完全原创字体名称都统一用这个开头。
6,5536×17=111,4112,这是Unicode「统一码」1个基本平面加16个增补平面总共字码量的上限。能支持全部字码的自然“都”是最大字体,典迹末境已经是了。
那还能更大吗?如果是收录统一码没有的呢——那就只能放统一码私用区了:超出统一码范围的,当前软件都不支持。
而标题里3个统一码没有的文种分别对应3种情况:
吐谷渾:根本没编码方案的未知文种。
pIqaD:统一码拒收的克林贡(克语 皮卡德)
水书:位于统一码路线图中的待收录文种。


于武周时代吐谷浑喜王慕容智墓中发现了唯一一处除了柔然婆罗米石碑之外的鲜卑文[刘兵兵 陈国科 沙琛乔,2021,唐《慕容智墓志》考释] www.douban.com/note/814716125/
如回纥在创造自己的文字时借鉴了突厥文,而突厥文又和日耳曼人的如尼文有很多相似之处。据此我们有理由相信《慕容智墓志》侧面发现的文字应是吐谷浑慕容鲜卑所创本民族文字,或可称之为“吐谷浑文”,这也是目前所见依据汉文所创造的年代最早的游牧民族文字。
“吐谷(yù)浑文”是个拟称,不说成更通俗的“鲜卑文”,是因为我们还不清楚鲜卑的文字是不是就等于吐谷浑文。据说现有全部样例就上面这张图——甚至不清楚是几个字(比如我标出的蓝框里是一个固定词组还是一个“字”?请参考契丹小字),这没法编码的。
本来要做成无衬线体,想想还是不了。

古今文字集成认为类似契丹文(大、小都有),尝试套契丹文释义了一部分,可以一看:
吐谷渾喜王慕容智墓出土未知文字 | www.ccamc.co/blog/?p=551 2021年5月30日
唐《慕容智墓誌》的吐谷渾文 | www.ccamc.co/blog/?p=598 2021年6月28日

克林贡(克语 皮卡德),ISO 15924记录为Klingon (KLI pIqaD),缩写 Piqd
这个是被统一码一脚踹出门,明确标出绝不会收录的人造语言,原因其实我以前有说过:统一码不能编码有版权隐患的东西,不能将来发一段纯文本还要付费。而克林贡文版权似乎属于派拉蒙影业……指望派拉蒙开源是想多了。

这里我参考《星际迷航》新剧集里的无衬线体克林贡文“tlh”。tlh是“克林贡语(tlhIngan Hol)”头文字,也是 ISO 639 中克林贡的语言代码。
至于ISO不需要在乎版权隐患,是因为它只是指定代码,不用编码字形。

(没写完,我先出个门……)

顺带一提,我的“大全”型字体 Noto Unicode 今天发布7.2版了,更新内容如下链接:
github.com/MY1L/Unicode/blob/main/NotoUnicode/NotoUni7.md#2023-4-2-v72
这一版总字形数约21725个,对应字码约21755个。值得一提的是它在 Noto Sans Kawi 尚未发布前就支持统一码15.0新增的克维(Kawi)区段。在此之前人们只能用巴厘(Balinese)和爪哇(Javanese)区段的字符来充当克维文字。