古籍数字化的主角不应该是AI
在古籍数字化领域,因为近些年AI技术得到了突破性的发展。使得古籍OCR的生产效率,有了巨大的提升。
然而,关于古籍的核心问题,却不是数字化能够解决的。
OCR的技术,在不久的将来,就毫无神奇之处。就像在不久前,什么人工智能客服还是一个很新鲜的玩意儿,几年时间,就已经遍地开花了。
AI技术的发展,日新月异,人类永远追不上AI的发展速度。
古籍的问题,核心在于,谁来看?谁来解释,谁来演绎?
OCR技术,只能解决存放问题,却不能解决看不看的问题。因为,基本上没什么人看。
另外,ChatGPT的出现,已经展现出了,机器人的阅读能力。所以,连看书都可以由机器人看了。
这样的思路发展下去,将成为由AI主导,而不是以人为本了。
围棋的产生,最初的本意,只是一种启蒙工具,就像是教具罢了。而后来人类把围棋异化成了一种竞技工具。我想AI的出现,正是来收拾这种异化的。你把围棋搞成了竞技,那么AI比你还厉害。这样有什么意义?
同样的问题,会出现在各个AI领域。古籍数字化只是冰山一角。
数字化工作,不能片面追求效率。比如,在多少时间完成了多少的页数,多少册。校勘了多少。
然而,却拿不出精品。AI搞出来的东西,是没有质量的。他可以成到良好或优秀的程度,但离开了人的参与,很难达到大师和卓越的水平。
像这种粗制烂造的数字化产品,其实并没有太大意义。关键的问题在两个:
1、数字化之后,还是没人看。
2、数字化的成果,是粗制烂造品。
说一句难听的,如果连参与数字化工作的成员,自身都沦为了工具校对人的话,自身都无法从校对工作中有所提升的话。
或者,参与校勘的工作人员,自身如果都不看不研究这个本子的话,你还指望后人会来看这种本子?
现在的书就已经够多了,信息社会爆炸,将来的信息量更不用说了。现在当代的人,都不愿意看,没时间看。
还指望给后人看?真是扯了淡了。
所以,这样的工作成果,其实并不会产生真正的效益,只是产生了一种考核业绩。但他并不会对社会产生太大的效益。
一次优秀的校勘工作,不应以数量为导向。
而应以下为考核核心目标:
1、项目组成员,本身是否热爱了,研究了这本古籍。这是核心的。假设有以下两种情况。第一种情况是,项目组成员本身热爱并研究了古籍,但最终数字化工作没有完成,或数字化的成果是粗制烂造的。
第二种情况,则是项目组以数字化成果为导向,最后拿出了一个精美的数字化版本。但项目组成员,本身就是工具人,根本不会去看这个本子。而这种工作方式,显然产量更大一些。这就像那些打了农药的蔬菜一样,没什么营养价值。
在这两种情况下,我对校勘工作的思路就是,毅然选择第一种工作方式。坚决抛弃第二种工作方式。
因为,只要有原本的扫描件,其实根本无所谓有没有做数字化工作。而AI技术的发展,也可以把人从这些工作当中解放出来。
想象一下,一个项目组,花了一年时间,把一册校对完了。结果AI一升级,你发现,你一年时间投下去的产出,人家AI几分钟就给你搞定了。因为AI升级后,校对准确率就会大大提升。
那么到时,这个项目组会后悔,会觉得自己这一年的投入不值得。因为本身最初你们追求的目标,就是错误的目标。
然而,如果在这一年时间内,项目组聚焦于围绕古籍的研学,讨论,自我提升,而度过了这一年时间,顺便把成果汇集于一个数字化成果上。但这个数字化成果可能是呈现出来粗制烂造的。
一年之后,项目组成员,是不会后悔的。然后AI技术一升级,一下子把这个粗制烂造品,打造成精品了。
根据我对AI技术的理解,千万不要走入死胡同。追求一个结果,生产力,最后一定会后悔。
古籍要活起来,必须是活在人的心中。而不是活在一个数字化的文档上面。
因此,古籍数字化工作,应该要围绕,让古籍活起来,让古籍活在参与者的心中,为核心目标。
一切的工作展开也要围绕这个目标。而不是一个电子文档。
文档只是转化了一种形式,把繁体字,转成了简体字。排版换一换,加一些标点。把纸质载体,变成了数字化的载体。仅此而已。没有什么太大作用的。并且这些劳动,将来会廉价到任何人手机上都唾手可得。并没有太大意义。
另外,有关古籍数字化的一个意义。说是方便于检索,以及产生信息的联结。目前很多卡片式笔记系统,就是在做这块的工作。
检索有一定意义,但检索要建立在校对完成的基础上。如果本身没有经过校对,这个质量会差一点。但并不是完全没有意义。
还有一点,简单的检索,其实意义并没有那么大。信息的连结,也要讲一个性价比。
投入产出比的一个问题。为了建立一个检索,或信息连结,如果要耗费太多人力财力投入进去,其实是得不偿失的。
顺便提一点,最好的检索和联结,是大脑。这是脑科学领域的问题。使用电脑,其实并不是最优选择。
因为,如果照这个思路的话,人根本没有必要去学习。学习的工作,交给ChatGPT就可以了。
机器人的学习能力,比人类还强,还要你人类学习干嘛呢?靠ChatGPT这套系统,你把数字化后的古本扔进去,人家机器人,学得还比你快,比你好。何必数字化的成果,要给人类去学习呢?完全没有必要的。
然后,人有什么问题,直接问机器人就可以了。
但关键问题还是,如果人没有经过这样一个过程,机器人就算告诉你,你也听不明白。你还是必须要走这个流程。
这不是数字化和人工智能能够解决的问题。靠这些能够解决的问题,压根就不是什么问题。
总之,古籍方面的工作,大方向,要围绕着让这个古本,活在人类的心中,人去阅读书,人与书产生一种紧密的心灵连接。
而AI,或是古籍OCR系统,会打断这种连结。会干扰这种连结。
这是一条错误的发展道路。人最终会沦为AI的附属,成为一个工具人。
而以人为本的发展路线,是人成为书的主人,AI作为一种辅助式工具,把人从繁杂的重复工作中解放出来。这样,AI成为了人的附属。
这是两种不同的发展理念。