大模型时代的胜出者:专利审查员
这并不是一篇水文而是一篇基于科学的严肃的论断,首先所谓的胜利者更应该被描述成幸存者,其次一定要加专利审查员而不是什么其他的审查员,因为大模型的能力对不同的工种影响大不同。
我们经过对大模型的仔细研究和深度开发利用,当前可以非常明确类似律师、代理人等涉及思维链逻辑的文字工作者们而言,剩下的时间都是残值时间,出局的节奏取决于算力的便宜程度以及政府政策是否会激进推动人类在相关行业的绝对主导意义,本质上,当前的科技已经解决了所谓律师、代理人等相关的业务模式了。
看到这里可能很多人都疯了,感觉专利审查员哪里比律师们还牛了,没看出来啊,凭什么啊?!其实我们具体把专利审查员的工作细分一下:检索+评述。评述部分事实上也一并如同律师与代理人,这些工作完全可以由大语言模型来胜任,但是检索还真不行!
什么叫行,什么叫不行。如果把我们的工作目标用文字描述给大语言模型,模型可以根据指令直接完成目标,那么就叫行。目前看来文字类撰写工作均可以完美实现,在通用类大模型上有瑕疵的也可以通过微调来完善实现。
但是检索,专利检索,当前并不存在一键检索,即一个命令就得到最佳检索结果,而且经过我们认真的研究大语言模型的能力后,非常确认这一点,即真的没有所谓的一键获得检索结果,而且不是卡算力,也不是卡微调,更不是做个embedding、整个向量库就能解决的问题,而是本质上不行!
大模型的深度神经网络和惊人数量的参数量真正帮助到的是理解了语言本身,而我们聚集的看专利检索这个具体的任务,其本质上是在找相似,而且是在将近两亿文献中寻找两两相似,大模型即便把这些专利统统进行训练,那么后期要完成这个具体的任务也是需要靠建立向量并比较向量之间的余弦值而不是说训练过所有的专利了,然后就准确的记忆并能够比较两两了,这个从模型基础上本身不存在这样的先决条件。
那么进行向量建立和比较向量值其实在大模型这里本身属于“阳光底下没有新鲜事儿”,无法是利用传统的向量工具进行向量建立,比如bm25,bert,或者用大模型自己的能力来建立一下,但是此时所谓大模型自己的能力也就是基于transformer架构。注意,此时构建模型,无论你使用那种方式,本质上是根据一个向量构建的数学规则把一段话或短如一个词或长如一整篇专利申请,来建立一个对应的向量值。在这个过程中,根本不存在所谓的大模型深层神经网络的作用!
也就是直白的讲,大模型能力确实强,但是和你具体建立一个向量的模型,两者之间没有关系。那么很多需要后面跟着理解分析的语言任务,其实是后续利用大模型本身的优势去完成了。但是专利检索本身就是一对一的向量比较这么简单粗暴,大模型也没有任何更好的办法去比较它们的两两相似性了。
所以一切的问题又都回到了本源!即如果当前对于语义向量的编码效果(特指后期用于向量比较任务)没有什么本质提升,则依然检索任务效果没有提升!
这也是包括我们在内的很多业内人士们经过尝试后的真实结论。
说到这里,我们想表达三个想法:
第一、尽管专利检索看起来非常枯燥,似乎就是一个力气活儿,但是当前的生成式人工智能所解决的问题却真的有可能暂时放过“力气活儿”;
第二、解决这个检索问题,即有朝一日可以一键检索到最佳对比文件,我们认为其本质上是一个数学问题,更类似蒙特卡洛梳妆搜索那样的数学问题,终极解决方案是什么,在哪里,我们也需要探索,但是我们在探索的路上肯定更有底气!
第三、专利审查员,乃至广大专利检索工作者,相信我们的产品就是这个时代的科技底色,采用我们的产品成为这个时代的科技王者!