《中国大百科全书》中的“基于规则的机器翻译”
01基于规则的机器翻译| RBMT
《中国大百科全书》(第三版·网络版)发布了黄国平博士撰写的“基于规则的机器翻译”词条。现转录如下,以资交流。
基于规则的机器翻译(rule-based machine translation)是指利用语言学规则和词典完成翻译的机器翻译技术。简称RBMT。
基于规则的机器翻译最早出现在20世纪70年代初期,此类机器翻译的代表有1970年乔治城大学研制的第一代自动翻译系统 Svstran和20世纪80年代欧共体赞助设计的多语翻译系统Eurotra。典型的基于规则的机器翻译方法包括转化法(transfer based)、中间语法(interlingual)以及辞典法(dictionary-based)机器翻译。语言学规则模块主要包括源语言词法分析器、源语言句法分析器、源语言语义分析器、转换器、目标语言词法生成器等目标语言句法分析器。词典可以分为源语言单语词典、目标语言单语词典和双语词典。
基于规则的机器翻译具有可解释性、形态准确性的优势,因此在特定领域表现不错,但明显的不足是需要大量的专业人力。同时,针对不同语种的表示方式差异性较大,很难用统一的规则进行转换,跨领域效果不好且难以迁移。因此,基于规则的机器翻译已被摒弃,但其思想值得借鉴,例如基于中间语言的机器翻译。同时,在形态层面、句法层面甚至语义层面的表征方面成果还被继续使用。
02作者简介
黄国平,博士,腾讯翻译负责人,腾讯AI Lab专家研究员,毕业于中国科学院自动化研究所,研究方向为机器翻译、自然语言处理。长年专注于交互翻译的研究与应用,在ACL、AAAI、IJCAI、EMNLP等人工智能领域顶级会议与TASLP等顶级期刊发表论文20余篇。
03文献来源
原文发表于《中国大百科全书》第三版网络版,欢迎各位学者阅读、分享。
翻译圈公众号旨在为读者提供名师和专家对口笔译的真知灼见,CATTI考试和MTI入学考试信息,翻译等语言服务就业资讯,以及口笔译学习资源和知识,希望在翻译之路上,为大家助上一臂之力。欢迎大家积极留言,为我们提供建设性意见,我们共同进步!
转载来源:《中国大百科全书》第三版网络版