三分钟科普|翻译多维质量标准(MQM)如何给译文打分?
翻译多维质量标准 Multidimensional Quality Metrics (MQM) 是一种翻译质量评估框架,可以对人工翻译和机器翻译进行翻译质量评测。作为欧盟资助的QTLaunchPad和QT21项目的一部分,最初由德国人工智能研究中心(DFKI)发布。本文将从MQM背景、错误维度、错误类型和记分卡设置四个方面对MQM进行简单介绍。
1 MQM背景
MQM基于LISA QA Model、SAE J2450和ATA标准化错误标记框架,参考其错误类型,但采用了更加模块化的方法。起初,TAUS和DFKI与LTAC Global合作,创建了DQF:MQM。DQF:MQM是一个基于初版MQM和TAUS动态质量框架的错误类型集合。随后,DQF错误类型成为 MQM 的一个子集,逐渐被MQM核心架构(MQM-Core)取代。
2 MQM错误维度
MQM将翻译错误主要划分为7个维度,分别为:
- 术语(Terminology)
- 准确性(Accuracy)
- 语言惯例(Linguistic conventions)
- 风格(Style)
- 区域惯例(Locale conventions)
- 受众适应性(Audience appropriateness)
- 格式与标记(Design and markup)
3 MQM错误类型
MQM在七个错误维度的基础上,又将其细分为了不同的错误类型:
(一)术语
- 与术语库不一致(Inconsistent with terminology resource)
- 术语上下文不一致(Inconsistent use of terminology)
- 术语错误(Wrong term)
(二)准确性
- 误译(Mistranslation)
- 过译(Over-translation)
- 欠译(Under-translation)
- 增译(Addition)
- 漏译(Omission)
- 不应译(Do not translate)
- 未译(Untranslated)
(三)语言惯例
- 语法(Grammar)
- 标点(Punctuation)
- 拼写(Spelling)
- 不可理解度(Unintelligible)
- 字符编码(Character encoding)
(四)风格
- 组织风格(Organizational style)
- 第三方风格(Third-party style)
- 与外部参考不一致(In consistent with external reference)
- 语域(Register)
- 不自然(Awkward style)
- 不符合语言习惯(Unidiomatic style)
- 风格不一致(Inconsistent style)
(五)区域惯例
- 数字格式(Number format)
- 货币格式(Currency format)
- 测量格式(Measurement format)
- 时间格式(Time format)
- 日期格式(Date format)
- 地址格式(Address format)
- 电话格式(Telephone format)
- 快捷键格式(Shortcut key)
- 特定文化参考(Specific culture reference)
(七)格式与标记
- 字符格式(Character formatting)
- 排版(Layout)
- 标记标签(Markup tag)
- 删节或超出边框(Truncation/text expansion)
- 缺少文本(Missing text)
- 链接不正确或无效(Link/cross-reference)
可见,MQM从文本和格式两个维度都对翻译错误进行了分类,且错误类型划分较为全面、详细,有助于对人工翻译或机器翻译进行细粒度的质量评估。
4 MQM记分卡
MQM采用记分卡的形式对质量评估结果进行量化,评估人员根据这些错误类型、严重性等将识别的翻译错误分配数值,使评估结果更加直观。
在MQM记分卡中,可以设置无错误(None)、轻微错误(Minor)、主要错误(Major)、严重错误(Critical)四个档位的严重程度,分别可代表0分、1分、5分、10分的罚分分值(但该分值在具体评估过程中可适当调整),并可以对不同的错误类型分配权重(Weights)。评估流程根据评估人员统计出的错误数量,乘以罚分分值,自动得出总罚分,再根据所评估的总字数,计算出字错率,最后计算出译文得分,根据所划定阈值(Threshold)确定译文是否通过质检。
公式为:错误率=错误数量*罚分值*权重值/总字数正确率=(1-错误率)*100

在这种方法中,MQM将错误数量、错误分值、评估字数、阈值等数值综合考量,尽可能地保证了结果的科学、客观。
由上可见,MQM质量评估方法具备一定科学性、客观性,从多维度对翻译质量进行考察,并量化评测结果,是对过于主观的传统质量评测方法的改进;MQM质量评估方法也具备一定创新性,在结合了多种评估模型后,不断完善其错误类型和维度,将受众适应性、语言风格、格式等均纳入评测内容,进一步形成了更为全面的评测体系;此外,MQM质量评估方法也具备一定可操作性,在实际操作中,评估人员可以根据其设定的步骤(维度-方法-错误类型-评分-权重-公式-阈值-实行),再结合实际需求,调整具体的参数,融入到具体的评测场景中,对翻译质量评估具有一定指导意义。
参考文献
[1] Lommel, Arle et al. Multidimensional Quality Metrics (MQM): A Framework for Declaring and Describing Translation Quality Metrics[J]. German: German Research Center for Artificial Intelligence (DFKI), 2014: 455-463.
[2] Lommel, Arle et al. Using a New Analytic Measure for the Annotation and Analysis of MT Errors on Real Data[C]. Proceedings of the 17th Annual Conference of the European Association for Machine Translation, 2014: 165-172.
[3] “MQM Core Typology”. http://themqm.info/typology/.[4] “MQM (Multidimensional Quality Metrics)”. https://themqm.org/.
特别说明:本文仅用于学术交流,如有侵权请后台联系小编删除。