欢迎光临散文网 会员登陆 & 注册

三分钟科普|翻译多维质量标准(MQM)如何给译文打分?

2022-12-12 14:13 作者:翻译技术点津  | 我要投稿


本文约1200字,预计阅读时间5分钟

翻译多维质量标准 Multidimensional Quality Metrics (MQM) 是一种翻译质量评估框架,可以对人工翻译和机器翻译进行翻译质量评测。作为欧盟资助的QTLaunchPad和QT21项目的一部分,最初由德国人工智能研究中心(DFKI)发布。本文将从MQM背景、错误维度、错误类型和记分卡设置四个方面对MQM进行简单介绍。


1 MQM背景

MQM基于LISA QA Model、SAE J2450和ATA标准化错误标记框架,参考其错误类型,但采用了更加模块化的方法。起初,TAUS和DFKI与LTAC Global合作,创建了DQF:MQM。DQF:MQM是一个基于初版MQM和TAUS动态质量框架的错误类型集合。随后,DQF错误类型成为 MQM 的一个子集,逐渐被MQM核心架构(MQM-Core)取代。


2 MQM错误维度

MQM将翻译错误主要划分为7个维度,分别为:

  • 术语(Terminology)
  • 准确性(Accuracy)
  • 语言惯例(Linguistic conventions)
  • 风格(Style)
  • 区域惯例(Locale conventions)
  • 受众适应性(Audience appropriateness)
  • 格式与标记(Design and markup)
这是最新版MQM的维度划分,对第一版进行了一些改动,例如在第一版中,“语言惯例”为“流利度”(Fluency),“受众适应性”为“真实性”(Verity)。


3 MQM错误类型




MQM在七个错误维度的基础上,又将其细分为了不同的错误类型:
(一)术语
  • 与术语库不一致(Inconsistent with terminology resource)
  • 术语上下文不一致(Inconsistent use of terminology)
  • 术语错误(Wrong term)

(二)准确性
  • 误译(Mistranslation)
  • 过译(Over-translation)
  • 欠译(Under-translation)
  • 增译(Addition)
  • 漏译(Omission)
  • 不应译(Do not translate)
  • 未译(Untranslated)

(三)语言惯例
  • 语法(Grammar)
  • 标点(Punctuation)
  • 拼写(Spelling)
  • 不可理解度(Unintelligible)
  • 字符编码(Character encoding)

(四)风格
  • 组织风格(Organizational style)
  • 第三方风格(Third-party style)
  • 与外部参考不一致(In consistent with external reference)
  • 语域(Register)
  • 不自然(Awkward style)
  • 不符合语言习惯(Unidiomatic style)
  • 风格不一致(Inconsistent style)

(五)区域惯例
  • 数字格式(Number format)
  • 货币格式(Currency format)
  • 测量格式(Measurement format)
  • 时间格式(Time format)
  • 日期格式(Date format)
  • 地址格式(Address format)
  • 电话格式(Telephone format)
  • 快捷键格式(Shortcut key)
(六)受众适应性
  • 特定文化参考(Specific culture reference)

(七)格式与标记
  • 字符格式(Character formatting)
  • 排版(Layout)
  • 标记标签(Markup tag)
  • 删节或超出边框(Truncation/text expansion)
  • 缺少文本(Missing text)
  • 链接不正确或无效(Link/cross-reference)

可见,MQM从文本和格式两个维度都对翻译错误进行了分类,且错误类型划分较为全面、详细,有助于对人工翻译或机器翻译进行细粒度的质量评估。


4 MQM记分卡

MQM采用记分卡的形式对质量评估结果进行量化,评估人员根据这些错误类型、严重性等将识别的翻译错误分配数值,使评估结果更加直观。



在MQM记分卡中,可以设置无错误(None)、轻微错误(Minor)、主要错误(Major)、严重错误(Critical)四个档位的严重程度,分别可代表0分、1分、5分、10分的罚分分值(但该分值在具体评估过程中可适当调整),并可以对不同的错误类型分配权重(Weights)。评估流程根据评估人员统计出的错误数量,乘以罚分分值,自动得出总罚分,再根据所评估的总字数,计算出字错率,最后计算出译文得分,根据所划定阈值(Threshold)确定译文是否通过质检。

公式为:错误率=错误数量*罚分值*权重值/总字数正确率=(1-错误率)*100



在这种方法中,MQM将错误数量、错误分值、评估字数、阈值等数值综合考量,尽可能地保证了结果的科学、客观。

由上可见,MQM质量评估方法具备一定科学性、客观性,从多维度对翻译质量进行考察,并量化评测结果,是对过于主观的传统质量评测方法的改进;MQM质量评估方法也具备一定创新性,在结合了多种评估模型后,不断完善其错误类型和维度,将受众适应性、语言风格、格式等均纳入评测内容,进一步形成了更为全面的评测体系;此外,MQM质量评估方法也具备一定可操作性,在实际操作中,评估人员可以根据其设定的步骤(维度-方法-错误类型-评分-权重-公式-阈值-实行),再结合实际需求,调整具体的参数,融入到具体的评测场景中,对翻译质量评估具有一定指导意义。

参考文献
[1] Lommel, Arle et al. Multidimensional Quality Metrics (MQM): A Framework for Declaring and Describing Translation Quality Metrics[J]. German: German Research Center for Artificial Intelligence (DFKI), 2014: 455-463.
[2] Lommel, Arle et al. Using a New Analytic Measure for the Annotation and Analysis of MT Errors on Real Data[C]. Proceedings of the 17th Annual Conference of the European Association for Machine Translation, 2014: 165-172.
[3] “MQM Core Typology”. http://themqm.info/typology/.[4] “MQM (Multidimensional Quality Metrics)”. https://themqm.org/.
特别说明:本文仅用于学术交流,如有侵权请后台联系小编删除。

三分钟科普|翻译多维质量标准(MQM)如何给译文打分?的评论 (共 条)

分享到微博请遵守国家法律