好用的语料对齐工具
1. Tmxmall在线对齐
导入需要对齐的文档,既可以双文档导入,也能单文档导入;

导入文档之后,可以对内容进行合并、拆分、插入、删除等操作,如果不清楚如何操作,可以点击旁边的帮助按钮,将段落调整至总行数一致;

调整过段落之后,可以单击“对齐”按钮,系统会自动将段落拆分成句对,一般进行过这项操作之后,不需要作太大的调整,只需要再稍微检查一下即可;
检查的时候,可以通过颜色的不同,对相邻段落加以区分,这样方便我们不至于将不同段落的句子错误合并;

通篇仔细检查过后,我们就可以导出文件了,导出的时候可以选择多种格式,比如比较常用的tmx和excel格式的文件。
2. ABBYY Aligner
导入双语文件,可以复制粘贴导入,也可以分别导入原文和译文文件

点击“Align”进行自动对齐,注意标红部分是提示可能对齐不够准确,需要着重注意一下

对齐过程中,如果需要“合并”,可以选中需要合并的句子,点击“merge”;若要拆分,将光标停在需要拆分的地方,点击“split fragment”即可

调整至对齐结果无误之后,可以点击“export to TMX”, 导出文件,不过若没有完成对齐,记得点击“save”保存,以防丢失。
3. Transmate
首先点击“双语对齐”选项卡导入文件,可以单/双文档导入

需要注意的是,transmate不能自动对齐,需要人工进行句与句的对齐,可以点击“上移”、“下移”、“拆分”等选项

人工对齐完成之后,可以导出为tmx格式的文件,也可导入到记忆库中


使用过这三款工具之后,我的感受是Tmxmall在线对齐>ABBYY Aligner>Transmate。首先前两款工具可以自动对齐,但最后一款Transmate需要手动进行对齐,比较耗费时间。其次相比于ABBYY Aligner, Tmxmall在线对齐界面更加清晰简洁,而且精确度更高,为防文件丢失,Tmxmall在线对齐在下一次打开时,会自动弹出是否打开最近一次保存的对齐结果,这样可以有效避免因意外事件而造成文件丢失的情况,同时,其贴心的功能如颜色标识、语料去重、术语提取等等非常人性化,使用起来会更加方便。