欢迎光临散文网 会员登陆 & 注册

技术与工具|如何用ABBYY Aligner和Tmxmall对俄汉语料进行整理

2022-11-29 21:02 作者:翻译技术点津  | 我要投稿



学俄语的小可爱们,不知大家在日常学习中,是否也一样没有时间整理时政方面的术语,总觉得太多。今天就向大家介绍两款特别强大的对齐软件,分别是ABBYY Aligner和Tmxmall双语对齐工具,他们可以处理各种形式的文档,包括docx、xml、pdf、txt、html等。

ABBYY Aligner

工具简介
ABBYY Aligner界面简单易用,可以将导入的内容直接进行双语对齐,准确率高,支持多个国家的语言。且可以存为TMX格式,以便在CAT软件中进一步使用。
操作过程:导入→ 对齐(合并,拆分,上移/下移,高亮对齐)→ 删除→ 保存→ 导出
首页




1. 导入
导入文件有两种方式:
  1. 将文本直接复制粘贴到源语文本和目标语文本框中;(注:中文字号选择 Chinese Simplified)

  2. 直接将想要对齐的两个文件拖拽到对应的文本框中。


2. 对齐(合并,拆分,上移,下移,高亮对齐)
点击“Align”键进行自动对齐,如下图:



如果文档中有的句段需要进行合并(如下图), 可以选中两个句段,然后点击工具栏的“Merge”进行合并。



同样也可以将混淆的句段进行拆分只需要将鼠标放在要拆分的位置, 点击工具栏的 “split fragment”。



拆分后的效果如图所示:



如果段落发生了错行,我们可以直接点击up(上移)或者是down(下移),像这样做。



这样就可以(如下图)对齐文本啦。



或者也可以将想要对齐的不同的两部分进行高亮,分别点击“Mark之后,再点击“Match




3. 删除空行与所有空行
对于空的句段,可以选中后点击工具栏的“delete”,若要删除文件里所有空行,点击“Actions”中的“Delete All Empty Lines”/ Ctrl+E 。

4. 保存
对齐完成之后,点击“save”保存对应的ata项目文件,下次可以直接打开继续编辑。

5. 导出
点击“export to TMX”(导出后建议打开更改一下字体),如图:




Tmxmall
工具简介
Tmxmall 在线对齐是一款基于浏览器架构的专业语料对齐平台。该平台技术先进、对齐效率高、操作简单。可以自动对齐原文及译文语料中“一对多、多对一、多对多”的句子,使对齐工作真正变得高效。具有支持语料制作、TMX文件在线编辑、术语提取、语料清洗、查找与替换等功能。


操作过程:导入→ 对齐(合并,拆分,上移/下移,高亮对齐)→ 查找替换→ 提取术语→ 导出术语

首页




1. 导入
有两种模式,单文档对齐和双文档对齐。
单文档对齐:单个文件中同时有原文和相对照的译文,只需导入该文件即可进行对齐;双文档对齐:在两个不同的文件中分别有原文和与之相对应的译文,需要分别在原文栏和译文栏导入对应语言的文件。




2. 对齐



对齐后的效果,如图:



对需要处理的地方,可进行“合并” “拆分” “上移” “下移”等操作,步骤与ABBYY Aligner中的操作类型。

3. 查找替换
Tmxmall支持“查找和替换”功能,查找的词汇会以红色突出显示。




4. 术语提取
点击上方菜单栏的“提取术语”,Tmxmall就会自动生成术语提取结果,默认词频为1。



提取术语后的效果如下图所示,我们也可根据词频,来筛选术语。




5. 导出(注:点击“全选”)



导出效果如图:



同样也可根据需要,导出tmx、xlsx、docx、txt等格式。




总结
最后让我们看看两款对齐工具的优缺点:



各位可以根据实际需求来选择最合适的工具进行语料对齐。综上所述,文章中的资料分享给大家,希望对大家的学习有所帮助


网盘链接:https://pan.baidu.com/s/1VUrSsK3sEQdsySUO-wQVgw

提取码:5ood


参考文章:https://mp.weixin.qq.com/s/Ep3oUcFEW1lvaxl52UAk8g


特别说明:本文仅供学习交流,如有不妥欢迎后台联系小编。


- END -





关注VX公众号“翻译技术教育与研究”、“语言服务行业”,了解更多语言服务行业与翻译技术相关的资讯和洞察~

技术与工具|如何用ABBYY Aligner和Tmxmall对俄汉语料进行整理的评论 (共 条)

分享到微博请遵守国家法律