欢迎光临散文网 会员登陆 & 注册

{本专栏采用QA形式}正如标题所言,这是一期关于“机翻”话题的专栏。

2020-04-05 02:10 作者:琉璃汐阳  | 我要投稿

前言

Q :专栏标题说采用QA形式是什么意思, 这期专栏的主要内容是什么?讲的是什么?


A : 额...正如标题所说的,我会用有问有答的形式来制作这期专栏(好吧,其实是我在构思时,实在想不出会有那个形式能契合本期专栏,所以才会用这个奇怪的形式?),内容上是关于“机翻”这个话题的一些问题,问答,想法或自己的一些观经历,观点等等,可能这期专栏我写着写着会变成混杂谈向的?会让你看的有点迷糊?不过我尽量会保证这期专栏的质量的。(总感觉这些都是在吐槽自己的话......


正文

Q : 机翻是啥?能淦什么用?(没错我故意打错字的


A : 机翻就是机器翻译的简称,就是用翻译软件将你看不懂的语言翻译成你看的懂的语言,经常看搬运视频的观众或做搬运视频的up应该对这个词在熟悉不过了吧。

  由于某些你懂的的原因,对于外语不太好的朋友来说,如果我们想了解外面的最新热点,想看油管上的非国语视频或者想和pixiv上的外国画师聊天的话,都离不开翻译软件这个东西(我自己就比较依赖谷歌翻译)。 

  国内有大量以搬运为生的创作者,由于不是所有的创作者都人均 雅思7+级,托福100分+,日语水平N2+ (在这里我并没有贬低所有做搬运的意思,我只是陈述事实而已),所以很多创作者会先用机翻,然后再制作字幕。 总之,在国内“机翻”这个词应该大家都不会陌生的



(此问答转载于知乎,链接:https://www.zhihu.com/question/28118047/answer/39462469)

Q  :为什么机翻难以做到语言逻辑的准确?


A: 现在机器翻译虽然已经能结合双语语料库进行文本处理,稍稍弥补了机器翻译无法捕捉整句话的逻辑。概括地说,机器翻译还是主要依靠双语词典来进行识别和翻译,即便外加语料库和短语数据等技术,依然有很大局限性。要解释局限性来源,要先了解一些机器翻译的基本原理。

  • 一、机器翻译的种类与简介

目前的机器翻译技术主要有三种

1. 规则式机器翻译 (Rule-based)

Rule-Based Machine Translation systems use large
collections of rules, manually developed over time by human experts
mapping structures from the source language to the target language.

规则式机器翻译主要是通过语言学家们经过日积月累的认知,预先设置好一些便于机器识别的规则,从而让机器可以遵循这些规则来实现自动翻译。
简单地说,比如英语和日语的语法相差比较大,其中突出的一点是日语的动词是后置的,要放在句尾,因此需要人为地在翻译系统里预先设置好相应的规则,这样机器处理英语文本时才知道,“哦,返成日语我得把动词识别出来然后放到句子末尾”。这只是一个简化的例子,实际中需要同时设置超大量不同的规则,才能实现最基础的翻译功能,所以缺点在于,需要花费较大的人力物力,才能设立足够的规则来规范机器翻译的行为。

这也是为什么国外的机器翻译系统在处理主流语言,比如英语西班牙语的效果,就要比中文他加禄语的效果要好得多——国外语言团队对英语和西班牙语的规则设置可能相对更完善,而对差异较大的亚洲语言来说,规则设置可能未如理想,因此自动翻译的结果较差。


2. 统计式机器翻译 (Statictics-based)

Statistical Machine Translation systems use computer algorithms to produce a translation that looks best statistically from millions of permutations.

统计式机器翻译似乎是更为自动化的技术,可以通过让计算机通过算法分析语句,计算不同的词之间搭配的可能性,这样很大程度上使机器翻译突破了单一词对单一词翻译的局限性。通过算法,翻译系统可以具备一定的有限的学习能力,通过分析已有的文本数据,判断出最为适合的翻译,但是这也需要大量的文本数据作为后台支持。若数据有限,机器的判断范围也会受到限制,分析出来的翻译可能并不符合当下的语境。

3. 混合式机器翻译 (Hybrid)

In order to address quality and time-to-market limitations, many
Rule-Based Machine Translation developers are augmenting their core
technology with Statistical Machine Translation technology to create
‘Hybrid Machine Translation’ solutions.

基于上述两种类型的机器翻译技术,催生了接合两者的优点的混合式机器翻译,即同时使用必要的规则,以及可用的文本资料,加强机器翻译的可用性。目前Google Translate机器翻译使用的就是混合式机器翻译,可以说是比较主流的方法了。

正因为有上述的不足之处,因此一般需要人工干预机器翻译。



Q : 个人搬运视频时使用机翻字幕有错吗?


A: 这个问题是我在看【2B2T】2B2T中的龙蛋在谁手上?-龙蛋漂流记 这个视频时注意到的,不得不说在这个视频里的字幕一看就是机翻的,而且搬运者似乎都没有对机翻字幕进行润色处理,里面有很多的翻译错误。

  也是,很多的搬运者在做搬运时往往都是先使用提取工具提取源语言,然后再用翻译软件翻译成目标语言后直接制作成字幕就发布,而忘掉了后期校对的工作(我就犯过这样的错误,希望搬运者一定不要忘了润色这一步)。

  这样导致了有一部分的搬运视频出现各种渣翻,死亡翻译的现象,不可否认的是,国内的很多个人搬运视频都出现了因翻译问题而导致视频质量低的问题,面对这种情况,有很多观众或多或少的都会吐槽几句,也有部分观众会选择体谅。 

  对于这个问题,我的观点是 :“一方面,现在的机翻的准确率还未能追赶上人工翻译的准确率,个人使用机翻并没有什么错;另一方面,大多数的个人搬运的视频都是出于自己的兴趣爱好,这些视频并不是都能满足所有人的口味,ta们做搬运大多数也都是没有收益的,很多视频可能都不会火。我觉得如果个人搬运视频时使用机翻,在做字幕时能进行润色,校对,不求百分之百正确,能保证观众能通过字幕,了解视频是在说的什么,能大致明白原视频的内容就行了。” 

  只要搬运者能合理的使用机翻,也就没有必要再讨论类似于“使用机翻就是原罪”这样的话题了。



Q : 在bilibili上有没有专门以 来回机翻而出现错误 为笑点的视频?


A : 这个是绝对的有啊,我还特地在B站上搜索以下关键词 “翻译” “谷歌翻译” “机翻” 等关键词来找这类的视频,在这里给大家推荐几个 :


从上到下依次为 :AV95418272  AV96580772  AV95773241  AV94881417
从上到下依次为 : AV95952351  AV93899021  AV95729624

这些视频当时看的我真的笑得不行(≧▽≦o),我之前真的是没想到利用机翻错误率高的这一点还能做出这么多搞笑的视频。



Q : 如何对待汉化组使用机器翻译来汉化作品。


A  : 为了能更好地这个问题,我特地问了国内的furry系漫画汉化团队:黑曜石汉化组 这个问题,以下是来自它们的回答 :


“(这个问题)需要分开的是:是收费汉化还是免费汉化。
一、 如果是收费汉化,除非雇主觉得质量根本无所谓,否则机翻+人工润色就是非常不负责任的做法。翻译讲求信达雅,虽然机器的存储量比人要强,勉强还算是最基础的信,但拿钱机翻就非常搞笑了。
二、 如果是免费的,我认为理论上来说机翻+人工润色没有任何责任,可以视为省了很多人去使用识图翻译的功夫。如果读者本身不懂源语言并且病句有被好好润色的话,在阅读中其实根本没有区别。但最好标注含有机翻成分,这样看得懂原文的人前来纠错时也好解释。免费的机翻几乎完全是汉化者出于对一个作品的热爱(少数为了出名的除外),但又没什么双语能力和帮手,而导入和嵌字也是很费精力的工作这点不能忽视。”


在此感谢黑曜石汉化组能回答我的这个问题。


Q  : 我自己对“机翻”的一些看法(见解)。


A :   对我而言,目前的我外语水平不高又需要做搬运时视频时进行翻译,所以短时间内我是离不开机翻。

不过说到底,机翻这个工具还是要适度使用,如果你合理使用的话,它将会变成你的“过渡期”内最好的助手;如果你滥用的话,它也可以让你陷入万劫不复的深渊中。

或许终究会有一天,“机翻”这个词会逐渐被淡忘,消逝在历史的长河中,取而代之的是可能是“高智能AI翻译”;或许随着科技的发展,AI领域的成熟,AI翻译的准确率会超过人工翻译,那时人们不会再说:“死亡机翻”等这样的话。

但至少在现在,机翻对于外语不太好的搬运者(个人汉化者)来说还是或多或少不可缺少的工具。


结尾

Q :  最后还有什么想说的吗?

A   感谢你能耐着性子看到这里,这篇文章我也是修改了很长时间才做成现在这个样子,这样的文章发出后不知道大家看了这后会如何评价呢?欢迎留言。 制作不易,如果喜欢本期专栏的话,请帮忙点个赞就行。想看更多内容就尽情关注我哦。(注 :封面是在谷歌翻译中输入"机翻"翻译的英文结果)




Thank you for reading~

{本专栏采用QA形式}正如标题所言,这是一期关于“机翻”话题的专栏。的评论 (共 条)

分享到微博请遵守国家法律