欢迎光临散文网 会员登陆 & 注册

译学文献|徐珺 王清然:技术驱动的语言服务研究与探索

2022-03-20 15:07 作者:翻译技术点津  | 我要投稿

以下文章来源于语言学通讯 ,作者通讯君

技术驱动的语言服务研究与探索:融合与创新

徐珺 王清然 (中国政法大学)

摘   要:语言服务业的有序发展可以促进国与国之间的交流,是践行“一带一路”倡议以及人类命运共同体构想的有力支撑。文章在分析国内外语言服务研究、市场现状及趋势的基础上,从技术进步视角初步探索了5G技术与神经机器翻译技术在语言服务领域的应用与影响,并进一步提出了语言服务研究的双重技术转向。希望本研究能为语言服务研究、学科体系构建、行业发展和人才培养提供借鉴和启示。关键词:5G技术;神经机器翻译技术;语言服务;融合与创新基金项目:2021年北京市社会科学基金规划项目“跨文化传播与中国话语的全球建构研究”(项目编号:21YYB005);中国政法大学青年教师科研启动项目“国际贸易、神经机器翻译与语言服务企业绩效”(项目编号:10821654)的阶段性成果文献来源:徐珺,王清然.技术驱动的语言服务研究与探索:融合与创新[J].外语电化教学,2021(05):61-67+111+9.本文获得期刊独家授权语言学通讯公众号推广,参考文献从略。


1. 引言

       语言是一种特殊的资源,也是人类最重要的交际工具。随着中国改革开放的不断深入,中外交流日益频繁,人们对语言的本质及其功能有了更加深入的思考。讲好中国故事,传播好中国声音,语言服务业使命在肩。 语言服务业可以促进国与国之间的交流,是践行“一带一路”倡议与“人类命运共同体”构想的有力支撑。在“5G+AI+大数据+落地应用”深度融合下,语言服务研究产生了“5G技术+神经机器翻译技术”双重的技术转向。        面对日益融合化、智能化、云端化的翻译技术,以及网络化、数字化、信息化的语言服务需求,面对新形势、新挑战,语言服务产业走向何方?语言服务研究该如何应对?语言服务人才技术能力如何培养?这些问题的深入探讨,具有重要的理论意义和现实意义。        本研究首先从语言服务的定义入手,继而对语言服务与技术进步、语言服务人才技术能力培养等相关研究进行梳理。在此基础上,笔者结合技术经济学相关理论,探析了由5G技术和神经机器翻译技术带来的当代语言服务研究的双重技术转向,以期为语言服务研究、学科体系构建、行业发展和人才培养提供一定的参考与启示。


2. 语言服务研究回顾

       2010年,“语言服务”术语的出现,标志着我国语言服务产业的地位首次得到了官方认可(王传英, 2014)。在近十年间,作为一个新兴的研究领域,语言服务研究引起了学界的广泛关注(仲伟合、许勉君, 2016)。语言服务产业已经成为中国文化“走出去”和企业“走出去”的支柱产业(司显柱、姚亚芝, 2014)。

2.1 语言服务产业概念界定

       语言服务产业属于新兴的服务领域,国内外研究尚未对其形成明确和统一的定义(司显柱、郭小洁, 2018)。笔者通过梳理相关文献,总结对比了不同领域内研究者所界定的语言服务产业的概念,如表1所示。已有研究主要是通过界定产业的核心内容和业务范围,区分了语言服务业与传统的翻译产业,并对语言服务产业进行概念界定。《2012中国语言服务业发展报告》从广义和狭义两个维度对语言服务产业进行了定义:广义的语言服务产业包括语言服务产业链上的所有相关机构;而狭义的语言服务产业仅包括提供语言间信息转换服务、技术开发、培训或咨询服务的企业和机构。结合表1可知,尽管措辞略有不同,国内外研究对语言服务产业的定义均趋同于狭义的语言服务产业。综合上述分析,本研究对语言服务产业做出了如下定义:语言服务产业是以实现跨语言的文化交流和融合为目标,提供翻译、本地化服务、语言技术工具开发、语言培训和教学、多语言信息咨询等服务的现代服务行业。


2.2 语言服务与技术进步

      截至目前,由语言技术驱动的语言服务产业变革可被归纳为: ①上世纪80年代末期计算机辅助翻译工具的推广;②上世纪90年代末期统计机器翻译技术的普及;③当下的神经机器翻译技术的应用。以机器翻译为代表的语言技术的多次创新为语言服务产业带来了机遇和挑战,推动了产业的持续结构升级。自Systran在1988年推出了第一个在线机器翻译平台,机器翻译便成为语言技术研究者最为关注的议题之一。已有研究探讨了使用最新机器翻译技术的在线机器翻译平台与语言服务产业的关系。在线机器翻译平台因为对用户具有低成本(甚至无成本)且效率高两个特点,在其出现初期即有大量商业需求,且呈不断增长的趋势(Brace et al., 1995; Gaspari & Hutchins, 2007)。由于传统的人工翻译模式与机器翻译相比存在效率低和成本高的劣势,在线机器翻译平台的创新与发展将对语言服务产业形成一定的冲击(Luo et al., 2018)。另外,现有的在线翻译平台大都由用户遍布全球的知名互联网公司(如谷歌、微软等)提供,所以对语言服务产业有显著的影响(王清然, 2019)。由于相关研究大部分是在神经机器翻译技术正式商业应用之前进行的,主要研究的是统计机器翻译技术对语言服务业的影响,而针对统计机器翻译的分析不一定适用于神经机器翻译。其次,已有研究主要探讨了产业内部技术变革对语言服务业造成的影响,忽略了高度相关的外部技术环境,研究具有一定的局限性。

2.3 语言服务人才技术能力培养

      根据中国翻译专业学位研究生教育指导委员会的统计,截至2021年8月,中国共有313个翻译硕士学位授予点;根据教育部高等学校翻译专业教学协作组网站发布的数据,截至2019年5月,中国翻译本科专业培养院校达到281所。尽管中国目前已经形成较为完善的语言服务人才培养体系,但Luo et al. (2018)通过抽样调查发现,仅有6.75%的本科翻译课程和7.9%的硕士课程与机器翻译相关,而其调查样本中88%的翻译硕士生表示自身机器翻译的知识储备十分有限。与之对比鲜明的是,《2020中国语言服务行业发展报告》统计显示,88.1%的受访语言服务企业和89.6%的受访语言服务从业者表示会使用机器翻译,体现了教学与实践、供给与需求间的鸿沟。自语言服务产业兴起之初,研究者已经开始重点关注翻译技术能力的培养, 并论证了在培养方案中增设机器翻译或计算机辅助翻译相关课程的必要性和现实意义(Bowker & Marshman, 2010; Doherty & Kenny, 2014; Mellinger, 2017)。然而,中国翻译协会的统计数据表明,现阶段中国仅有53.5%的高校开设了翻译技术类课程,且面临合格师资匮乏、合理培训方案缺乏及相关基础设施滞后等问题。针对这一现状,学者提出了多种应对策略:如通过构建翻译技术教师的知识结构体系,探讨翻译技术教师知识建构的困境与途径(张静, 2020);从课程建设、师资发展、教学评价、环境和研究五个方面推动技术与翻译教学的融合(王华树、李莹,2021);将技术能力纳入翻译教师能力结构模型,探讨解决翻译教师技术能力不足的协同路径(王少爽、李春姬,2021);探索翻译技术教学案例资源建设、应用原则和方法(崔启亮,2021)。

表1 国内外研究对语言服务产业的概念界定

3. 语言服务产业的市场概况

3.1 市场规模

       图1展示了2005—2019年间全球语言服务市场的营收规模及增速。2019年,市场总规模超过496亿美元,年增长率近7%。在经历了2008年到2012年的快速增长时期后,目前全球语言服务市场的增速已经趋缓,进入稳定增长时期。根据中国翻译协会的统计,2019年中国语言服务业总产值为384亿元,年增长率为3.2%,与全球语言产业存在一定差距。

图1 2005—2019年全球语言服务市场规模及增速


3.2 业务类型

      语言业务(Language Service)是语言服务产业营收占比最大的业务种类,达到全行业营收的90%左右。图2—图5统计了2015年到2019年全球语言服务市场语言业务细分类型占语言业务总营收比例的情况。截至2019年,文本翻译业务占比达到66.49%(约300亿美元),继续保持其在各服务类型中的主导地位。语音翻译业务、本地化业务和其他业务分别占语言业务总营收的16.25%(约74亿美元)、8.94%(约41亿美元)和8.32%(约38亿美元),其中语音翻译业务在近五年中呈现不断上涨的态势。值得注意的是,远程同步口译和机器口译是自2018年才开始兴起的业务类型。究其原因是近年快速发展的移动通信技术和机器翻译技术不断为语言服务产业赋能。借助产业内外部不断涌现的新技术,多种语言服务类型得以实现并占据更多的市场份额。


图2 文本翻译业务

图3 本地化业务

图4 其他业务


      《2020中国语言服务行业发展报告》按服务领域对中国语言服务市场业务进行分类,其中,占比最高的业务领域分别为信息技术、教育培训和知识产权。随着国家战略的推进,科技端进一步助力语言服务行业发展,百度、阿里巴巴、腾讯等互联网巨头通过自身的流量和技术进入语言服务业,将使信息技术成为中国语言服务产业的主导业务领域。


3.3 市场趋势      

      随着全球化的不断深入,产业内外部新技术不断涌现,语言服务市场的需求和业务形态发生了深刻变革。总的来说,近些年语言服务业的市场需求主要呈现如下三大趋势。

      第一,技术需求多样化。在技术进步不断为不同行业带来范式变迁的时代背景下,许多客户已经不再满足于传统笔译和口译服务,提出了涉及多种新技术的个性化的语言服务需求。越来越多的客户希望语言服务企业能够借助新技术,针对他们所面临的语言问题,提供全方位的解决方案。这种对定制化服务的需求为语言服务企业的技术能力制定了更高的标准。如图3所示,远程同步口译、机器口译都是2018年后出现的新业务类型,而无一例外的,这些新兴业务都需要依托于移动通信、语音识别、自然语言处理、人工智能等技术。

      第二,服务场景数字化。在移动互联网高度发达的今天,由于跨境电商、出境旅游等移动消费平台的繁荣发展,为满足用户需求,越来越多的平台开始提供即时的语言服务。此外,2020年新冠肺炎疫情加速了各国各个行业数字化的发展,数字化和数据化成为市场需求和消费新业态,机构客户和个人客户对语言服务的数字化需求在近些年也有了大幅增长。由于第五代移动通信技术(5G技术)具有一秒千兆的高速率,因此,语言服务企业应顺应数字化趋势,结合5G技术,发展即时、高效、便捷的数字化语言服务。

      第三,语言需求分散化。中国主导的“一带一路”倡议,极大地推动了沿线国家的经贸、科技、文化往来,进一步提升了沿线各国的贸易流量。在此影响下,以英语为主的语言服务需求发生了转变,非英语语种的语言服务需求开始增多,给语言服务业带来了新的机遇与挑战。为满足更加分散化的语言需求,语言服务企业必须配备多语种的语言人才,借助神经机器翻译技术,提供更多元化的语言服务。


4. 技术进步视域下语言服务研究发展趋势

      技术进步是语言服务产业发展的重要驱动力。一方面,移动通信技术飞速发展,使更多类型的语言服务和语言技术成为可能,直接影响了行业的整体需求;另一方面,机器翻译技术取得重大突破,为语言服务企业带来了挑战和机遇。在这一大背景下,本文结合技术创新理论,从产业外部技术环境改变和产业内部技术突破两个维度对语言服务研究的“技术转向”进行论证分析。其中,产业外部技术变革主要指自2016年开始的第五代移动通信技术(5G技术)的迅猛发展;而产业内部的技术突破主要指2016年谷歌神经机器翻译技术的正式商业应用。

4.1 产业外部技术环境变革:5G移动通信技术

      5G技术是具有高速率、万物互联、低时延特点的新一代宽带移动通信技术。图6展示了2015—2019年间四代移动通信技术标准必要专利数量的发展变化趋势。其中,黑色区域代表5G技术标准必要专利数量。由图6可知,自2017年开始,5G技术标准必要专利数量有了大规模的增长。国际知名专利数据公司IPlytics的数据表明,2017年伊始,仅有不到2000个专利族被声明为5G技术的标准必要专利,截至2020年底,5G技术标准必要专利的数量约为20000个,在5年中实现了近10倍的增长。工业和信息化部的数据表明,截至2021年5月,我国5G技术标准必要专利声明数量占比超过38%,位列全球首位。以上数据证明了5G技术在近年中取得了突破性的进展,改变了语言服务产业的外部技术环境。


图5 四代通信技术标准必要专利数量


       在2015年,国际通信协会定义了5G技术的三大应用场景:①增强型移动宽带(enhanced Mobile Broadband, eMBB),使得5G技术拥有一秒千兆的通信速度;②大规模机器类通信(massive Machine Type Communications, mMTC),可以使许多原本互不相关的领域通过5G技术实现互联;③超可靠、低时延通信(Ultra Reliable Low Latency Communications, URLLC),对于关键任务应用等领域尤为重要。5G技术将为语言服务产业带来双重影响。首先,5G技术使得通信技术可以被应用到更多的产业,而其在语音、智慧城市、云服务、增强现实、关键任务等领域的应用均与语言服务密切相关,因此,语言服务产业需要通过结构升级来应对相关产业生产模式的变化趋势。其次,由于5G技术有助于实现各类人工智能语言技术的内部互联互通,因此可以被应用到更多语言服务实践领域,如表2所示。鉴于此,5G技术的迅猛发展,可以被视为高度影响语言服务产业的外部技术环境变革。


表2 5G技术在语言服务领域的应用场景


      受产业内外部技术变革的影响,2020年成为语言服务业的分水岭。在2020年以前,以人工为主要生产模式的传统笔译业务是语言服务产业最主要的业务类型及营收来源;而2020年之后,以“人工+人工智能”为主要生产模式的增强翻译(Augmented Translation)、机器口译(Machine Interpretation)等智能语言服务将成为语言服务产业的主流业务,而传统业务的市场份额将会逐步萎缩(CSA Research, 2020)。5G技术具有高速率、低时延和万物互联的特征,因此,语言服务研究者应顺应产业外部生产模式的变化趋势,进一步研究5G技术与语言服务技术的深度融合,开发和完善更多的智能语言服务业务类型,提高智能语言服务业务不同项目间的一致性和准确性,以达成在不断变化的技术格局中最大程度挖掘语言服务行业潜力的目标。这是未来语言服务研究的第一重技术转向。

4.2 产业内部技术突破:神经机器翻译技术

      2013年,Nal Kalchbrenner和Phil Blunsom提出了端到端神经机器翻译的“编码-解码”框架。随后,神经机器翻译技术的相关研究逐渐展开并形成一股热潮。笔者在arXiv.org上用“Neural Machine Translation”为关键字进行检索,2014年和2015年分别只搜索到7篇和11篇相关论文,而2016—2020年间被收录的论文分别有70、122、167、191、184篇。自此,神经机器翻译技术逐步取代统计机器翻译技术,成为领域内研究者最为关注的议题。2014年,谷歌将长短期记忆网络(Long Short-Term Memory)引入端到端神经机器翻译系统,以设置门开关的方式较好地处理了长距离依赖问题。注意力机制也被引入端到端神经机器翻译的模型中。由于基于内容的注意力计算方法可以避免在解码器生成目标语言时无相关性的源语言词的干扰,使解码器仅使用每个目标语言词所相关的源语言端的上下文向量,因此更好地处理了长距离依赖问题,使端到端神经机器翻译的翻译质量得到进一步提高(Wu et al., 2016)。概括而言,神经机器翻译的基本思想传承自统计机器翻译,都是概率最大化的思想,然而与后者采用离散表示方法不同的是,前者采用连续空间表示方法表示单词、短语和句子,它比基于短语的模型更加简单,不需要大量的语言模型、翻译模型、重排序模型,只需要一个单独的序列模型进行单词预测。因此,神经机器翻译技术被视作是自统计机器翻译技术后,机器翻译领域内的另一个重大技术突破。笔者从载体平台、语言媒介和应用场景三个维度对现阶段神经机器翻译在语言服务领域的潜在应用模式进行了分类,如图7所示。崔启亮(2021)分析了人工智能在语言服务企业的应用现状,研究显示,对样本企业而言,神经机器翻译技术已覆盖了全部语言媒介和主要载体平台。此外,教学实践是神经机器翻译技术在企业领域外最主要的应用场景,与该项技术高度相关的三个教学领域分别是:翻译技术教学(秦颖, 2018)、译后编辑教学(仲文明、舒超, 2020)以及二语写作教学(Chon & Shin, 2020)。因此,新技术在以上三个教学领域的具体应用模式和教学效果应是未来研究关注的重点问题。

图6 神经机器翻译技术应用模式


      2016年,谷歌发布了其研发的神经机器翻译系统,并应用于谷歌翻译以代替原来使用的统计机器翻译系统。随后,其他高科技公司和语言服务企业纷纷开发或者使用基于神经机器翻译的翻译技术。表3统计了神经机器翻译技术正式商业应用前后(2015—2019年),传统笔译业务和新技术相关业务占语言服务业总营收的比例。值得注意的是,无论是受新技术冲击最大的以传统人工翻译为主要生产模式的笔译业务,还是与新技术高度关联的业务,都没有出现营收占比的显著改变。这一现象可以被熊彼特(1990)的创新与技术进步理论解释。根据该理论,创新是经济发展的根本现象,是一种“创造性破坏”的过程。创新不断地从根本上破坏现有的秩序和经济格局,同时催生新的秩序和经济格局;基于这样的机制,经济体系得以从内部革新并实现增长(Aghion & Howitt, 1992)。而神经机器翻译作为一项重要的技术创新,也同样会给语言服务产业带来“创造性破坏”。一方面,谷歌、微软、百度、网易等高科技公司借助神经机器翻译技术进入语言服务行业,成为语言服务企业的竞争者,可能直接对后者的营收造成负面影响;另一方面,语言服务企业也可以通过采用神经机器翻译技术来提高翻译效率,同时降低生产成本,从而为自身的营收带来正面影响。因此,神经机器翻译技术的出现对语言服务业既会产生负面冲击,也会产生正面冲击,而其对行业的净影响不确定。

表3 传统与新技术相关业务营收对比(2015—2019年)


      当下业界的普遍共识是,语言服务的大量商业需求是促进机器翻译技术发展的主要动因之一,而机器翻译技术的变革改变了语言服务产业的生产模式,促进了产业的范式变迁。Luo et al.(2018)指出,机器翻译的创新和在线语言服务平台的普及将会重塑语言服务产业的产业结构和增长模式。因此,未来研究应基于创新与技术进步理论,继续深入探讨及检验神经机器翻译技术对语言服务业所造成的影响,进一步深化语言服务研究的第二重“技术转向”。

5. 启示与建议

       2016年后,神经机器翻译技术和5G技术的迅猛发展成为语言服务产业内外部最主要的技术突破,并对行业产生深远影响。鉴于此,笔者认为,未来语言服务研究和人才培养模式均应顺应时代发展,积极拥抱新技术。

5.1 对语言服务研究的启示

      笔者从语言服务产业的定义、语言服务与技术进步和语言服务人才技术能力培养三个主题对相关研究进行了综述,认为现阶段的语言服务研究存在以下两个局限:首先是部分研究领域存在空白,探讨神经机器翻译技术与语言服务关系的研究相对较少,且尚无文献针对以5G技术为代表的外部技术环境变革对语言服务造成的影响进行系统的分析;其次是实证研究偏少,由于语言服务产业属于新兴的服务行业,已有研究主要采用了定性分析法,且量化分析技术进步对语言服务行业产生的影响尚无研究。作为语言服务产业最主要的外部技术环境变革, 5G技术具有高速率、低时延和万物互联的特征。未来语言服务研究应重点关注如何借助5G技术实现更多语言服务应用场景,开发更为多元化的语言服务类型,在最大程度上使这项新移动通信技术为语言服务行业赋能。此外,由于神经机器翻译是近5年间机器翻译技术的最新重大变革,它的出现与进步将同时为语言服务产业、企业及人才培养带来机遇与挑战,因此该项技术与语言服务业的关系及其在教学实践环节的应用与效果应是未来研究的重点问题。

5.2 对语言服务人才培养的启示

      如前文所述,多位学者已从不同的维度探讨了语言服务人才技术能力培养的重要意义、存在问题及应对策略(Bowker & Marshman, 2010;Doherty & Kenny,2014; Mellinger,2017;张静,2020;王华树、李莹,2021)。伴随着5G时代的来临,各种应用场景的语言需求不断增加,人工智能等新型计算机技术迅猛发展,各类语言技术不断取得重大突破,语言服务项目也变得越来越复杂。这些复杂的项目要求语言服务人才不仅具有语言能力,还需要具备跨学科的技术能力。因此,跨学科人才培养是未来语言服务人才培养的趋势。

       此外,技术能力的培养不仅可以帮助学生熟练掌握与语言服务相关的各类软硬件系统、尽快适应技术多元化的语言服务工作环境,还有助于推动语言服务技术的进步。在近年神经网络技术迅速发展的浪潮中,端到端神经机器翻译仍存在很大的改进空间,如存在训练复杂度高、可解释性差等缺陷(Bentivogli et al., 2018)。因此,如何使用大规模计算资源、在设计结构时融入语言学知识以提升可解释性,是目前神经机器翻译研究领域需要解决的重要问题,需要具备跨学科知识的复合型人才予以解决。

6. 结语

      在人工智能的时代背景下,语言服务业的有序发展与技术进步休戚相关。本研究表明,5G技术和神经机器翻译技术的快速发展改变了语言服务产业内外部的技术环境,对行业具有深远影响。同时,新技术将促使兼顾语言学、通信工程、计算机等领域的跨学科人才培养模式成为语言服务人才培养的主流模式。因此,多方参与者应积极探索新技术在企业实践、人才培养以及学术研究等领域的应用、影响及效果。

本文格式略有变动,欢迎阅读《外语电化教学》纸质期刊或者知网下载论文。 

本文编辑:王宁 吉林外国语大学 

本文审核:王峰 吉林大学

如需更深入学习,可关注微信公众号“翻译技术教育与研究”、“语言服务行业”,致力于语言服务行业资讯、洞察、洞见,关注我们,了解更多精彩内容。


译学文献|徐珺 王清然:技术驱动的语言服务研究与探索的评论 (共 条)

分享到微博请遵守国家法律