欢迎光临散文网 会员登陆 & 注册

用导图读论文 | 宁海霖:论翻译技术研究的知识维度

2022-07-22 18:07 作者:翻译技术点津  | 我要投稿

论翻译技术研究的知识维度
宁海霖 天津商业大学


摘要翻译技术研究的知识维度体现出翻译学、术语学、符号学、知识组织和知识本体等多学科理论相互交叉融合的研究模式,旨在对翻译资源进行深度描写加工,以可视化手段直观地表征专业领域知识系统,在减少重复劳动、提高翻译效率的同时,构建译者的知识习得机制。本文从翻译技术的本体、理论、实体 3 方面对其知识维度的研究内容进行阐释,凸显该课题在翻译技术理论与应用发展中的重要价值。在本体认知层面,翻译技术的根本价值在于提高语义在多种符号之间的传播效率,符号之间的匹配精度和语义的阐释度是衡量翻译技术水平的标尺;在理论拓展层面,以知识理论为核心的多学科交叉研究成果阐释知识、符号、翻译技术、知识传播的本质与相互关系,强化翻译技术核心领域研究的理论根基;在实体建设层面,元数据、信息粒度、知识本体等重要知识技术的应用能够提高数据的加工深度和知识的可操控性,在语料库、术语库、知识库等翻译技术资源建设中发挥基础性作用。


关键词: 翻译技术;翻译资源;符号;知识系统;知识理论;知识习得


一、引言

        翻译技术伴随机器翻译的产生和发展而逐渐演化,其最初目标是在无人工干预的前提下生产接近于自然语言的译文(Quah 2008: 7) 。在知识理论的驱动下,劳动工具正向基于数据、信息、知识、价值和智能的智力工具转变(邵必林等2018: 72) 。同样,当今的翻译技术工具已经由单一的文字符号转换工具,发展为覆盖数字化翻译资源、计算机辅助翻译工具与自动翻译工具等多种类型,兼具数据分析、信息匹配、知识习得、资产管理等功能的专业化、智能化、共享化的知识服务平台。
        翻译技术研究的知识维度延展是翻译技术研究领域的前沿课题。国内外相关研究已初具雏形,提出具体的发展理念与规划,并进行初步实施和建设。冯志伟对概念系统、知识本体和术语管理的本质和相关性进行由底层到表层的系统理论分析,将翻译与自然语言处理、语料标注、知识抽取、知识本体建设更紧密地结合(冯志伟2011: 94 - 171);王少爽将术语学理论应用于翻译能力研究,认为“术语能力”是译者必须具备的职业素养,针对译者的术语能力进行实证研究,提出译者术语能力的培养必须建立在对译者知识体系的构建之上;(王少爽2013: 26 - 35) 刘润泽等提出面向翻译的术语谱系化思想,认为要将术语置于概念系统中进行观察研究,并借助Citespace知识图谱分析工具对equivalence这一西方译学术语在中国当代译学语境中的谱系演化趋势进行可视化分析(刘润泽等2015: 18 - 24);苗菊和宁海霖初步阐释翻译技术知识体系化演进的内涵及意义,并以术语知识库的建设为例论述相关多学科理论的应用途径( 苗菊宁海霖2016: 60 - 64) 。
        另一方面,西方学界已经着手开展翻译与知识传播领域的理论研究与大型项目规划。德国开姆尼茨工业大学( Chemnitz University of Technology) 应用语言学教授安纳利•罗斯凯格尔( Annely Rothkegel) 认为,两类知识与翻译的关系最为密切:一是体现客体或事态概念结构的世界知识,也称领域知识;二是体现如何以声音或视觉手段传递特定领域知识内涵的文本知识( Damet al.2005: 83 ) ; 西班牙格拉纳达大学( University of Granada) 翻译与口译学院教授、认知术语学代表人物帕米拉•法贝尔( Pamela Faber) 将“知识的检索、管理、表示和存储”列为译者必须具备的职业技能之一( Faber 2010: 3 ),并详细论述术语知识库( terminological knowledge bases,TKD)在概念认知、术语检索和知识检索等专业领域文献翻译实践关键环节中的具体应用方法(  Gil-Berrozpe, Faber 2017: 2 -22);奥地利维也纳大学( University of Vienna) 翻译研究中心主任杰哈德•布丁( Gerhard  Budin)教授认为,计算翻译研究(computational  translation studies, CTS)是翻译技术研究领域的重要分支,其主要研究目的是凭借知识理论与认知手段整合、创造、加工、管理各类翻译资源,建立译者的知识资源体系和知识管理机制( Budin 2016: 15)。可见,在多学科交叉研究模式的推动下,翻译技术研究正在多个层面经历知识化的演进过程。


二、翻译技术本体认知的知识维度阐释


        翻译活动的对象是思维实体以及作为其承载物的符号。思维实体与一个客体相对应,包含 3 种形态:概念、概念复合体与概念模型。概念是客体本质特征的集合体,是人脑对多个客体进行抽象认知的结果,是知识单位的基本构成要素。概念复合体也称为逻辑句子,是最基本的知识单位;一个逻辑句子由两个概念通过关系纽带相互连接构成,可以用公式表示为“逻辑句子 = 概念 + 关系 + 概念”或者“逻辑句子 =概念 + 关系 + 特性”;概念模型则是由概念、逻辑句子与逻辑句子系统交互结合而成的语义系统或知识网络。
        思维实体必须依附于符号进行表示和传播。符号是一种个体事物,它与另一种个体事物、概念或者事态长期相互对应,是语义的载体( 维斯特2011: 100)。符号有多种表现形式,包括译者是翻译思维过程的起点,通过解码源符号来抽取蕴含的思维实体,进而以目标符号对思维实体进行显化表示;读者是翻译思维过程的终点,通过解码目标符号来获取其语义。源符号和目标符号都不限于语言符号。例如,将汽车变速箱原理方面的英文资料翻译为中文,再基于中文资料内容制作3D教学视频,在该翻译过程中,“汽车变速箱原理”这个思维实体首先执行从英文到中文的语言符号内部传递,再完成从语言符号到视频符号的符际传递。以语言符号为媒介的翻译行为一直以来都在翻译意识形态中占据主流位置,随着语言服务市场需求的多样化和语言技术的不断发展,以图片、语音、视频等多模态形式为媒介的翻译活动也将迅速增长以实现知识传播效率的提升。 


        翻译技术服务于翻译目的,其根本任务是提高知识传播效率,即提高思维实体在不同符号之间的传播效率。该目标的实现路径包括两种:一是符号匹配法,即不同类型符号之间直接进行表层匹配;二是语义转换法,即从源符号中抽取语义进而转换为目标符号。符号匹配法省略语义分析环节,直接进行符号(一般是语言符号) 之间的对照式匹配,具有迅速、省力的特点。翻译记忆技术是符号匹配法应用的代表性成果,它充分利用应用类文本语言符号模式化的特征,自动匹配相似语对,规避重复劳动,为翻译服务公司提供高速作业方案。翻译记忆库覆盖的专业领域数量、语料对齐质量与数据库规模是决定其功能性的关键因素。同样,包括语料库和术语库在内的数字化翻译资源也是利用检索机制实现多语种词汇或词组之间的直接匹配,从而提高翻译效率。语义转换法的优势在于挖掘语义深层含义,实现语义在多种类型符号之间的传播。符号是思维实体的指代者,但思维实体与符号之间不存在绝对的对等关系,其原因在于单一符号不能体现思维实体的全部内涵。例如,“黄金”这个语言符号只能指代某种金属,但无法体现该类金属深层的内涵特征,要获取更多信息,需要引入更多语言符号和数字符号来表示其特征属性和关系属性,如“黄金具有耐腐蚀性”“黄金的熔点是 1064.4℃”“黄金比白银密度大”等。在必要的情况下,也可以引入图像符号对这一概念进行直观表示。不同类型的符号对同一思维实体的表示程度存在差异,比如高质量的文字符号能够对事物进行更加细致、系统的描述,而视频符号能够更加直观、形象地体现事物的本质。一般而言,引入的符号越多、种类越丰富,对思维实体的阐释就越深入。在翻译过程中,思维实体在不同符号之间进行传递和表示,使得翻译质量总是处于上下浮动的状态,其高低取决于语义结构的复杂性和特定符号对语义的阐释能力。在翻译技术范畴,机器翻译是面向翻译质量提升的代表性工具,在经历过从基于规则到基于神经网络的转变后,机器翻译开始逐渐采取由里及表的技术路线,致力于对文本语义,即思维实体的知识结构进行深层学习、适应与反馈,从而提高翻译质量。
        综上所述,翻译技术水平的提升需要从两个层面着手:一是增强不同语言符号之间的匹配精度,其关键在于加强多领域、多语种语料库、术语库、术语知识库和翻译记忆库建设,优化对语言资源的分析描述,扩大高质量基础性翻译资源的规模;二是增强对语义的阐释度,其关键在于深入挖掘概念系统与知识网络,同时运用恰当的符号形式对其进行显化表示,从而提高译作的可接受性与知识传播效率。以此为导向,翻译技术将从当前的以信息匹配规则为中心逐渐演进为知识挖掘规则为中心,相关翻译工具也将从单一的符号转换器升级为知识传播与共享的枢纽,具备信息存储、信息匹配、知识获取、知识表示、知识推理、知识利用等多维度功能。 


三、翻译技术理论的知识维度拓展

        奥地利术语学家赫尔穆特•费尔伯(Helmut Felber)认为,知识理论是关于客体、思想世界和符号世界中知识构成物各要素及其对应关系的理论学说,它建立在客体理论、存在理论、概念理论、认识理论、符号理论和术语学理论的基础上,以信息科学知识、专业知识和具体科学的知识为基础(费尔伯2011: 131)。知识理论系统阐释知识的本质与结构,构建知识获取、表示、利用与创新的方法体系,它建立现实世界与思维世界之间的交流路径,为思维模型的结构化分析、知识网络的显性化表示和语义的符际传播提供系统化的学理依据和研究方法,是翻译技术理论向知识维度拓展的基石。具体而言,翻译技术知识维度研究的理论延展范围主要包括以下几个方面。

3.1 翻译技术知识化的内涵研究

        该部分主要涉及两组关系的阐释:一是知识与符号的关系,特别是专业领域内部概念与术语、逻辑关系与逻辑链、知识系统与知识表征之间的关系与转换方法;二是翻译技术与知识传播的关系,是指需要提高知识的可操控性,拓展面向翻译的知识理论应用途径,实现更加精准的语言匹配和语义表征,同时提高符号的可利用性,综合运用多模态手段提高知识传播效率。
3.2 面向翻译的术语学研究

        术语是专业领域知识系统的节点符号,是对整个知识系统进行构建与认知的门户,而术语和专业知识也是翻译实践活动的重要作业对象。因此,必须对术语进行多维度、标准化描述,明确术语在特定领域下的具体意义和术语之间的语义联系,分析术语翻译过程的意义对等、文化差异、实际语境等要素,突出包括信息采集整理、术语提取、成果发布应用的多语种术语标准化过程研究。
3.3 翻译技术与译者知识体系关联研究

        信息时代的职业译者必须借助翻译技术实现自身专业知识素养、信息技术素养( 刘明马晓雷2020: 57 )、行业伦理素养的提升,翻译技术研究的重要任务之一,就是对译者知识体系构成要素的内容分类、表现特征、习得途径、相互影响、发展变化进行全面论证,建立翻译教学手段和翻译技术工具应用与译者知识技能要素之间的映射关系,促进译者语言知识、跨文化知识、专业领域知识、技术知识和理论知识的完善。
3.4 知识化翻译平台建设研究

        知识化翻译平台集成语料库、术语库、知识库等语言知识资源,整合信息检索、翻译教学和知识习得功能,优化专业领域的术语描述方式和知识表示方式,拓宽译者获取信息与知识的渠道。知识化翻译平台的建设过程始于平行语料库建设,需要以细分专业领域文献为素材进行清洁、标注、对齐与术语提取,进而根据译者需求进行术语的筛选与高粒度化数据类目设置,之后依据该领域的知识结构建立概念之间的逻辑关系。


四、翻译技术实体的知识维度升级

        翻译技术实体主要包括翻译技术工具和翻译技术资源两种形式,其中翻译技术资源是翻译技术实体的核心部分,属于翻译研究基础设施范畴,其加工质量决定信息检索与知识提取的精度。知识理论不仅为翻译技术研究提供基层的理论基础,同时也涵盖元数据、信息粒度、知识本体等对知识进行描述、获取、表示和利用的具体方法,为大规模多语种翻译技术资源的组织、抽取与描述提供解决方案,提高信息检索效率、优化知识利用机制,满足译者在工作实践、学术研究与知识习得方面的需求。具体而言,知识理论将在语料库、术语库、知识库等翻译资源建设与可视化翻译服务平台建设中发挥基础性作用。 


4.1 元数据与语料库语义标注

        元数据是描述数据特征与内容的结构化数据,用于数据位置的标识、数据的多维度描述(Budin et al.2012:8)与标准化机器理解框架的建立。多语种语料库标注是元数据应用的典范,包括词汇标注、句法标注、语义标注、语篇标注 4 类,其本质是以元数据标签为媒介完成各级语素的计算机识别。除应用较为普遍的词汇、句法等语法标注之外,语义标注逐渐成为语料库标注研究的热点。语义标注一般以框架语义学或形式语义学为理论基础,将词性继续划分为语义类型,例如,德国图宾根大学建设的TüBa-D/Z语料库将名词划分为人物、国家、组织、事件、产品、语言、设施等类型(表1)。对于特定专业领域来说,元数据的类型与内涵也可以根据领域的知识特点和译者需求具体制定,经语义标注之后的语料中所包含的参与者、动作、性状、关系等核心要素被明确定位,这为自动化或半自动化的数据分析和知识提取奠定基础。


4.2 粒度与术语库词条描述

        信息粒度(granularity) 用于表示信息的细化程度,粒度越高,对数据单元的描述就越精细。交际术语学派代表人物卡布雷(Cabré)认为,术语是普通语言的一部分,必然受到词法、句法、语用和认知等语言要素的影响。因此,专业领域知识单位的术语是一个多维概念,包括语言成分、认知成分和社会交际成分(Cabré 2003:163)。在术语库编纂中,粒度等同于概念多面体侧面的数量,即描述一个词条使用的数据类目数量。国际标准化组织第 37技术委员会制订的ISO12620 协议规定术语数据类目分类标准,将一个词条分为概念层、术语层与文献层 3 部分,每一层设置多个元数据分项,共列举200多个类别,但只有术语词条、词条来源和发布日期是必需的(ISO12620 2009:12 )。这样的分类标准使术语库的数据结构具备相当程度的一致性,提高数据在不同平台之间的互操作性。在实际建库过程中,可以根据用户需求灵活设计词条类目。一般而言,译者使用术语库的主要目的是查询术语的标准译文和概念含义,所以诸如术语译文、概念定义、例句(语境)、优先级、关联术语等都是常用的词条类目。
4.3 知识本体与知识库概念关系构建

        知识本体是知识库的神经中枢,为知识检索、知识习得与知识推理提供基本依据。知识本体和基本知识单位一样,是人脑与客体相互作用的结果,它能够明确地、形式化地、可共享地描述这个领域中各个客体所代表的概念的体系。概念与概念关系是知识本体的基本要素: 概念是知识本体网络的节点,节点之间由概念关系相连,形式化地描述特定领域知识体系。概念关系包括一般概念关系与联想概念关系,这两类关系共同构成概念系统的基本形式。一般概念关系属于浅层概念关系,如同一关系、属种关系与整体部分关系等;联想概念关系是人脑根据专业领域知识特点所构建的用于显化表示该领域深层知识结构的特殊关系,包括功能关系、属性关系、因果关系、空间关系、时间关系等。专业领域的概念关系构建是知识库建设的关键环节,一般需要以人工干预与自动抽取相结合的方式进行,例如,西班牙格拉纳达大学(University of Granada)的EcoLexicon环境工程类多语种知识库以框架语义学为基础构建形式化表示环境工程领域知识结构的概念关系,并将概念关系、概念类型与自然语言进行匹配(表2)。该知识库以可视化词典的形式呈现环境工程领域的概念结构。当译者对某一术语进行检索时,不仅可以获取该术语的译文、定义、例句和关联术语,还可以通过知识库的地图功能定位该术语在整个环境领域概念结构中所处的位置。


五、结束语

        知识理论以结构化方法分析与表示符号中蕴含的语义,将抽象的思维转化为可以识别与操作的具体对象,规范化描述专业领域的概念关系与知识结构,强化基础性翻译资源的深度加工,为译者提供可靠的信息检索与知识习得保障,提高了知识传播与知识共享的效率,在翻译技术的本体认知、理论拓展、实体建设层面均有重要的应用价值。知识维度是翻译技术研究的重要着眼点,范围涵盖语料库语言学、术语翻译、词典编纂、自然语言处理、知识系统构建、知识可视化等许多关系紧密、相互交融的前沿研究领域,应整合相关研究资源,推进相关领域研究者之间的协作,在理论层面、实际操作层面与应用层面进一步深入探讨。


作者简介:宁海霖,天津商业大学外国语学院讲师,2016年维也纳国际术语学暑期学校学员,教育部人文社会科学基金项目主持人,参与国家社会科学基金重大项目、全国翻译专业学位研究生教育研究项目各1项,研究方向为术语翻译技术。
文献来源:《外语学刊》2021年第五期

本文来源于微信公众号“翻译技术教育与研究”、微信公众号“语言服务行业”,致力于语言服务行业资讯、洞察、洞见~ 关注我们,了解更多精彩内容~


用导图读论文 | 宁海霖:论翻译技术研究的知识维度的评论 (共 条)

分享到微博请遵守国家法律