【活动通知】SFFAI 128 机器翻译专题
传统机器翻译读入完整的源端句子之后一次性输出翻译,而机器同声传译 (Simultaneous Machine Translation) 在阅读整个源句子的同时进行翻译,因此其性能由翻译质量和延迟两方面来评估。机器同传在不同的场景下往往有不同的延时需求,例如实时直播往往需要更低延时以提供更加流畅的翻译,而正式会议则侧重更高的翻译质量而允许稍高的延时。本期我们邀请到了来自计算技术研究所的张绍磊同学,介绍其构建的通用机器同传模型,使用一个模型在多个延时下完成高质量的翻译。

讲者介绍
张绍磊,中国科学院计算技术研究所直博生,主要研究方向为机器翻译、同声传译。以第一作者在 EMNLP、AAAI 等国际会议上发表论文3篇;参加全球第二届同声传译测评比赛并在流式输入赛道获得冠军;担任中国中文信息学会青年工作委员会学生执委,组织开展各项学术活动。
会议题目
多延时下的通用机器同声传译方法
会议摘要
现有的机器同声传译方法通常需要为每个延时训练并维护多个同传模型,导致计算成本很高和难以部署。在本文中,我们提出多专家混合Wait-k 策略以构建通用机器同传模型,仅使用一个模型在多个延时下完成高质量的翻译。在三个数据集上的实验表明,我们的方法可以仅使用一个通用模型在不同延迟下优于所有强基线,并且在高效性和鲁棒性上取得可喜的结果。
会议亮点
1、本文开发了一种能够在多延时下完成高质量翻译的通用机器同传方法;
2、本文探索了通过混合专家模型(Mixture-of-Expert)划分神经元以提升模型表征能力的具体方法;
3、本文提出的通用模型可以被当做一个机器同传内核,具有很强的拓展性。
直播时间
2021年11月14日(周日)20:00—21:00 线上直播
关注微信公众号:人工智能前沿讲习,对话框回复“SFFAI128”,获取入群二维码

现代科学技术高度社会化,在科学理论与技术方法上更加趋向综合与统一,为了满足人工智能不同领域研究者相互交流、彼此启发的需求,我们发起了SFFAI这个公益活动。SFFAI每周举行一期线下活动,邀请一线科研人员分享、讨论人工智能各个领域的前沿思想和最新成果,使专注于各个细分领域的研究者开拓视野、触类旁通。
SFFAI目前主要关注机器学习、计算机视觉、自然语言处理等各个人工智能垂直领域及交叉领域的前沿进展,将对线下讨论的内容进行线上传播,使后来者少踩坑,也为讲者塑造个人影响力。SFFAI还在构建人工智能领域的知识森林—AI Knowledge Forest,通过汇总各位参与者贡献的领域知识,沉淀线下分享的前沿精华,使AI Knowledge Tree枝繁叶茂,为人工智能社区做出贡献,欢迎大家关注SFFAI论坛:https://bbs.sffai.com。
