欢迎光临散文网 会员登陆 & 注册

Talk预告 | 字节跳动AI Lab叶蓉&董倩倩: 端到端语音翻译中的知识融合方法

2021-08-17 11:04 作者:TechBeat人工智能社区  | 我要投稿


本期为TechBeat人工智能社区335线上Talk。

北京时间8月18(周三)晚8点字节跳动AI Lab 算法工程师—叶蓉和字节跳动AI Lab 算法研究员—董倩倩的Talk将准时在TechBeat人工智能社区开播!

她们与大家分享的主题是: “端到端语音翻译中的知识融合方法”,届时将介绍她们在利用融合多源知识提升系统性能过程中所遇到的挑战和进展。

Talk·信息

主题:端到端语音翻译中的知识融合方法

嘉宾:字节跳动AI Lab 算法工程师

叶蓉

字节跳动AI Lab 算法研究员

董倩倩

时间:北京时间 8月18日 (周三) 20:00

地点:TechBeat人工智能社区

http://www.techbeat.net/


完整版怎么看?

扫描下方二维码,或复制链接https://datayi.cn/w/kojkdLw9至浏览器,一键完成预约!上线后会在第一时间收到通知哦~


Talk·提纲

端到端建模缓解了传统级联语音翻译方法的不足,但是缺少有标注的训练数据严重制约了这一研究领域的发展。一个可商用的中、英语音识别系统需要使用上万小时音频-转写平行数据训练得到,而一个商用的中到英文本机器翻译系统则需要上亿条平行句对训练得到,而目前可用于语音翻译模型训练的音频-翻译标注数据的量级只有几百小时。如何融合多源知识来提升系统性能是目前亟需考虑的问题。

端到端语音翻译的背景介绍:

· LUT:学习单语预训练模型的知识

· COSTT:利用双语平行数据的知识

· XSTnet:渐进式融合多源知识


Talk·参考资料

这是本次分享中将会提及的资料,建议提前预习哦!

[1] LUT

https://arxiv.org/abs/2009.09704

[2] COSTThttps://arxiv.org/abs/2009.09737

[3] XSTnet

https://arxiv.org/pdf/2104.10380


Talk·提问交流

通过以下两种方式提问都将获得微信现金红包奖励哦!

方式 ①

在Talk界面下的【交流区】参与互动!留下你的打call🤟和问题🙋,和更多小伙伴们共同讨论,被讲者直接翻牌解答!

你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!


方式 ②

在本文留言区直接提出你的问题,或扫描下方二维码提问!

扫码来提问!

Talk·嘉宾介绍

叶蓉

字节跳动AI Lab 算法工程师

叶蓉,字节跳动AI Lab算法工程师,硕士毕业于复旦大学。她主要研究方向为语音翻译和文本生成,并以第一作者/主要作者在ICLR/AAAI/InterSpeech等发表论文。

个人主页:

https://github.com/ReneeYe

董倩倩

字节跳动AI Lab 算法研究员

董倩倩,现在是字节跳动 AI Lab研究员,博士毕业于中科院自动化所听觉模型和认知计算实验室,导师为徐波研究员,曾获第一届AI Challenger比赛机器同声传译赛道冠军。她主要研究兴趣为语音翻译、机器翻译、语音识别,并以第一作者/主要作者在AAAI、ACL、COLING、IWSLT等自然语言处理/机器学习的会议上发表论文数篇,并长期担任相关会议的审稿人。

个人主页:

https://github.com/dqqcasia


关于TechBeat人工智能社区

TechBeat (www.techbeat.net) 是一个荟聚全球华人AI精英的成长社区。 我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。 期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!

更多详细介绍>>https://mp.weixin.qq.com/s/pTbCK_MeTk05jK2yx1RTrQ

Talk预告 | 字节跳动AI Lab叶蓉&董倩倩: 端到端语音翻译中的知识融合方法的评论 (共 条)

分享到微博请遵守国家法律