【直播预告】SFFAI 118 同义句生成专题
同义句生成旨在生成具有不同语法实现的语义一致的句子,这不仅是对话系统、机器翻译等许多文本生成系统的重要组成部分,还有利于如语义解析、句子级表示学习、数据增强等自然语言处理任务。本期论坛我们邀请到了来自上海交通大学的陈文清同学,分享他提出的一种语义一致和语法变分的编码器-解码器框架,可以生成多个语义一致且语法不同的同义句。

讲者介绍
陈文清,上海交通大学人工智能研究院博士生,主要研究方向为自然语言处理中的因果推断、文本生成,目前已在ACL、EMNLP、IJCAI、COLING等会议上发表一作论文4篇,合作论文11篇。
会议题目
一种基于语义一致和语法变分的编码-解码同义句生成方法
会议摘要
大多数最近的研究都依赖于典型的编码器-解码器框架,其中生成过程是相对确定性的,缺乏多样性。在实践中,生成多个语法不同的同义句的能力对于文本生成系统的多样性提升很重要。最近的工作提出基于变分推断的编码器-解码器架构,引入一个额外采样的拉式变量以增加多样性。但拉式变量可能会被其他不相关句子的语义信息干扰,进而改变生成的同义句所传达的含义。在本文中,我们提出了一种语义一致和语法变分的编码器-解码器框架,该框架使用对抗性学习来确保语法该拉式变量是无语义的。此外,我们采用另一个判别器来提高词级和句子级的语义一致性。因此,所提出的框架可以生成多个语义一致且语法不同的同义句。实验表明,我们的模型在基于 n-gram 匹配和语义相似性的度量上优于基线模型,并且我们的模型可以通过组合不同的语法变量生成多个不同的同义句。

论文标题:A Semantically Consistent and Syntactically Variational Encoder-Decoder Framework for Paraphrase Generation
在线阅读:https://bbs.sffai.com/d/270
会议亮点
1、本文提出了一个目标感知的变分seq2seq框架,提取目标语句的语法变量并结合输入文本的语义变量以生成多个同义句;
2、本文还通过对抗学习和对比学习提高了生成的同义句的语义一致性;
3、实验不仅基于 n-gram 匹配,也基于语义相似性的度量,多方面证明了我们模型的有效性。
直播时间
2021年8月15日(周日)20:00—21:00 线上直播
关注微信公众号:人工智能前沿讲习,对话框回复“SFFAI118”,获取入群二维码
注:直播地址会分享在交流群内

现代科学技术高度社会化,在科学理论与技术方法上更加趋向综合与统一,为了满足人工智能不同领域研究者相互交流、彼此启发的需求,我们发起了SFFAI这个公益活动。SFFAI每周举行一期线下活动,邀请一线科研人员分享、讨论人工智能各个领域的前沿思想和最新成果,使专注于各个细分领域的研究者开拓视野、触类旁通。
SFFAI目前主要关注机器学习、计算机视觉、自然语言处理等各个人工智能垂直领域及交叉领域的前沿进展,将对线下讨论的内容进行线上传播,使后来者少踩坑,也为讲者塑造个人影响力。SFFAI还在构建人工智能领域的知识森林—AI Knowledge Forest,通过汇总各位参与者贡献的领域知识,沉淀线下分享的前沿精华,使AI Knowledge Tree枝繁叶茂,为人工智能社区做出贡献,欢迎大家关注SFFAI论坛:https://bbs.sffai.com。
