欢迎光临散文网 会员登陆 & 注册

Talk预告 | 谢菲尔德大学NLP组系列①:基于对比-对偶学习的稠密信息检索模型

2022-03-31 12:49 作者:TechBeat人工智能社区  | 我要投稿


本期为TechBeat人工智能社区392线上Talk。北京时间3月30(周三)20:00,谢菲尔德大学计算机系副教授—林成华和谢菲尔德大学计算机系在读博士生—李一之Talk将准时在TechBeat人工智能社区开播!

他们与大家分享的主题是:“谢菲尔德大学NLP组及Lincedo实验室简介”和“基于对比-对偶学习的稠密信息检索模型”,届时将介绍一个利用对偶 Query Retrieval 任务,在原有训练数据集上对表征做进一步优化学习并提升检索性能的工作。


Talk·信息

主题:基于对比-对偶学习的稠密信息检索模型 

嘉宾:谢菲尔德大学计算机系副教授 林成华谢菲尔德大学计算机系在读博士生 李一之

地点:TechBeat人工智能社区

http://www.techbeat.net/

长按识别二维码,一键预约TALK!


完整版怎么看?

扫描下方二维码,或复制链接https://datayi.cn/w/WoMpVdYP至浏览器,一键完成预约!上线后会在第一时间收到通知哦


Talk·提纲

 谢菲尔德大学NLP组及Lincedo实验室简介 

谢菲尔德大学系“英国常春藤”罗素集团创始成员、六所红砖大学之一,常年稳居全球前100。计算机系拥有近60位教职人员(faculty),包含自然语言处理、语音、机器学习、计算机视觉等10个研究组。在最新英国官方权威科研力量评估中(Research Excellence Framework),谢菲尔德大学计算机系排名全英第五。自然语言处理组成立于1993年,现有10+教职人员、60+博士后/博士生,是欧洲最大和最成功的自然语言处理组之一。

具体分享提纲如下:

1. 谢菲尔德大学概况

2. 自然语言处理(NLP)组概况

3. Lincedo实验室概况


 基于对比-对偶学习的稠密信息检索模型 

现有的 dense retrieval 模型的目标大多是为文档检索任务学习到合适的query和document表征。由于训练集数据量大,标注困难,Dense Retrieval 往往采用基于对比学习的半监督学习框架来对 Document Retrieval 任务进行训练。在Talk中讲者将会介绍一个利用对偶 Query Retrieval 任务,在原有训练数据集上对表征做进一步优化学习并提升检索性能的工作。

具体分享提纲如下:

1. 对 Dense Retriever 类型的文档检索方法、模型训练方式做简要介绍

2. 介绍基于对比学习和对偶学习的训练方法

3. 对模型的性能测试和表征空间进行分析


Talk·预习资料

[1] Karpukhin, Vladimir, Barlas Oğuz, Sewon Min, Ledell Wu, Sergey Edunov, Danqi Chen, and Wen-tau Yih. 2020. ‘Dense Passage Retrieval for Open-Domain Question Answering’. ArXiv:2004.04906 [Cs],April. http://arxiv.org/abs/2004.04906[2] Xiong, Lee, Chenyan Xiong, Ye Li, Kwok-Fung Tang, Jialin Liu, Paul N. Bennett, Junaid Ahmed, and Arnold Overwijk. 2020. ‘Approximate Nearest Neighbor Negative Contrastive Learning for Dense Text Retrieval’. In .https://openreview.net/forum?id=zeFrfgyZln.[3] Wang, Tongzhou, and Phillip Isola. 2020. ‘Understanding Contrastive Representation Learning through Alignment and Uniformity on the Hypersphere’. ArXiv:2005.10242 [Cs, Stat], November.http://arxiv.org/abs/2005.10242.[4] Xia, Yingce, Tao Qin, Wei Chen, Jiang Bian, Nenghai Yu, and Tie-Yan Liu. 2017. ‘Dual Supervised Learning’. ArXiv:1707.00415 [Cs, Stat], July.http://arxiv.org/abs/1707.00415.


Talk·提问交流

通过以下两种方式提问都将获得微信现金红包奖励哦!

式 ①

在Talk界面下的【交流区】参与互动!留下你的打call🤟和问题🙋,和更多小伙伴们共同讨论,被讲者直接翻牌解答!

你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!


方式 ②

在本文留言区直接提出你的问题,或扫描下方二维码提问!

快来提问啦!


Talk·嘉宾介绍

林成华  谢菲尔德大学计算机系副教授

林成华,英国谢菲尔德大学计算机系副教授,博士生导师,系研究与创新副主任(Deputy Director of Research and Innovation), 系自然语言处理研究组核心成员,主要从事自然语言处理/生成,对话及问答系统,知识图谱嵌入,自动摘要,情感分析,多模态深度学习等相关技术的研究。作为项目负责人主持过多项英国国家工程和物理科学研究基金、 英国国家经济与社会研究基金面上项目,以及与知名企业(BBC,三星,腾讯,JP Morgan等)合作的横向课题。在国际权威期刊和一流学术会议(如ACL,ICML,EMNLP,NAACL,ICDE,CIKM,TKDE,TASLP)上发表论文近90篇,谷歌学术引用2700+。发表的论文曾获得ACM国际信息与知识管理大会(CIKM)2020 年度时间检验奖,国际自然语言生成大会(INLG) 2019最佳论文提名奖,国际自然语言及信息系统大会(NLDB)2017最佳论文奖。2019年荣获苏格兰国家信息科学和计算机联盟(SICSA)年度最佳博士生导师提名奖(全英国仅提名五人)。现为Computer Speech and Language,Neurocomputing等知名期刊编委,自然语言处理顶级期刊TACL以及Computational Linguistics的Standing Reviewer,2022年ACL亚太分会(AACL)和国际自然语言处理联合会议 (International Joint Conference on Natural Language Processing) 研讨会共同主席,2019年担任自然语言生成旗舰学术会议INLG程序委员会共同主席,并多次次担任ACL(2022),EMNLP(2020,2021),IJCAI(2021),INLG(2020), NLPCC(2022)等国际国内顶级学术会议(高级)领域主席。

个人主页:

https://chenghualin.wordpress.com/

李一之  谢菲尔德大学计算机系在读博士生

2020年取得北京邮电大学计算机与科学技术本科学位,2022年入学谢菲尔德大学,就读于计算机系。研究经历包含基于生成对抗网络的谣言检测、基于语言模型的文档检索以及知识图谱的链接预测等。

个人主页:

https://www.linkedin.com/in/yizhi-li-854028193/

长按识别二维码,一键预约TALK!


关于TechBeat人工智能社区

TechBeat (www.techbeat.net) 是一个荟聚全球华人AI精英的成长社区。 我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。 期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!

更多详细介绍>>https://mp.weixin.qq.com/s/pTbCK_MeTk05jK2yx1RTrQ

Talk预告 | 谢菲尔德大学NLP组系列①:基于对比-对偶学习的稠密信息检索模型的评论 (共 条)

分享到微博请遵守国家法律