Talk预告 | 清华大学在读博士生詹靖涛:基于联合优化编码和索引的高效向量检索模型

本期为TechBeat人工智能社区第403期线上Talk。北京时间5月5日(周四)20:00,清华大学在读博士生——詹靖涛的Talk将准时在TechBeat人工智能社区开播!
他与大家分享的主题是: “基于联合优化编码和索引的高效向量检索模型”,届时将介绍目前基于联合优化来提升向量检索有效性的相关研究。
Talk·信息
主题:基于联合优化编码和索引的高效向量检索模型
嘉宾: 清华大学在读博士生詹靖涛
时间:北京时间 5月5日 (周四) 20:00
地点:TechBeat人工智能社区
http://www.techbeat.net/

完整版怎么看?
扫描下方二维码,或复制链接https://datayi.cn/w/QReKddno至浏览器,一键完成预约!上线后会在第一时间收到通知哦
Talk·提纲
近年来,稠密向量检索技术逐渐成为重要的第一阶段检索的技术。通过把查询和文档表征为稠密向量,这一技术取得了比传统检索方法更好的召回结果。然而,基于稠密向量的暴力搜索会导致巨大的存储和计算开销,使得这一检索技术较为低效。本次Talk介绍目前基于联合优化来提升向量检索有效性的相关研究。这些研究对表征进行乘积量化,从而提升了存储和计算的效率。同时,编码器和乘积量化算法会进行联合优化,这使得检索性能不会因为量化而损失。研究表明,这种方法可以在大大提升检索效率的同时几乎不损害检索性能。
具体分享提纲如下:
1. 背景知识:双塔模型,PQ
2. RepCONC模型:第一阶段的联合训练(侧重可导的优化),第二阶段的联合训练(侧重端到端的优化)
3. 实验结果
4. 总结
5. 未来工作
Talk·提问交流
通过以下两种方式提问都将获得微信现金红包奖励哦!
方式 ①
在Talk界面下的【交流区】参与互动!留下你的打call🤟和问题🙋,和更多小伙伴们共同讨论,被讲者直接翻牌解答!
你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!
方式 ②
在本文留言区直接提出你的问题,或扫描下方二维码提问!

Talk·嘉宾介绍

詹靖涛目前为清华大学计算机系的在读博士生,于2020年获得清华大学学士学位。他的研究方向是信息检索,目前专注于提升稠密向量检索模型的有效性、效率和可解释性。他在顶级IR会议上发表了若干篇论文,包括SIGIR、theWebConf、WSDM和CIKM,曾获得WSDM 2022最佳论文奖。
个人主页:
https://jingtaozhan.github.io/


关于TechBeat人工智能社区
TechBeat (www.techbeat.net) 是一个荟聚全球华人AI精英的成长社区。 我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。 期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!
更多详细介绍>>https://mp.weixin.qq.com/s/pTbCK_MeTk05jK2yx1RTrQ