【直播预告】SFFAI 115 对话系统专题
在任务型对话系统中,域外(Out-of-domain, OOD)意图检测是相当重要的一个模块。它能够防止模型将这类意图错误分类为某个域内意图,从而发生预期外的系统行为。例如对于一个智能音乐软件里的对话系统,用户给出例如“购买某本图书”的对话请求即为域外意图。本期我们邀请到来自北京邮电大学的严渊蒙,分享他如何在无监督设置下基于马氏距离的生成式分类器来检测OOD样本。

讲者介绍
严渊蒙,北京邮电大学模式识别实验室硕士生,自然语言处理方向,导师为徐蔚然老师。其主要研究方向为对话系统中的口语理解,特别是少样本情况下的迁移学习、自监督学习等技术,目前已在ACL、EMNLP等会议上发表多篇论文。
会议题目
一种基于马氏距离的生成式OOD检测方法
会议摘要
本文中我们主要探索无监督设置下的OOD意图检测方法,即训练过程中只有有监督的域内语料是可获取的,而无法获取到域外的标注语料。我们提出了一个简单但强大的基于马氏距离的生成式分类器来检测OOD样本。具体来说,我们使用高斯判别分析(Gaussian Discriminant Analysis, GDA)对编码器导出的域内样本的特征进行建模以避免基于softmax的分类器过度自信的问题;同时我们比较了在特征空间中使用欧氏距离和马氏距离进行OOD意图判别的性能,显示了使用马氏距离进行OOD意图判别的优势。我们在四个基准数据集上进行实验,结果证明我们的方法显著优于若干基线。

论文标题:A Deep Generative Distance-Based Classifier for Out-of-Domain Detection with Mahalanobis Space
在线阅读:https://bbs.sffai.com/d/260-ood
会议亮点
1、我们提出了一种基于距离函数的生成式OOD检测方法,用于无监督的OOD意图检测任务;
2、我们在传统欧氏距离的基础上,引入马氏距离,并且比较了欧氏距离和马氏距离的性能优劣,结果显示马氏距离相比欧氏距离能够更好地处理特征之间的相关性,从而在OOD意图检测任务上获得更好的效果;
3、在四个公开数据集上的实验证明了我们的方法显著优于此前的基线。
直播时间
2021年7月25日(周日)20:00—21:00 线上直播
关注微信公众号:人工智能前沿讲习,对话框回复“SFFAI115”,获取入群二维码
注:腾讯会议直播地址会分享在交流群内

现代科学技术高度社会化,在科学理论与技术方法上更加趋向综合与统一,为了满足人工智能不同领域研究者相互交流、彼此启发的需求,我们发起了SFFAI这个公益活动。SFFAI每周举行一期线下活动,邀请一线科研人员分享、讨论人工智能各个领域的前沿思想和最新成果,使专注于各个细分领域的研究者开拓视野、触类旁通。
SFFAI目前主要关注机器学习、计算机视觉、自然语言处理等各个人工智能垂直领域及交叉领域的前沿进展,将对线下讨论的内容进行线上传播,使后来者少踩坑,也为讲者塑造个人影响力。SFFAI还在构建人工智能领域的知识森林—AI Knowledge Forest,通过汇总各位参与者贡献的领域知识,沉淀线下分享的前沿精华,使AI Knowledge Tree枝繁叶茂,为人工智能社区做出贡献,欢迎大家关注SFFAI论坛:https://bbs.sffai.com。
