欢迎光临散文网 会员登陆 & 注册

论文阅读:Zero-shot 综述

2023-03-26 22:47 作者:您看我还有机会口马  | 我要投稿

声明:请勿参考,因为该笔记主要为了自己梳理和表达知识,附带大量脑补(否则后果自负)

论文标题:A Survey of Zero-Shot Learning:Settings,Methods,and Applications(TIST2019, SCI三区)


1.Introduction

       监督学习取得了很大的成功

       但是,监督分类,通常是需要大量标记的数据的,另外,习得的分类器只能识别出训练集里面含有的类别,这个是它的局限。因为在某些情况中,训练集并不充足,或者需要分类的对象并不在训练集包含的类别中。(插句题外话,近几年不是有挺多ood的分类算法,发表在顶刊里了么,可能这篇文章太老了吧)

         为了解决”让分类器去学习这些训练实例很少的类“的问题,few shot/one shot方法横空出世啦!在这些方法中,对“实例稀少的类别”进行学习的同时,其他类别的实例的内容也会被用上哦。

         接下来介绍,为了应对这种先前没见过的实例,文章里列举了一些方法喔:

1.open set recognition methods

2.cumulative learning and class-incremental learning methods

3.open word recognition

 

         在上述的方法中,如果被测实例属于unseen类别(就是说在模型学习的时候没有该类的标签),那么分类器就没法确定它的标签。但是有些情况下,我们又需要模型能知道它们的标签。下面是一些场景:

  • 目标类别的数量非常庞大。比如说动作检测任务,人的动作有很多种,但是有标记的动作就很有限呀,既然标记所有的动作是不现实的,那当然希望模型能够识别unseen类别啦。

  • 目标类别是非常罕见的。比如细粒度目标分类,我们得辨别出花的不同品种,那很多稀有的品种也没法给出标记啊,那咱们也希望辨别出来呀,这就需要zero-shot呀。

  • 目标的类别经常变化。

  • 一些任务中,获取标记的成本非常高。比如图像的语义分割问题,语义分割是从像素级别归类,也就是需要对每个像素进行标记

       为了解决这个问题,zero-shot learning(zero data learning)就被提出啦!它的目的,我们前面已经提过了,就是去分类出那些,属于“类内无标记实例”的类别喔。文章中还提到,自从它被创立以来,在ML中发展很快喔,在CV领域、NLP领域和普适计算领域有广泛应用喔。


       其实我有些搞不明白zero-shot learning 和 out-of-distribution(ood) sample识别之间有什么区别。zero-shot是去识别unseen class的类别,那么ood samples也算是在分布之外的样本,也是没有标记的,他们两者好像有相通之处哇?

       看了CSDN上一篇博客说,ood更偏向于异常检测。我也记得(凭印象)我在一篇讲“Noisy Graph Cleaning”的文章里面看到,作者处理问题的背景是关于应对噪声数据的(学习或者检测过程中),给出了ind分类和ood检测。所以貌似ood更偏向于噪声数据处理吧。


论文阅读:Zero-shot 综述的评论 (共 条)

分享到微博请遵守国家法律