欢迎光临散文网 会员登陆 & 注册

【清华347认知智能】零基础学人工智能12

2023-06-08 19:10 作者:水木上岸教育官方号  | 我要投稿


从数据中学习

机器学习方法通常是从已知数据(data) 中去学习数据中蕴含的规律或者判断规则但是,已知数据主要是用作学习的素材,而学习的主要目的是推广(geraize),也就是把学到的规则应用到未来的新数据上并做出判断或者预测。机器学习有多种不同的方式。最常见的一种机器学 习方式是监督学习(supervied leaming)。下面我们看一-个例子。 这里,我们希望能得到一个公式来预测一种宝石的价格。而我们知道这种宝石的价格主要由它的重量和等级确定。如果我们使用监督学习的方法,为了得到这个价格公式,我们]需要先收集-批宝石价格的数据,如表1-1。

现在我们准备根据表1-1来学习一个可用于价格预测的公式。表中每一行称为一个样本(sample)。 我们可以看到,每个样本包含了两个部分:用于预测的输人信息(重量、等级)和预测量(价格)的真实值。通过表1-1,我们可以对不同的预测公式进行测试,并通过比较在每个样本上的预测值和真实价格的差别获得反馈。机器学习的算法然后依据这些反馈不断地对预测的公式进行调整。在这种学习方式中,预测量的真实值通过提供反馈对学习过程起到了监督的作用。我们称这样的学习方式为监督学习。在实际应用中,监督学习是一种非常高效的学习方式。我们会在后面的章节中介绍监督学习的具体方法。

 

监督学习要求为每个样本提供预测量的真实值,这在有些应用场合是有困难的。比如在医疗诊断的应用中,如果要通过监督学习来获得诊断模型,则需要请专业的医生对大量的病例及它们的医疗影像资料进行精确标注。这需要耗费大量的人力,代价非常高昂。为了克服这样的困难,研究者们也在积极探索不同的方法,希望可以在不提供监督信息(预测量的真实值)的条件下进行学习。我们称这样的方法为无监督学习(unsupervised leaming)。无监督学习往往比监督学习困难得多,但是由于它能帮助我们克服在很多实际应用中获取监督数据的困难,因此-直是人工智能发展的一个重要研究方向。近年来,还有另外一种被称为半监督学习的学习方式也受到了广泛关注。半监督学习(semi supervised lerning)介于监督学习与无监督学习之间,它要求对小部分的样本提供预测量的真实值。这种方法通过有效利用所提供的小部分监督信息,往往可以取得比无监督学习更好的效果,同时也把获取监督信息的成本控制在可以接受的范围。

 


【清华347认知智能】零基础学人工智能12的评论 (共 条)

分享到微博请遵守国家法律