北大公开课-人工智能基础 53 研读机器学习的视角之机器学习的三个视角




七个典型的机器学习任务
典型的通过机器学习要解决的具体问题,可以分为七类

分类任务是指将数据分为不同的类别,分类前已知要分为几类(如下面的信用评分的二分类,将所有的客户分为优质客户和普通客户)
回归任务是指预测数值型数据,
聚类任务是指将数据分为不同的簇,分类前不知道要分几类。以数据的实际情况来决定最后如何分类,分几类。
排名,数据按固有的排名重新排序
密度估计是指在机器学习任务中,通过已有的数据,估计出数据的概率密度函数,从而对新的数据进行分类或者回归1。常见的密度估计方法有参数估计和非参数估计两种2。其中,非参数估计方法包括直方图法、核密度估计法等3。
降维任务是指将高维数据映射到低维空间中。
优化,主要指优化性能和算法、模型



机器学习的学习范式主要指有监督学习、无监督学习和半监督学习1。其中,有监督学习是指在训练数据中给出了正确的标签,模型通过学习这些标签来预测新数据的标签;无监督学习是指在训练数据中没有给出正确的标签,模型通过学习数据本身的特征来发现数据中的规律;半监督学习是指在训练数据中只有部分数据有正确的标签,模型通过学习这些标签和数据本身的特征来预测新数据的标签1。

通过reward,来优化性能



机器学习的学习模型是指在经过训练后可以识别特定类型的模式的文件1。训练模型就是用已有的数据,通过一些方法(最优化或者其他方法)确定函数的参数,参数确定后的函数就是训练的结果,使用模型就是把新的数据代入函数求值23。



卷积神经网络(Convolutional Neural Networks,简称CNN)是一种具有局部连接、权值共享等特点的深度前馈神经网络,是深度学习的代表算法之一,擅长处理图像特别是图像识别等相关机器学习问题,比如图像分类、目标检测、图像分割等各种视觉任务中都有显著的提升效果1。
CNN卷积神经网络最重要的核心在于赋权,及权值的全局可调整性。
CNN的结构可以分为3层:
卷积层(Convolutional Layer) - 主要作用是提取特征。
池化层(Max Pooling Layer) - 主要作用是下采样(downsampling),却不会损坏识别结果。
全连接层(Fully Connected Layer) - 主要作用是分类2。


