北大公开课-人工智能基础 51 研读机器学习的视角之机器学习的历史


【Reinforcement leraning】
强化学习是一种机器学习方法,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题1。强化学习是智能体(Agent)以“试错”的方式进行学习,通过与环境进行交互获得的奖赏指导行为,目标是使智能体获得最大的奖赏2。强化学习不同于连接主义学习中的监督学习,主要表现在强化信号上,强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价(通常为标量信号),而不是告诉强化学习系统如何去产生正确的动作2。
【SVM】
支持向量机(Support Vector Machine,SVM)是一种二分类模型,它的基本模型是定义在特征空间上的间隔最大的线性分类器,间隔最大使它有别于感知机;SVM还包括核技巧,这使它成为实质上的非线性分类器。支持向量机在文本分类、图像识别、手写字符识别、生物信息学等方面都有着广泛的应用123。
【AdaBoost】
AdaBoost是一种集成学习算法,它通过加权多个弱分类器来构建一个强分类器。AdaBoost的基本思想是对于那些被前一轮分类器分错的样本,提高其权值,使得后一轮分类器能够更加关注这些被分错的样本,从而提高分类器的准确率。AdaBoost在人脸检测、目标识别、文本分类等领域都有着广泛的应用12。
【Random Forests】
随机森林是一种集成学习算法,它通过构建多个决策树来进行分类或回归。随机森林的基本思想是通过对训练数据进行有放回的随机抽样,构建多个决策树,然后通过投票或取平均值的方式来决定最终的分类结果。随机森林算法具有很好的鲁棒性和准确性,能够有效地处理高维数据和大规模数据集。随机森林算法在金融、医疗、电子商务等领域都有着广泛的应用。
【深度学习】
深度学习是一种机器学习算法,它通过构建多层神经网络来进行分类或回归。深度学习的基本思想是通过对训练数据进行多次迭代,不断调整神经网络的权重和偏置,从而使得神经网络能够自动地从数据中学习到特征和规律。深度学习算法具有很好的鲁棒性和准确性,能够有效地处理高维数据和大规模数据集。深度学习算法在计算机视觉、自然语言处理、语音识别等领域都有着广泛的应用

另外一种关于机器学派的分类及认识。
符号学派、联结学派和贝叶斯学派1。这三个学派的区别和特点如下:
符号学派:将学习看作逆向演绎,并从哲学、心理学、逻辑学中寻求洞见。
联结学派:对大脑进行逆向分析,灵感来源于神经科学和物理学。
贝叶斯学派:认为学习是一种概率推理形式,理论根基在于统计学。

