了解机器学习掌握知识点，读这一篇就够了！|新手必读

2021-07-07 19:07 作者:深度之眼官方账号 0人读过 | 我要投稿

机器学习应用在日常生活的方方面面：比如使用自然语言处理和机器学习来预约、查看日历和播放音乐的语音助手，到编程广告等等.机器学习的应用可以在我们想到之前预测我们需要什么。

机器学习科学领域的知识比较复杂，会导致大家在学习的时候感觉到难以顺利的掌握。今天这篇文章就是机器学习的学习路径，将从什么是机器学习讲到算法及其应用的具体例子。

part1/ 什么是机器学习？

一个计算机程序被称为从经验E中学习关于某类任务T和性能度量P的知识，如果它在T任务中的性能，如P所度量的，随着经验E的提高而提高。

——Tom M. Mitchell

机器学习的行为类似于孩子的成长，随着孩子的成长，她在执行任务T中的经验E会增加，从而导致更高的绩效指标 (P)。

例如，给一个孩子一个“形状排序块”玩具。（现在我们都知道，在这个玩具中，有不同的形状和形状孔）。在这种情况下，我们的任务T是为一个形状找到一个合适的形状孔。之后，孩子观察形状并尝试将其放入一个形状的孔中。

假设这个玩具有三种形状：圆形、三角形和方形。在她第一次尝试寻找形状孔时，她的表现测量(P)是1/3，这意味着孩子在3个正确的异形孔中找到了1个。

其次，孩子再试一次，这次她已经在这个任务中有了经验。考虑到获得的经验（E），孩子再次尝试这项任务，在衡量表现（P）时，结果是 2/3。重复这个任务 (T) 100 次后，宝宝就弄清楚哪个形状进入哪个形状孔了。

所以她的经验（E）增加了，她的表现（P）也增加了，然后我们注意到随着这个玩具尝试次数的增加，性能也会提高，从而提高准确性。

这种执行类似于机器学习：

一台机器所做的是，接受一个任务（T）执行，并测量性能（P）。现在一台机器拥有大量数据，当处理这些数据时，它的经验 (E) 会随着时间的推移而增加，从而导致更高的性能指标 (P)。

所以在处理完所有数据之后，机器学习模型的准确度增加了，这意味着模型做出的预测将非常准确。

Arthur Samuel对机器学习的另一个定义——机器学习是计算机科学的一个子领域，它赋予“计算机无需明确编程即可学习的能力”。

通俗的来解释下这个定义

它指出“无需明确编程即可学习”——就是说不会用一组特定的规则来教计算机，而是为计算机提供足够的数据，并给它时间从中学习，通过犯错并改进这些错误。

例如，我们没有教孩子如何适应形状，但是通过多次执行相同的任务，孩子学会了自己在玩具中适应形状。

part2 / 为什么我们需要机器学习？

例如，有一组猫和狗的图像。我们现在想把他们分为猫组和狗组。

为此，我们需要找出不同的动物特征，例如：

每只动物有几只眼睛？
每只动物的眼睛是什么颜色？
每只动物的身高是多少？
每只动物的重量是多少？
每只动物一般吃什么？

在以上每个问题的答案上形成一个向量，然后我们应用一组规则，例如：

如果身高>1英尺，体重>15磅，那么它可能是一只猫。

现在，为每个数据点制定这样一套规则。然后，放置if，elseif，else语句的决策树，检查它是否属于其中一个类别。

假设这个实验的结果没有成果，对许多动物进行了错误分类，这就给了使用机器学习的绝佳机会。因为，机器学习所做的是用不同类型的算法处理数据，并告诉我们哪个特征对确定它是猫还是狗更重要。

因此，我们可以基于两三个特征对其进行简化，而不是应用许多规则集，因此它为我们提供了更高的准确性。以前的方法不够通用，无法进行预测。

机器学习模型可以帮助我们完成许多任务：

例如：

物体识别
总结
预言
分类
聚类
推荐系统
和别的

part3/ 什么是机器学习模型？

可以这么理解——机器学习模型是一个问答系统，负责处理与机器学习相关的任务，将其视为解决问题时表示数据的算法系统。

主要机器学习算法

01 回归（预测）

可使用回归算法来预测连续值，回归算法：

线性回归
多项式回归
指数回归
逻辑回归
对数回归

02 分类

使用分类算法来预测一组项目的类别。分类算法：

K-最近邻
决策树
随机森林
支持向量机
朴素贝叶斯

03 聚类

使用聚类算法来总结或构建数据，聚类算法：

K均值
DBSCAN
均值漂移
分层的

04 关联

使用关联算法来关联共同发生的项目或事件，关联算法：

先验

05 异常检测

使用异常检测来发现异常活动和异常案例，如欺诈检测。

06 序列模式挖掘

使用序列模式挖掘来预测序列中数据示例之间的下一个数据事件。

07 降维

使用降维来减少数据的大小，以便仅从数据集中提取有用的特征。

08 推荐系统

使用推荐算法来构建推荐引擎。

例子：

Netflix 推荐系统。
图书推荐系统。
亚马逊上的产品推荐系统。
短视频平台的推荐系统。

part4 人工智能、机器学习和深度学习

看到这里可能你会问了，人工智能、机器学习和深度学习之间的根本区别是什么？大家说起机器学习的时候总是会同时说起人工智能和深度学习。

人工智能（AI）：

人工智能（AI）是由安德鲁·摩尔教授定义的一门科学和工程，它用计算机的行为方式来模拟人类智能。主要包括：

计算机视觉
语言处理
创造力
总结

机器学习（ML）：

正如Tom Mitchell教授所定义的，机器学习是指人工智能的一个科学分支，它侧重于计算机算法的研究，使计算机程序能够通过经验自动改进。主要包括：

分类
神经网络
聚类

深度学习：

深度学习是机器学习的一个子集，其中分层神经网络结合高计算能力和大数据集，可以创建强大的机器学习模型。

大家更喜欢Python来实现机器学习算法？

Python 是一种流行的通用编程语言。使用Python编写机器学习算法，效果很好。Python在数据科学家中如此受欢迎的原因是Python已经实现了各种各样的模块和库，让编程更顺畅。

简单介绍几个Python库：

Numpy

一个数学库，用于在Python中处理n维数组，能够高效地进行计算。

Scipy

数值算法和特定领域工具箱的集合，包括信号处理、优化、统计等等。Scipy是一个用于科学和高性能计算的函数库。

Matplotlib

流行的绘图包，提供2D绘图和3D绘图。

Scikit-learn

免费的Python编程语言机器学习库。有大部分分类、回归和聚类算法，并与 Numpy、Scipy等Python数值库配合使用。

part5 机器学习算法分为两类

监督学习算法
无监督学习算法

01 监督学习算法

目标：预测类别或值标签。

监督学习是机器学习的一个分支（目前是机器/深度学习的主流），从标记的训练数据中推断函数。训练数据由一组 *(input, target)* 对组成，其中输入可以是特征向量，目标指示我们希望函数输出的内容。

根据*目标*的类型，我们可以粗略地将监督学习分为两类：分类和回归。

分类涉及分类目标，示例范围从一些简单的案例（例如图像分类）到一些高级主题（例如机器翻译和图像标题）。

回归涉及连续的目标，它的应用包括股票预测、图像屏蔽等——都属于这一类。

下面以监督学习的例子来说明 | 来源：Shirota Yuri摄，Unsplash

举例说明监督学习

例如，我们给一个孩子100个毛绒动物，其中每种有10个动物，如10只狮子、10只猴子、10只大象等。接下来，我们教孩子根据动物的不同特征（特征）识别不同类型的动物。

如果它的颜色是橙色，那么它可能是一只狮子。如果它是一个有鼻子的大动物，那么它可能是一头大象。我们教孩子如何区分动物，这可以作为监督学习的一个例子。现在，当我们给孩子不同的动物时，他应该能够将它们归入适当的动物组。

通过这个例子发现孩子的分类中有 8/10 是正确的，这就证明孩子做得很好。

同样适用于计算机，当给计算机提供数千个数据点及其实际标记值（标记数据是将数据与其特征值一起分为不同的组），然后让计算机在训练期间从其不同的特征中学习。

训练期结束后，我们可以使用我们训练好的模型进行预测，可以说这个例子的预测是基于标记数据的。

监督学习算法示例

线性回归
逻辑回归
K-最近邻
决策树
随机森林
支持向量机

02 无监督学习

目标：确定数据模式/分组。

与监督学习相反，无监督学习从未标记的数据中推断，是一个描述数据中隐藏结构的函数。

无监督学习最基本的类型可能是降维方法，如PCA、t-SNE；PCA用于数据预处理；t-SNE通常用于数据可视化。

一个更高级的分支是聚类，用来探索数据中的隐藏模式，然后进行预测。包括K均值聚类、高斯混合模型、隐马尔可夫模型等。

随着深度学习的火热，无监督学习越来越受到关注，因为它可以摆脱手动标记数据的麻烦。

基于深度学习，来两种无监督学习：表征学习和生成模型。

表征学习旨在提炼出对某些下游任务有用的高级表征特征，而生成模型旨在从一些隐藏参数中再现输入数据。

下面以无监督学习的例子来说明 |

来源：Jelleke Vanooteghem 摄，Unsplash

举例说明无监督学习

无监督学习听起来很有效，在这种类型的算法中，我们没有标记数据，因此机器必须处理输入数据并尝试对输出做出结论。

还记得我们给了形状玩具的那个孩子吗？在这种情况下，他会从自己的错误中吸取教训，为不同的形状找到完美的形状孔。

但问题是，我们不是通过教授适合形状的方法（用于机器学习目的，称为标记数据）来喂养孩子。然而，孩子会从玩具的不同特性中学习，并试图对它们做出结论。简而言之，预测是基于未标记的数据。

无监督学习算法示例

降维
密度估计
市场篮子分析
生成对抗网络 (GAN)
聚类

【对这几种类型的回归算法的python示例明天的文章会给大家详细讲解，关注学姐不要错过重要知识点哦！】

https://pub.towardsai.net/machine-learning-algorithms-for-beginners-with-python-code-examples-ml-19c6afd60daa

作者：Pratik Shukla、Roberto Iriondo、Sherwin Chen

求素质三连（转发，点赞，收藏），再不行就点个赞也好！

标签：