了解机器学习掌握知识点,读这一篇就够了!|新手必读
机器学习应用在日常生活的方方面面:比如使用自然语言处理和机器学习来预约、查看日历和播放音乐的语音助手,到编程广告等等.机器学习的应用可以在我们想到之前预测我们需要什么。
机器学习科学领域的知识比较复杂,会导致大家在学习的时候感觉到难以顺利的掌握。今天这篇文章就是机器学习的学习路径,将从什么是机器学习讲到算法及其应用的具体例子。
part1/ 什么是机器学习?

一个计算机程序被称为从经验E中学习关于某类任务T和性能度量P的知识,如果它在T任务中的性能,如P所度量的,随着经验E的提高而提高。
——Tom M. Mitchell
机器学习的行为类似于孩子的成长,随着孩子的成长,她在执行任务T中的经验E会增加,从而导致更高的绩效指标 (P)。
例如,给一个孩子一个“形状排序块”玩具。(现在我们都知道,在这个玩具中,有不同的形状和形状孔)。在这种情况下,我们的任务T是为一个形状找到一个合适的形状孔。之后,孩子观察形状并尝试将其放入一个形状的孔中。
假设这个玩具有三种形状:圆形、三角形和方形。在她第一次尝试寻找形状孔时,她的表现测量(P)是1/3,这意味着孩子在3个正确的异形孔中找到了1个。
其次,孩子再试一次,这次她已经在这个任务中有了经验。考虑到获得的经验(E),孩子再次尝试这项任务,在衡量表现(P)时,结果是 2/3。重复这个任务 (T) 100 次后,宝宝就弄清楚哪个形状进入哪个形状孔了。
所以她的经验(E)增加了,她的表现(P)也增加了,然后我们注意到随着这个玩具尝试次数的增加,性能也会提高,从而提高准确性。
这种执行类似于机器学习:
一台机器所做的是,接受一个任务(T)执行,并测量性能(P)。现在一台机器拥有大量数据,当处理这些数据时,它的经验 (E) 会随着时间的推移而增加,从而导致更高的性能指标 (P)。
所以在处理完所有数据之后,机器学习模型的准确度增加了,这意味着模型做出的预测将非常准确。
Arthur Samuel对机器学习的另一个定义——机器学习是计算机科学的一个子领域,它赋予“计算机无需明确编程即可学习的能力”。
通俗的来解释下这个定义
它指出“无需明确编程即可学习”——就是说不会用一组特定的规则来教计算机,而是为计算机提供足够的数据,并给它时间从中学习,通过犯错并改进这些错误。
例如,我们没有教孩子如何适应形状,但是通过多次执行相同的任务,孩子学会了自己在玩具中适应形状。
part2 / 为什么我们需要机器学习?
例如,有一组猫和狗的图像。我们现在想把他们分为猫组和狗组。
为此,我们需要找出不同的动物特征,例如:
每只动物有几只眼睛?
每只动物的眼睛是什么颜色?
每只动物的身高是多少?
每只动物的重量是多少?
每只动物一般吃什么?
在以上每个问题的答案上形成一个向量,然后我们应用一组规则,例如:
如果身高>1英尺,体重>15磅,那么它可能是一只猫。
现在,为每个数据点制定这样一套规则。然后,放置if,elseif,else语句的决策树,检查它是否属于其中一个类别。
假设这个实验的结果没有成果,对许多动物进行了错误分类,这就给了使用机器学习的绝佳机会。因为,机器学习所做的是用不同类型的算法处理数据,并告诉我们哪个特征对确定它是猫还是狗更重要。
因此,我们可以基于两三个特征对其进行简化,而不是应用许多规则集,因此它为我们提供了更高的准确性。以前的方法不够通用,无法进行预测。
机器学习模型可以帮助我们完成许多任务:
例如:
物体识别
总结
预言
分类
聚类
推荐系统
和别的
part3/ 什么是机器学习模型?
可以这么理解——机器学习模型是一个问答系统,负责处理与机器学习相关的任务,将其视为解决问题时表示数据的算法系统。
主要机器学习算法
01 回归(预测)
可使用回归算法来预测连续值,回归算法:
线性回归
多项式回归
指数回归
逻辑回归
对数回归
02 分类
使用分类算法来预测一组项目的类别。分类算法:
K-最近邻
决策树
随机森林
支持向量机
朴素贝叶斯
03 聚类
使用聚类算法来总结或构建数据,聚类算法:
K均值
DBSCAN
均值漂移
分层的
04 关联
使用关联算法来关联共同发生的项目或事件,关联算法:
先验
05 异常检测
使用异常检测来发现异常活动和异常案例,如欺诈检测。
06 序列模式挖掘
使用序列模式挖掘来预测序列中数据示例之间的下一个数据事件。
07 降维
使用降维来减少数据的大小,以便仅从数据集中提取有用的特征。
08 推荐系统
使用推荐算法来构建推荐引擎。
例子:
Netflix 推荐系统。
图书推荐系统。
亚马逊上的产品推荐系统。
短视频平台的推荐系统。
part4 人工智能、机器学习和深度学习
看到这里可能你会问了,人工智能、机器学习和深度学习之间的根本区别是什么?大家说起机器学习的时候总是会同时说起人工智能和深度学习。
人工智能(AI):
人工智能(AI)是由安德鲁·摩尔教授定义的一门科学和工程,它用计算机的行为方式来模拟人类智能。主要包括:
计算机视觉
语言处理
创造力
总结
机器学习(ML):
正如Tom Mitchell教授所定义的,机器学习是指人工智能的一个科学分支,它侧重于计算机算法的研究,使计算机程序能够通过经验自动改进。主要包括:
分类
神经网络
聚类
深度学习:
深度学习是机器学习的一个子集,其中分层神经网络结合高计算能力和大数据集,可以创建强大的机器学习模型。

大家更喜欢Python来实现机器学习算法?
Python 是一种流行的通用编程语言。使用Python编写机器学习算法,效果很好。Python在数据科学家中如此受欢迎的原因是Python已经实现了各种各样的模块和库,让编程更顺畅。
简单介绍几个Python库:
Numpy
一个数学库,用于在Python中处理n维数组,能够高效地进行计算。
Scipy
数值算法和特定领域工具箱的集合,包括信号处理、优化、统计等等。Scipy是一个用于科学和高性能计算的函数库。
Matplotlib
流行的绘图包,提供2D绘图和3D绘图。
Scikit-learn
免费的Python编程语言机器学习库。有大部分分类、回归和聚类算法,并与 Numpy、Scipy等Python数值库配合使用。
part5 机器学习算法分为两类
监督学习算法
无监督学习算法
01 监督学习算法
目标:预测类别或值标签。
监督学习是机器学习的一个分支(目前是机器/深度学习的主流),从标记的训练数据中推断函数。训练数据由一组 *(input, target)* 对组成,其中输入可以是特征向量,目标指示我们希望函数输出的内容。
根据*目标*的类型,我们可以粗略地将监督学习分为两类:分类和回归。
分类涉及分类目标,示例范围从一些简单的案例(例如图像分类)到一些高级主题(例如机器翻译和图像标题)。
回归涉及连续的目标,它的应用包括股票预测、图像屏蔽等——都属于这一类。

举例说明监督学习
例如,我们给一个孩子100个毛绒动物,其中每种有10个动物,如10只狮子、10只猴子、10只大象等。接下来,我们教孩子根据动物的不同特征(特征)识别不同类型的动物。
如果它的颜色是橙色,那么它可能是一只狮子。如果它是一个有鼻子的大动物,那么它可能是一头大象。我们教孩子如何区分动物,这可以作为监督学习的一个例子。现在,当我们给孩子不同的动物时,他应该能够将它们归入适当的动物组。
通过这个例子发现孩子的分类中有 8/10 是正确的,这就证明孩子做得很好。
同样适用于计算机,当给计算机提供数千个数据点及其实际标记值(标记数据是将数据与其特征值一起分为不同的组),然后让计算机在训练期间从其不同的特征中学习。
训练期结束后,我们可以使用我们训练好的模型进行预测,可以说这个例子的预测是基于标记数据的。
监督学习算法示例
线性回归
逻辑回归
K-最近邻
决策树
随机森林
支持向量机
02 无监督学习
目标:确定数据模式/分组。
与监督学习相反,无监督学习从未标记的数据中推断,是一个描述数据中隐藏结构的函数。
无监督学习最基本的类型可能是降维方法,如PCA、t-SNE;PCA用于数据预处理;t-SNE通常用于数据可视化。
一个更高级的分支是聚类,用来探索数据中的隐藏模式,然后进行预测。包括K均值聚类、高斯混合模型、隐马尔可夫模型等。
随着深度学习的火热,无监督学习越来越受到关注,因为它可以摆脱手动标记数据的麻烦。
基于深度学习,来两种无监督学习:表征学习和生成模型。
表征学习旨在提炼出对某些下游任务有用的高级表征特征,而生成模型旨在从一些隐藏参数中再现输入数据。

来源:Jelleke Vanooteghem 摄,Unsplash
举例说明无监督学习
无监督学习听起来很有效,在这种类型的算法中,我们没有标记数据,因此机器必须处理输入数据并尝试对输出做出结论。
还记得我们给了形状玩具的那个孩子吗?在这种情况下,他会从自己的错误中吸取教训,为不同的形状找到完美的形状孔。
但问题是,我们不是通过教授适合形状的方法(用于机器学习目的,称为标记数据)来喂养孩子。然而,孩子会从玩具的不同特性中学习,并试图对它们做出结论。简而言之,预测是基于未标记的数据。
无监督学习算法示例
降维
密度估计
市场篮子分析
生成对抗网络 (GAN)
聚类
【对这几种类型的回归算法的python示例明天的文章会给大家详细讲解,关注学姐不要错过重要知识点哦!】

https://pub.towardsai.net/machine-learning-algorithms-for-beginners-with-python-code-examples-ml-19c6afd60daa
作者:Pratik Shukla、Roberto Iriondo、Sherwin Chen
求素质三连(转发,点赞,收藏),再不行就点个赞也好!