欢迎光临散文网 会员登陆 & 注册

【读书笔记】算法漫步 第19章

2023-07-30 23:24 作者:圣斗士-DS-ALGO  | 我要投稿

问题16聚类

 

聚类是要将若干对象划分为几组,称每一组为一个类别。

也就是说,聚类本无类,只是根据对象之间的某种相似性,将它们分组。

 

聚类是一个无监督的学习过程,其目的就是把相似的数据聚合(划分)到一起。

 

设计分类算法的目的就是实现一个“分类器”。分类器的实现通常都是基于一批已知类别的数据,形成某些规则,来做未知类别对象的类别判断。

 

为了聚类,对象之间、类之间的相似性(或距离)含义和定义是基础。

 

如果用计算机来做聚类,也涉及距离的定义和计算。

 

本章介绍了

层次聚类和K-means(K均值)算法

 

 

【作者感受】

计算机来做聚类,如何设定对象的特征标准化和维度,如何根据对象的特征属性按照一定的规则计算相似性,都是很有挑战的事情,决定了聚类算法的实现难度,和聚类结果有意义的程度。


【读书笔记】算法漫步 第19章的评论 (共 条)

分享到微博请遵守国家法律