欢迎光临散文网 会员登陆 & 注册

ApacheCN 机器学习实战讲义 十、K-Means

2018-05-02 07:03 作者:绝不原创的飞龙  | 我要投稿

K-Means 算法

聚类是一种无监督的学习, 它将相似的对象归到一个簇中, 将不相似对象归到不同簇中.
相似这一概念取决于所选择的相似度计算方法.
K-Means 是发现给定数据集的 K 个簇的聚类算法, 之所以称之为 K-均值 是因为它可以发现 K 个不同的簇, 且每个簇的中心采用簇中所含值的均值计算而成.
簇个数 K 是用户指定的, 每一个簇通过其质心(centroid), 即簇中所有点的中心来描述.
聚类与分类算法的最大区别在于, 分类的目标类别已知, 而聚类的目标类别是未知的.

优点: 容易实现 缺点:可能收敛到局部最小值, 在大规模数据集上收敛较慢 使用数据类型 : 数值型数据

阅读全文:http://ml.apachecn.org/mlia/kmeans/

ApacheCN 机器学习实战讲义 十、K-Means的评论 (共 条)

分享到微博请遵守国家法律