即将发布的MATLAB聚类工具箱,支持自动寻找最优簇数和可视化、还支持自动生成代码
MATLAB的机器学习工具箱和深度学习工具箱都非常强大,然而官方对于无监督学习中的聚类迟迟没有一个很完善的工具箱,于是我开发了该工具箱,该工具箱不仅能得到聚类结果,还支持自动生成代码帮助大家复现结果。
借助该工具箱,能够很方便的使用k-means聚类,工具箱支持一键生成肘部图帮助确定最佳聚类簇数,也能使用使用轮廓系数 、间隔统计量 、Calinski-Harabasz指数、Davies-Bouldin指数这四种内部评估方法帮助确定最佳聚类簇数,这些方法的介绍可看这篇文章:MATLAB进行聚类时确定簇数k的四种内部评估方法。
MATLAB版本要求:2021a以及更高版本!且需要有统计与机器学习工具箱!Matlab中安装工具箱的时候的选择 : https://mp.weixin.qq.com/s/F8NLVMLjs6dbHirBlNeYRg
工具箱主界面如下:

聚类完毕后,工具箱提供了强大的可视化模块对聚类结果进行可视化,支持以下图形:
(1)二维散点图和三维散点图


(2)聚类区域图


(3)平行坐标图


(4)箱线图


(5)主成分降维后主成分图


(6)散点图矩阵


如果你觉得图形上的指标名称不是自己需要的,你可以一键对指标名称进行修改:

除了可视化外,还能一键计算各个簇中各指标的均值、最值、中位数等统计量:


最后还提供了一个假设检验模块,能检验各指标在不同簇上的数值是否有显著的差异:

你以为这就完了吗?
工具箱中所有的操作都能自动在命令行窗口生成相应的代码,复制这个代码运行后你就能得到和工具箱相同的结果,聚类、可视化、计算统计量、假设检验都可以!!!
例如下面就是点击聚类后自动生成的代码:

该工具箱目前大部分核心功能已经开发完成了, 到时候会录制视频进行讲解,发布后第一时间也会放在评论区,欢迎大家持续关注。