KNN算法简单实现
*下面KNN算法的实现,由于个人编码水平有限,若有不合理的地方请指正
1. 选择数据
选择从网上下载的水果数据集,将其中的三分之二作为训练数据,其中的三分之一作为测试数据。分别放入两张表中,训练集和测试集的数据结构均相同如下图:

2. 编写算法
导入第三方库并加载训练数据集:

载入测试数据,并寻找影像水果标签的参数,将其中文本部分删除掉,用mass、width、height、color_socre四个参数进行计算。

定义距离计算公式:

定义标签的预测方法:(将每个测试样本与训练集中的每个数据计算欧式距离,返回距离最小的K个值,将这K个值中标签出现最多的一个作为该测试样本的标签)

执行预测样本,K值设定为5:

输出KNN计算的准确度:

具体代码请参阅 https://blog.csdn.net/Geo_Phy/article/details/114638052