本节介绍用于识别重复图像的启发式方法。训练和测试集可能具有重复图像。ps:2018年重复图像较多,2019年重复图像较少。有些图像是完美的二进制副本,而另一些则做了一些改动:对比度和亮度,大小,遮盖图例等。如果符合以下一个特征,则认为两张图像是重复的:1、两张图像具有相同的phash值,phash值可以参考