踏春必备 - 花卉识别数据集
花飞竞渡日,草见踏春心。
拍照识别花卉名称及其特点,应该属近年深度学习技术在现实生活中最为广泛的应用之一。一年一度春风至,又到了户外踏青赏花的季节。公园、郊外、路边各种鲜花渐次开放,争奇斗艳。为帮助大家识别花草树木,市场上出现了不少识花 APP,拍张照片就可以知道是什么花草树木了,确实很方便。



正如你可能已经想到的,实际上大部分 APP 都是通过采集各类花朵植物的图片进行训练,从而实现将训练好的深度学习模型部署到 APP 端执行实时推理(或依赖互联网连接进行远程 API 调度),实现对各类花卉的识别。花卉识别数据集远远不仅限于 Iris,下面,跨象乘云™ 为你带来三份适用于计算机视觉深度学习模型训练的花卉分类识别数据集。
1. 17flowers
17 Category Flower 数据集,简称(17flowers),是由牛津大学 Visual Geometry Group 发布 的一个 17 类英国常见花卉数据集,每个类有 80 张图片,整个数据集有 1,360 张图片。数据集图像包括了花卉尺寸、姿态和光线变化。其中,同一类别中的花卉图像之间可能差异较大,甚至更类似与其它类别花卉。17flowers 数据集本身提供一份 Matlab 切分代码,显然无法直接采用。因此,我们使用 Python 将原始数据集进行分类归档并切分。

2. 104 Flowers
该数据集是将 TPUs花卉分类竞赛 中的 TFRecords 数据集转换为 JPEG 格式,使你能够:
练习把它转换回 TFRecords
更容易查看数据集
创建有用的 EDA 探索性数据分析
这些花卉的图像来自 5 个不同的公共数据集。有些种类非常狭窄,只包含一种特殊的花子类 (如:粉红色的报春花),而其他种类则包含许多子类型 (如:野玫瑰)。原始数据集图片是以 TFRecord 格式提供的。TFRecord 格式是一种容器格式,在 Tensorflow 中经常用于分组和分片数据数据文件,以获得最佳的训练性能。
3. Hackathon Blossom
这个数据集包含了 102 种不同物种的花的图片。

个人用户请通过微信搜索【跨象乘云】公众号(kxcy_ai)或扫描下方二维码,关注后发送关键字【220209】,免费获取 花卉识别数据集。跨象乘云™ 原创实验演示视频内全部代码、数据集仅授权予个人用户学习与实验使用。禁止用于二次销售、分发传播、课堂教学及培训用途。校企用户采购请通过公众号菜单【了解我们】->【商务合作】联系。
