实战分享!YOLOv5+Tesseract-OCR 实现车牌号文本识别
来源:投稿 作者:王同学
编辑:学姐
最近看到了各种各样的车牌识别,觉得挺有意思,自己也简单搞一个玩玩。
1. 预期效果
先看看预期的效果吧,大概就是这样子的,输入一张图片可以把图片中的车牌号以文本的形式打印出来。目前还比较简陋,大家可以自己尝试加个PyQt5页面实现更加丰富的功能。


2. 整体流程
首先训练一个YOLOv5的车牌检测器;
然后将车牌切下来;
将切下来的部分通过OpenCV进行形态学处理;
最后通过Tesseract-OCR识别车牌并在控制台上打印。
3. 准备数据集
这次就不自己标注了,直接找了一个开源的。训练集张、验证集张、测试集张。数据集质量一般。

4. 训练YOLOv5模型
4.1 下载源码
4.2 安装环境
4.3 修改配置文件
==license.yaml==
4.4 训练模型
数据量比较少,直接用yolov5s跑就可以。
简单跑了100轮,看着还可以,就直接用了。

4.5 测试模型


5. 截取车牌

因为数据集质量原因,有一些图拍摄不是很清晰,所以截取到的车牌也不是很清楚,我这里选了一些相对来说清楚一些的。其实到这里我们就可以通过Tesseract-OCR进行识别了,但是不对图像进行处理就识别的话效果很不好,所以我这里还是选择对车牌进行一些形态学处理。
6. 形态学处理
这部分也不算完全意义上的形态学处理吧,我并没有使用腐蚀膨胀等操作,只是使用了几个OpenCV的础操作对车牌进行了处理,大家可以对比一下效果。(其实还有很大的优化空间的)

7. Tesseract-OCR安装
7.1 下载 Tesseract-OCR

下载地址:Tesseract-OCR
我下载的是最下面的版本,下载好后直接安装就可以,没有什么坑。

7.2 配置环境变量


7.3 调用Tesseract-OCR
在调用前要到入 pytesseract 包。
随后在YOLOv5项目里新建一个py文件
传入图片的路径后就可以在控制台看到最终输出的结果了。



7.4 显示中文
如果想显示车牌上的中文,我们还要下载一个东西,下载地址:tessdata/chi_sim.traineddata

下载好后直接放到如下位置就可以。代码也要改动一下。


8. 完整代码
9. 数据集及代码资源

关注【学姐带你玩AI】公众号
回复“csdn”领取