如何快速使用paddleOCR进行文字识别？

2023-08-06 16:39 作者:喜欢玩AI的东哥 0人读过 | 我要投稿

1.环境：

cuda11.6，cudnn8.4，tensorrt8.4.1.5，openCV4.6.0，git 2.34, cmake3.24.2，vs2019

2.使用paddleOCR

--1.下载最新版paddleOCR

网站:https://github.com/PaddlePaddle/PaddleOCR

进入到指定目录

cd D:\AI\paddleOCR

git clone https://github.com/PaddlePaddle/PaddleOCR.git

或者手动在github上下载解压。

--2.下载最新 paddleInference推理库

根据系统要求下载对应系统的ocr推理库, 这里我们选择windows预测库中C++预测库：avx_mkl_cuda11.6_cudnn8.4_avx_mkl-trt8.4.1.5

--3.下载模型

在paddleOCR的github主页readme中找到PP-OCR Series Model List，下载最新模型ch_PP-OCRv3_xx，该模型适合Mobile 和Server，分别下载Detection mode，Direction classifier和Recognition model，并解压到model文件中。

--4.编译和生成paddleOCR项目

(1) 启动Cmake：双击启动cmake-gui或者cmd中运行cmake-gui，打开cmake。

(2)选择source和build路径:

(3) 点击 configure，选择编译器，首次编译会检查环境，系统会自动显示无法识别的环境，将以下红框内的变量按照自己的实际路径进行填写，重新点击configure，完成编译无报错即为成功。

(4) 点击Generate生成对应的项目文件。

(5) 点击open project，使用vs1029打开已生成的项目。

编译过程可参考官方编译教程。

--5.项目运行

将debug改为release，将ppocr改为启动项，生成解决方案。

在生

成的程序目录下添加对应的dll文件。

运行cmd，输入CHCP 65001，将终端切换为支持中文的utf-8，

然后运行

ppocr.exe --det_model_dir=D:\AI\paddleOCR\model\ch_PP-OCRv3_det_infer --rec_model_dir=D:\AI\paddleOCR\model\ch_PP-OCRv3_rec_infer --cls_model_dir=D:\AI\paddleOCR\model\ch_ppocr_mobile_v2.0_cls_infer --rec_char_dict_path=D:\AI\paddleOCR\PaddleOCR-release-2.6\PaddleOCR-release-2.6\ppocr\utils\ppocr_keys_v1.txt --use_angle_cls=true --det=true --rec=true --cls=true --use_gpu=true --use_tensorrt=true --image_dir=D:\AI\paddleOCR\model\pic\p1

运行的到最终结果: