如何快速使用paddleOCR进行文字识别?
如何快速使用paddleOCR进行文字识别?
1.环境:
cuda11.6,cudnn8.4,tensorrt8.4.1.5,openCV4.6.0,git 2.34, cmake3.24.2,vs2019
2.使用paddleOCR
--1.下载最新版paddleOCR
网站:https://github.com/PaddlePaddle/PaddleOCR
进入到指定目录
cd D:\AI\paddleOCR
git clone https://github.com/PaddlePaddle/PaddleOCR.git
或者手动在github上下载解压。
--2.下载最新 paddleInference推理库
根据系统要求下载对应系统的ocr推理库, 这里我们选择windows预测库中C++预测库:avx_mkl_cuda11.6_cudnn8.4_avx_mkl-trt8.4.1.5
--3.下载模型
在paddleOCR的github主页readme中找到PP-OCR Series Model List,下载最新模型ch_PP-OCRv3_xx,该模型适合Mobile 和Server,分别下载Detection mode,Direction classifier和Recognition model,并解压到model文件中。
--4.编译和生成paddleOCR项目
(1) 启动Cmake:双击启动cmake-gui或者cmd中运行cmake-gui,打开cmake。
(2)选择source和build路径:
(3) 点击 configure,选择编译器,首次编译会检查环境,系统会自动显示无法识别的环境,将以下红框内的变量按照自己的实际路径进行填写,重新点击configure,完成编译无报错即为成功。
(4) 点击Generate生成对应的项目文件。
(5) 点击open project,使用vs1029打开已生成的项目。
编译过程可参考官方编译教程。

--5.项目运行
将debug改为release,将ppocr改为启动项,生成解决方案。

在生

成的程序目录下添加对应的dll文件。
运行cmd,输入CHCP 65001,将终端切换为支持中文的utf-8,
然后运行
ppocr.exe --det_model_dir=D:\AI\paddleOCR\model\ch_PP-OCRv3_det_infer --rec_model_dir=D:\AI\paddleOCR\model\ch_PP-OCRv3_rec_infer --cls_model_dir=D:\AI\paddleOCR\model\ch_ppocr_mobile_v2.0_cls_infer --rec_char_dict_path=D:\AI\paddleOCR\PaddleOCR-release-2.6\PaddleOCR-release-2.6\ppocr\utils\ppocr_keys_v1.txt --use_angle_cls=true --det=true --rec=true --cls=true --use_gpu=true --use_tensorrt=true --image_dir=D:\AI\paddleOCR\model\pic\p1
运行的到最终结果:

