欢迎光临散文网 会员登陆 & 注册

如何快速使用paddleOCR进行文字识别?

2023-08-06 16:39 作者:喜欢玩AI的东哥  | 我要投稿

如何快速使用paddleOCR进行文字识别?

1.环境:

  cuda11.6,cudnn8.4,tensorrt8.4.1.5,openCV4.6.0,git 2.34, cmake3.24.2,vs2019

 

2.使用paddleOCR

   --1.下载最新版paddleOCR

     网站:https://github.com/PaddlePaddle/PaddleOCR

      进入到指定目录

          cd D:\AI\paddleOCR

          git clone https://github.com/PaddlePaddle/PaddleOCR.git

       或者手动在github上下载解压

 

   --2.下载最新 paddleInference推理库

       根据系统要求下载对应系统的ocr推理库, 这里我们选择windows预测库中C++预测库:avx_mkl_cuda11.6_cudnn8.4_avx_mkl-trt8.4.1.5

  

 --3.下载模型

在paddleOCR的github主页readme中找到PP-OCR Series Model List,下载最新模型ch_PP-OCRv3_xx,该模型适合Mobile 和Server,分别下载Detection mode,Direction classifier和Recognition model,并解压到model文件中。

 

   --4.编译和生成paddleOCR项目

   (1) 启动Cmake双击启动cmake-gui或者cmd中运行cmake-gui,打开cmake。

   (2)选择sourcebuild路径:

(3) 点击 configure,选择编译器,首次编译会检查环境系统会自动显示无法识别的环境,将以下红框内的变量按照自己的实际路径进行填写,重新点击configure完成编译无报错即为成功。

(4) 点击Generate生成对应的项目文件。

(5) 点击open project,使用vs1029打开已生成的项目。

编译过程可参考官方编译教程

 


--5.项目运行

将debug改为release,将ppocr改为启动项,生成解决方案。

 


在生

成的程序目录下添加对应的dll文件。

 

运行cmd,输入CHCP 65001,将终端切换为支持中文的utf-8,

然后运行

ppocr.exe --det_model_dir=D:\AI\paddleOCR\model\ch_PP-OCRv3_det_infer   --rec_model_dir=D:\AI\paddleOCR\model\ch_PP-OCRv3_rec_infer  --cls_model_dir=D:\AI\paddleOCR\model\ch_ppocr_mobile_v2.0_cls_infer  --rec_char_dict_path=D:\AI\paddleOCR\PaddleOCR-release-2.6\PaddleOCR-release-2.6\ppocr\utils\ppocr_keys_v1.txt     --use_angle_cls=true   --det=true   --rec=true  --cls=true  --use_gpu=true  --use_tensorrt=true  --image_dir=D:\AI\paddleOCR\model\pic\p1

 

运行的到最终结果:

 


 


如何快速使用paddleOCR进行文字识别?的评论 (共 条)

分享到微博请遵守国家法律