百度paddleocr安装使用
在之前的项目中使用的是百度在线版ocr,需要连接网络,有调用次数限制。
今年又有项目要用到ocr,在了解了下现在ocr情况之后开始了paddleocr的试用。
## 安装:
安装过程直接使用pip install paddleocr就可以了,后面就是看他安装完,依赖有点多,要一点点来。
https://github.com/PaddlePaddle/PaddleOCR/releases
注:由于paddleocr整个包比较大,有上百兆,在使用pip安装过程中需要耐心点。如果没耐心可以直接下载github上的发布包进行安装。
上面这个方法比较传统,要解决多个不同配置,可以使用官网上的配置一键安装。
https://www.paddlepaddle.org.cn/install/quick?docurl=/documentation/docs/zh/install/pip/windows-pip.html
## 使用
```
from paddleocr import PaddleOCR, draw_ocr
# Paddleocr目前支持的多语言语种可以通过修改lang参数进行切换
# 例如`ch`, `en`, `fr`, `german`, `korean`, `japan`
ocr = PaddleOCR(use_angle_cls=True,) # need to run only once to download and load model into memory
img_path = './imgs/11.jpg'
result = ocr.ocr(img_path, cls=True)
for idx in range(len(result)):
res = result[idx]
for line in res:
print(line)
# 显示结果
# 如果本地没有simfang.ttf,可以在doc/fonts目录下下载
from PIL import Image
result = result[0]
image = Image.open(img_path).convert('RGB')
boxes = [line[0] for line in result]
txts = [line[1][0] for line in result]
scores = [line[1][1] for line in result]
im_show = draw_ocr(image, boxes, txts, scores, font_path='doc/fonts/simfang.ttf')
im_show = Image.fromarray(im_show)
im_show.save('result.jpg')
```
模型训练
如果有衍生需求还可以自己接着训练
报错梳理
1、# ImportError: cannot import name 'inference' from 'paddle' (unknown location)
解决方式:
paddle版本问题,安装一个稳定版paddle即可
https://www.paddlepaddle.org.cn/install/quick?docurl=/documentation/docs/zh/install/pip/windows-pip.html
https://oomake.com/question/15635800