从计算机图像、深度学习和OpenCV开始(目录P4)
光学字符识别(OCR)
计算机视觉最早的应用之一是光学字符识别(OCR)。
OCR算法寻求:
(1)获取输入图像
(2)识别图像中的文本/字符,将人类可读的字符串返回给用户(在这种情况下,假设“字符串”是包含已识别文本的变量)。
虽然OCR是一个简单的概念(输入图像,输出人类可读的文本),但它实际上是一个极具挑战性的问题,远未解决。
本节中的步骤将为您提供构建自己的OCR管道所需的知识。
Step #1:安装OpenCV(初级)
Step #2:探索用于OCR的Tesseract(初级)
Step #3:不使用Tesseract的OCR(中级)
Step #4:通过小型项目练习OCR(中级)
Step #5:自然场景中的文本检测(中级)
Step #6:将文本检测与OCR相结合(高级)