易用的两个OCR(图像文字识别提取)开源项目

文章目录

简介

  • OCR(Optical Character Recognition)全称光学字符识别, 通俗的讲就是计算机识别图像上面的文字并且提取出来。这对提取运算速度以及识别准确率都有很高的要求。
  • 两个项目均CRNN网络结构
  • chineseocr_lite运行方式简单,PaddleOCR自定义功能强
  • 笔者运行环境:Anaconda3的Python3.7 完美运行两个项目

chineseocr_lite

# 安装模块
pip install -r ./requirements.txt -i http://pypi.douban.com/simple/ --trusted-host pypi.douban.com
# 运行main文件运行项目
python backend/main.py 
  • 项目运行成功:
    《易用的两个OCR(图像文字识别提取)开源项目》
  • PC界面:
    《易用的两个OCR(图像文字识别提取)开源项目》– Android界面:
    《易用的两个OCR(图像文字识别提取)开源项目》

PaddleOCR

  • gitHub地址:https://github.com/PaddlePaddle/PaddleOCR
  • PaddlePaddle百度多年的深度学习技术研究平台,大厂的文档也写的很全面,项目运行虽然没有像chineseocr_lite那样简单,但是文档非常清晰,也有文档可以参考自己训练模型。项目还配置了PPOCRLabel半自动化图形标注工具使用户自己添加数据集。
    《易用的两个OCR(图像文字识别提取)开源项目》
  • 使用方式:
    《易用的两个OCR(图像文字识别提取)开源项目》
# 1. 这里个人建议安装2.0cpu版本,笔者使用1.8.5会产生bug
pip install paddlepaddle==2.0.0rc1 -i https://mirror.baidu.com/pypi/simple


# 2. 安装paddle, paddlehub PS:中途可能提示缺少几个模块的问题,安装即可
pip install paddle
pip3 install paddlehub --upgrade -i https://pypi.tuna.tsinghua.edu.cn/simple


# 3. 下载官方训练好的模型,这里建议参考官方文档: https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/deploy/hubserving/readme.md
检测模型:.\PaddleOCR_dygraph\deploy\hubserving\ocr_det
识别模型:.\PaddleOCR_dygraph\deploy\hubserving\ocr_rec
方向分类器:.\PaddleOCR_dygraph\deploy\hubserving\ocr_cls
模型库下载地址:https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/doc/doc_ch/models_list.md
* 下载对应的模型后解压,然后修改hubserving目录下,ocr_det\params.py, ocr_rec\params.py, ocr_cls\params.py, ocr_system\params.py四个文件里的模型路径


# 4. 安装模块
# 安装检测服务模块: 
hub install .\deploy\hubserving\ocr_det\
# 安装分类服务模块: 
hub install .\deploy\hubserving\ocr_cls\
# 安装识别服务模块: 
hub install .\deploy\hubserving\ocr_rec\
# 安装检测+识别串联服务模块:
hub install .\deploy\hubserving\ocr_system\

# 5.开启服务
hub serving start -c .\deploy\hubserving\ocr_det\config.json
hub serving start -c .\deploy\hubserving\ocr_cls\config.json
hub serving start -c .\deploy\hubserving\ocr_rec\config.json
hub serving start -c .\deploy\hubserving\ocr_system\config.json

# 6.没有图形化界面所以只能在终端内测试
# 测试文件 ocr_system服务地址 需测试图片路径
python .\tools\test_hubserving.py http://127.0.0.1:8868/predict/ocr_system  .\img.jpg
    原文作者:Ymq.
    原文地址: https://blog.csdn.net/qq_38556217/article/details/112647980
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞