一、软件和包安装

  1. PaddleOCR 介绍 & 下载

      PaddleOCR是一个基于百度飞桨开发的OCR系统。包括文字检测、文字识别、文本方向分类等模块。以下是其优点:
    

🕐 高精度:PaddleOCR采用深度学习算法进行训练,可以在不同场景下实现高精度的文字检测和文字识别。

🕑 多语种支持:PaddleOCR支持多种语言的文字识别,包括中文、英文、日语、韩语等。同时,它还支持多种不同文字类型的识别,如手写字、印刷体、表格等。

🕒 高效性:PaddleOCR的训练和推理过程都采用了高效的并行计算方法,可大幅提高处理速度。同时,其轻量化设计也使得PaddleOCR能够在移动设备上进行部署,适用于各种场景的应用。

🍀 易用性:PaddleOCR提供了丰富的API接口和文档说明,用户可以快速进行模型集成和部署,实现自定义的OCR功能。同时,其开源代码也为用户提供了更好的灵活性和可扩展性。

🈚 鲁棒性:PaddleOCR采用了多种数据增强技术和模型融合策略,能够有效地应对图像噪声、光照变化等干扰因素,并提高模型的鲁棒性和稳定性。

地址:PaddleOCR/doc/doc_ch/models_list.md at release/2.0 · PaddlePaddle/PaddleOCR · GitHub

  1. 下载包 :https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.6/doc/doc_ch/models_list.md

在PaddleOCR-realase-2.6根目录下新建文件夹,并下载推理模型

  1. 执行命令

进入到PaddleOCR-releas-2.6目录下

python tools/infer/predict_system.py --image_dir="C:\Users\User\Desktop\test.jpg" --det_model_dir="./inference_model/ch_PP-OCRv3_det_infer/" --rec_model_dir="./inference_model/ch_PP-OCRv3_rec_infer"

根据报错,安装各种库函数

  1. 结果

说明 PaddleOCR的环境已经成功搭建好了

二、制作数据集

  1. 制作自己的数据集

进入paddleOCR-release-2.6根目录下

打开打标软件:python PPOCRLabel.py --lang ch

开始给数据打标签

全部打标完成之后,点击文件选择导出标记结果,再点击文件选择导出识别结果,完成后再文件夹多出四个文件fileState,Label,rec_gt, crop_img。其中crop_img中的图片用来训练文字识别模型,fileState记录图片的打标完成与否,Label为训练文字检测模型的标签,rec_gt为训练文字识别模型的标签。

  1. 数据集的划分

打标签告一段落。下面进行数据集的制作。在PaddleOCR根目录下建立train_data文件夹,并且将打标签生成的文件和图片放在该文件夹下。

# 进入PPOCRLabel的文件夹下

python gen_ocr_train_val_test.py --trainValTestRatio 6:2:2 --datasetRootPath ../train_data/text_trafficSignImages/

数据集已经标注成功

三、文字检测模型

  1. 下载模型

    # 下载训练模型,det是检测模型,rec是识别模型

  1. 设置模型配置文件

打开模型配置文件,可以使用ch_det_res18_db_v2.0.yml这个配置文件。

按照需要修改配置文件

  1. 开始训练

到PaddleOCR-releas-2.6根目录下

训练结果

  1. 测试训练模型

使用best_accuracy.pdparams进行模型测试,其中Global.pretrained_model是我们训练好并且需要测试的模型,Global.infer_img为所要检测的图片路径。=》这里训练次数少,用的是iter_epoch_100.pdparams

python tools/infer_det.py -c configs/det/ch_ppocr_v2.0/ch_det_res18_db_v2.0.yml -o Global.pretrained_model=./output/ch_db_res18/iter_epoch_100.pdparams Global.infer_img="./train_data/det/test/img3.png"

四、文字检测模型

  1. 下载模型

    # 下载训练模型,det是检测模型,rec是识别模型

  2. 设置模型配置文件

文字识别可以使用ch_PP-OCRv3_rec.yml

  1. 开始训练

到PaddleOCR-releas-2.6根目录下

python tools/train.py -c configs/rec/PP-OCRv3/ch_PP-OCRv3_rec.yml

毁灭吧,内存要爆了

  1. 测试训练模型

————————————————

                        版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
                    

原文链接:https://blog.csdn.net/xiaoxiao_00001/article/details/148119161

文章目录