百度PaddleOCR文字识别库下载安装保姆级教程

2023-11-05

1.PaddleOCR是什么?

  PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力使用者训练出更好的模型,并应用落地。
  飞桨文字识别开发套件PaddleOCR,旨在打造一套丰富、领先且实用的OCR工具库,开源了基于PP-OCR实用的超轻量中英文OCR模型、通用中英文OCR模型,以及德法日韩等多语言OCR模型。并提供上述模型训练方法和多种预测部署方式。同时开源文本风格数据合成工具Style-Text和半自动文本图像标注工具PPOCRLable

2.特性

1.PPOCR系列高质量预训练模型,准确的识别效果
  轻量ppocr_mobile移动端系列:检测(2.6M)+方向分类器(0.9M)+识别(4.6M) = 8.1M。通用ppocr_server系列:检测(47.2M) +方向分类器(0.9M)+识别(107M) = 155.1M
  超轻量压缩ppocr_mobile_slim系列:检测(1.4M) +方向分类器(0.5M)+识别(1.6M) = 3.5M·支持中英文数字组合识别、竖排文本识别、长文本识别
2.支持多语言识别:韩语、日语、德语、法语
3.支持用户自定义训练,提供丰富的预测推理部署方案·支持PIP快速安装使用
4.可运行于Linux、Windows、MacOS等多种系统

3.安装总流程(安装步骤在第四单元)

1.首先安装PaddlePaddle库(深度学习框架)

  飞桨(PaddlePaddle)以百度多年的深度学习技术研究和业务应用为基础,集深度学习核心训练和推理框架、基础模型库、端到端开发套件、丰富的工具组件于一体的深度学习框架

2.安装shapely库(依赖的库)

  Shapely is a Python package for set-theoretic analysis and manipulation of planar features using (via Python’s ctypes module) functions from the well known and widely deployed GEOS library.
  Shapely是一个Python包,用于使用(通过Python的ctypes模块)GEOS库中的函数对平面特性进行集论分析和操作
  https://shapely.readthedocs.io/en/latest/manual.html#introduction

3.安装PaddleOCR(要使用的库)

  飞桨文字识别开发套件PaddleOCR,旨在打造一套丰富、领先且实用的OCR工具库,开源了基于PP-OCR实用的超轻量中英文OCR模型、通用中英文OCR模型,以及德法日韩等多语言OCR模型。并提供上述模型训练方法和多种预测部署方式。同时开源文本风格数据合成工具Style-Text和半自动文本图像标注工具PPOCRLable

4.安装步骤(win or mac)

1.检查安装环境

  要使用PaddleOCR,必须要有paddle深度学习框架,而其深度学习框架有环境要求。
  目前飞桨支持的环境(博客写于2021年10月5日)

Windows 7/8/10专业版/企业版(64bit)
GPU版本支持CUDA 10.1/10.2/11.0/11.2,且仅支持单卡
Python 版本 3.6+/3.7+/3.8+/3.9+(64 bit)
pip 版本20.2.2或更高版本(64 bit)

检查环境方法

1.检查Python版本

python --version

2.检查pip版本

python -m pip --version

3.检查cuda版本
要记住自己的cuda版本,一会安装的时候有用
步骤一
步骤二

2.升级pip到最新版(选做)

python3 -m pip install --upgrade pip

3.安装飞浆学习框架PaddlePaddle

  如果您的计算机没有 NVIDIA® GPU,请安装CPU版的PaddlePaddle

python3 -m pip install paddlepaddle==2.0.0b0 -i https://mirror.baidu.com/pypi/simple

  如果您的机器安装了 NVIDIA® GPU,记住版本号,进入链接网站查询后下载。
网站示意图
选择自己的系统→选择pip(即使安装conda了也使用pip,下载方便一些)→选择自己的cuda版本→打开cmd安装
我的版本是11.2
官网提示

但是提示非安培架构使用10.2好些,RTX2060是图灵架构和我一样的不用百度了

4.安装依赖库shapely

  注意,windows环境下,建议从这里 单机蓝字下载shapely安装包完成安装, 直接通过pip安装的shapely库可能出现[winRrror 126] 找不到指定模块的问题
  根据提供的shapely文件名判断哪个版本是符合你的:第一看cp36 cp37 cp39这一部分,代表的是你python版本,如你装的是python3.7那就选择cp37(后缀m不用在意);第二看最后位数,64位就选win_amd64,32位就选win32
文件下载

其是whl文件,whl文件安装方法见博客点击这里

5.安装PaddleOCR

pip install paddleocr

5.测试

代码

from paddleocr import PaddleOCR, draw_ocr

# Paddleocr目前支持中英文、英文、法语、德语、韩语、日语,可以通过修改lang参数进行切换
# 参数依次为`ch`, `en`, `french`, `german`, `korean`, `japan`。
ocr = PaddleOCR(use_angle_cls=True, lang="ch")  # need to run only once to download and load model into memory
img_path = 'perfect.jpg'
result = ocr.ocr(img_path, cls=True)
for line in result:
    print(line)

# 显示结果
from PIL import Image

image = Image.open(img_path).convert('RGB')
boxes = [line[0] for line in result]
txts = [line[1][0] for line in result]
scores = [line[1][1] for line in result]
im_show = draw_ocr(image, boxes, txts, scores, font_path='/path/to/PaddleOCR/doc/simfang.ttf')
im_show = Image.fromarray(im_show)
im_show.save('result.jpg')

结果示意图
在这里插入图片描述
如果编译时遇到报错
报错内容:
RuntimeError: (PreconditionNotMet) The third-party dynamic library (cublas64_102.dll;cublas64_10.dll) that Paddle depends on is not configured correctly.
可以使用这个博主的文章解决文章地址

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

百度PaddleOCR文字识别库下载安装保姆级教程 的相关文章

随机推荐

  • 如何使用Git工具克隆GitHub仓库到本地

    首先 确保你已经在本地安装了Git 如果没有安装 可以前往Git官方网站 https git scm com 下载并安装适合你操作系统的版本 在本地文件夹打开Git Bash 如果你使用Windows系统 在GitHub上找到你想要克隆的仓
  • UE Cook遇到的一些问题

    UE Cook是什么 简单来说 把UE资源 比如uasset umap等转换成平台能识别的资源类型 Cook中遇到的报错 找不到文件 说明你有些plugin没有加入到当前 Project uproject中去 UATHelper Cooki
  • 35岁,一个团队leader,从工作满8年的公司离职,选择重新尝试新机会,或许35岁才是起点。

    目录 面试 1 年龄大找工作一定要有目标 不能太随便 2 代码能力是整个IT行业的核心技能 也是对整个行业从业者的要求 3 沟通表达很重要 把自己做过的事情做到极致 然后能讲出来 4 心态要好 5 机会总是留给有准备的人 勿浮躁 先沉淀 厚
  • 多态语法c++(自学笔记一)

    多态中的纯虚函数 使用多态时 当子类继承父类之后 一般来说对于父类只是作为提供相应的成员变量和成员函数的一个集合 在实际项目中 如果想要修改某一部分的功能 按照以往普通的类的写法 就需要修改类中的代码 也可以说是源码 这样会显得很不方便和不
  • Spring Boot 日志处理

    Spring Boot 日志处理 Spring Boot 是一个非常流行的 Java 开发框架 它提供了简洁的配置和强大的开发工具 日志是应用程序中必不可少的一部分 因为它可以帮助开发人员进行调试和故障排除 Spring Boot 提供了多
  • 非常详细图文JDK和Tomcat安装和配置的图文教程

    想用Tomcat作为服务器 必须分以下两步 首先要配置好JDK的环境变量 再去下载Tomcat的压缩包 一 下载 安装JDK 并且配置好环境变量 1 下载地址 http www oracle com technetwork java jav
  • springboot连接不上redis的三种解决方案

    第一种 查看防火墙是否打开6379端口 查看防火墙状态 systemctl status firewalld 如果防火墙没有启动的话 可以选择直接看后面两种方法 或者就是打开防火墙 然后继续下面的步骤 开启端口 firewall cmd z
  • 基于java网上图书销售系统的设计与实现(含源文件)

    欢迎添加微信互相交流学习哦 项目源码 https gitee com oklongmm biye 1引言 随着Internet国际互联网的发展 越来越多的企业开始建造自己的网站 基于Internet的信息服务 商务服务已经成为现代企业一项不
  • RPMB说明与使用(Replay Protected Memory Block)

    1 什么是RPMB 首先RPMB是repaly protected memory block 从字面意思理解就是一个回放保护的存储区域 这个区域是EMMC或者UFS上的一个区域 这个区域可以读 可以写 但是读和写是受到访问控制和回放保护的
  • 微信的订阅消息发送失败,提示code:47003,msg:argument invalid! data.thing3.value invalid

    问题 通过微信的API发送订阅消息失败了 就是发服务通知 服务通知如下所示 错误提示如下 An highlighted block 2021 07 27 09 23 26 828 INFO xx WechatMsgServiceImpl L
  • 一次因调用文件方法错误导致run.py调用不了test的过程

    我的项目中需要在一个 py中调用另一个文件夹的 py 最开始用的方法是 导入sys包 然后使用sys path append 存储路径 import unittest 导包 from selenium import webdriver fr
  • LeeCode学习记录:20. 有效的括号

    题目及代码 class Solution public boolean isValid String s 1 有效字符串的长度一定为偶数 2 遇到的左括号要先闭合 考虑用栈将这个左括号放入栈顶 3 当右括号时 可以取出栈顶的左括号并判断它们
  • 【EDA软件互转】PADS转Allegro

    1 使用pads软件打开PCB文件 然后执行菜单命令 File gt Export gt 弹出的对话框中点击 保存 然后按下图设置后点击 OK 按钮 会在当前目录下生成一个前面保存的asc文件 如果点击OK后有弹出其它提示就点击 确定 就好
  • 1980-2010年道路数据shp、2020年GRIP Global Roadsshp、2018年全国道路数据集shp、OSM数据shp

    道路数据集 一 NASA道路数据 1 数据来源 NASA 2 时间跨度 1980 2010 取决于国家 3 区域范围 亚洲 4 指标说明 数据格式 shp矢量数据 平面坐标系 WGS 84 全球公路开放获取数据集 1980 2010 第一版
  • 设计模式(十四)责任链模式

    前面讨论了创建型模式 结构型模式 今天我们来讨论一下行为型模式 责任链模式 就是我们讨论的第一种行为型模式 责任链模式具体不容易说出来 但是如果看一看责任链模式的实际例子就很容易明白了 最典型的例子就是Java EE Servlet中的过滤
  • 新代数控系统参数说明书_台湾新代宏程序编程书

    点击右上角关注公众号 每天更新 其实说起来宏就是用公式来加工零件的 比如说椭圆 如果没有宏的话 我们要逐点算出曲线上的点 然后慢慢来用直线逼近 如果是个光洁度要求很高的工件的话 那么需要计算很多的点 可是应用了宏后 我们把椭圆公式输入到系统
  • Vue form表单input框 手动赋值 提交时 表单input值没有生效 验证仍然是空

    1 问题 input 赋值后表单提交却为空 代码如下
  • ECCV 2022

    论文 https arxiv org abs 2207 08134 https github com HaoruiSong622 Editing Out of Domain Editing Out of domain GAN Inversi
  • 云计算习题

    云计算 一 单选题 二 多选题 三 实操题 单选题 多选题 实操题 一 单选题 下面哪个是软件代码版本控制软件 B A project B SVN C notepad D Xshell 为满足金融业务的监管和安全要求 平台不需要考虑下列哪个
  • 百度PaddleOCR文字识别库下载安装保姆级教程

    文字目录 1 PaddleOCR是什么 2 特性 3 安装总流程 安装步骤在第四单元 1 首先安装PaddlePaddle库 深度学习框架 2 安装shapely库 依赖的库 3 安装PaddleOCR 要使用的库 4 安装步骤 win o