anaconda中通过pytesseract识别中文字符

2023-05-16

使用pytesseract识别中文字符

环境的安装可以参考:https://editor.csdn.net/md/?articleId=109255325

首先,需要下载相应的数据集,可以自行搜索官网,下载chi_sim.traineddata

链接:

百度网盘:
链接:https://pan.baidu.com/s/1Z79jcrMwumlDHEXRyk82eg
提取码:pxwh

将这个数据集放入安装的Tesseract-OCR\tessdata中

在这里插入图片描述
我使用的是anaconda安装。
然后就是几行代码实现中文字符的识别:

# 导入模块和包
from PIL import Image
import pytesseract

# 打开需要识别的图片
img = Image.open('1.jpg')
# 识别图片,指定lang = ‘chi_sim’即可识别中文
content = pytesseract.image_to_string(img, lang = 'chi_sim')
# 输出打印一下
print(content)

这里附上这个所有识别字体的数据包

链接:https://pan.baidu.com/s/1FdAwdIVUGhBk0jA_V4i62g
提取码:lfel

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

anaconda中通过pytesseract识别中文字符 的相关文章

随机推荐

  • 正则表达式

    概述 1 正则表达式功能非常强大 xff0c 但是学习难度也很大 正则表达式是一套独立的语法 xff0c 和Python并没有任何相似和相关之处 xff0c 只不过是Python提供了对正则表达式的支持 2 正则表达式是编写网络爬虫提取特定
  • PaddleX 在windows10使用paddle_inference部署C#打包dll全教程

    目录 一 基本环境配置1 1 Visual Studio2019安装1 2 CUDA10 2安装1 3 安装Cudnn1 4 下载PaddleX develop1 5 下载paddleinference1 6 下载opencv3 4 61
  • Jetson Nano Pytorch+TensorRT环境配置系统移植到另一张TF卡

    PS 使用本文章中dd写入的方式 可以用于备份TF卡 SD卡 硬盘里操作系统 环境变量和系统数据 随时备份 随时恢复 内容完全一样 目录 PS 使用本文章中dd写入的方式 可以用于备份TF卡 SD卡 硬盘里操作系统 环境变量和系统数据 随时
  • Stable Diffusion+ControlNet+Lora 指导AI+艺术设计的WebUI全流程使用教程

    目录 一 背景知识1 1 Stable Diffusion背景知识1 2 ControlNet 背景知识 二 使用方法2 1 环境配置2 2 运行WebUI 三 背景知识3 1 Stable Diffusion参数详解3 2 Control
  • Ubuntu20.04+Windows10双系统迁移新硬盘并解决引导损坏全流程总结

    目录 一 备份原有系统1 1 压缩原系统的 目录 二 安装新系统三 迁移系统四 引导修复4 1 Ubuntu引导修复4 2 Win10引导修复4 3 双系统grub修复 因工作需要 xff0c 欲将Ubuntu系统迁移到一块全新SSD中 x
  • Ubuntu20.04使用多卡训练HyperNetwork模型和LoRA模型全流程及疑难问题解决方案

    目录 一 LoRA模型多卡训练1 1 安装xformer等库1 2 设置路径1 3 多卡训练 二 HyperNetwork模型多卡训练2 1 HyperNetwork通过WebUI训练 疑难报错解决方案多卡训练报错 软硬件配置 xff1a
  • 【原创】SystemVerilog和Verilog中的表达式位宽

    Verilog和SystemVerilog作为一种 松散类型 的语言已经被很多工程师广泛的用于设计验证领域 xff0c 但是这并不是说各种电路结构或者验证环境中就可以肆无忌惮的随意使用 xff0c 特别是在不同位宽的信号进行计算时 xff0
  • java反射获取子类或者父类的属性值

    方法介绍 1 获取所有属性 span class token keyword private span span class token keyword static span span class token class name Lis
  • momentjs 常用总结

    平时在工作中经常需要对时间进行处理 xff0c 用momentjs 可以快速又方便的对时间格式进行处理 1 let time 61 moment 输出当前国际化时间 相当于 newDate 2 let time 61 moment X fo
  • 第一次CSP模拟-A-咕咕东的奇遇

    咕咕东是个贪玩的孩子 xff0c 有一天 xff0c 他从上古遗迹中得到了一个神奇的圆环 这个圆环由字母表组成首尾相接的环 xff0c 环上有一个指针 xff0c 最初指向字母a 咕咕东每次可以顺时针或者逆时针旋转一格 例如 xff0c a
  • week4作业-C-TT的神秘礼物

    TT 是一位重度爱猫人士 xff0c 每日沉溺于 B 站上的猫咪频道 有一天 xff0c TT 的好友 ZJM 决定交给 TT 一个难题 xff0c 如果 TT 能够解决这个难题 xff0c ZJM 就会买一只可爱猫咪送给 TT 任务内容是
  • UIScrollView的作用原理,实现scrollView传递touch事件给子视图

    span style font family none 我们知道当多个视图进行叠加的时候 xff0c touch事件是作用到最上面的视图上 xff0c 但是如果父视图是UIScrollView xff0c 如果默认 xff0c 可能touc
  • win10虚拟机VMware安装homeassistant镜像

    从今天开始 xff0c 我开始倒腾智能家居 xff0c 谈到智能家居就离不开一个开源的家庭智能控制系统home assistant 这个home assistant可以连接很多智能设备 之后 xff0c 我也会把自己在这过程中学习到的东西或
  • hadoop集群环境搭建

    目录 思路 配置master服务器 配置slave服务器 启动 运行example 常见报错 多次初始化导致master和slave的clusterID的不一致 INFO mapreduce Job Running job job 1647
  • zookeeper集群环境搭建

    目录 第一台主机 其他两台主机 启动 常见报错 Starting zookeeper FAILED TO START 3台Linux虚拟机 xff0c 与 hadoop环境搭建 相同 第一台主机 1 下载安装包 在 Index of apa
  • HBase分布式环境搭建

    目录 第一台主机 其他两台主机 启动 常见报错 SLF4J Class path contains multiple SLF4J bindings 3台Linux虚拟机 xff0c 与 zookeeper环境搭建 相同 xff0c 承接上文
  • Linux报错集锦

    收录平时使用linux时遇到的各种报错 xff0c 方便以后查阅 xff0c 如果大家遇到同样的问题时也能节省一些时间 原文链接 xff08 会有更新 xff09 https thrilling coffee afc notion site
  • 【20200602程序设计思维与实践 Week15 作业】

    目录 B ZJM 与生日礼物题意思路代码 C ZJM 与纸条题意思路代码 B ZJM 与生日礼物 题意 ZJM收到了Q老师送来的生日礼物 xff0c 但是被 Q老师加密了 只有 ZJM 能够回答对Q老师的问题 xff0c Q老师才会把密码告
  • 宝塔Linux搭建靶场(DVWA,pikachu,sqli,upload,xxs)

    靶场下载地址 链接 xff1a https pan baidu com s 1acxeSoI8TcvGXEGOa0a3WA 提取码 xff1a nbxx 安装宝塔Linux环境 Ubuntu安装宝塔Linux命令wget O install
  • anaconda中通过pytesseract识别中文字符

    使用pytesseract识别中文字符 环境的安装可以参考 xff1a https editor csdn net md articleId 61 109255325 首先 xff0c 需要下载相应的数据集 xff0c 可以自行搜索官网 x