图形验证码文字识别——pytesseract

2023-11-10

图形验证码内容识别——pytesseract

一、目的

我们工作中会遇到一些需要把图片中的文字识别出来使用的例子，比如：图形验证码、提取图片中的文章等

如果工作量比较小或者不需要重复执行的话人工就可以啦，但是恰恰一些场景是需要我们实现自动化识别的

这就很烦，急需一个来实现此功能的方法，我们常用的是OCR识别，但是怎么识别？
在这里插入图片描述

二、实现方式

本文主要是通过python的pytesseract库来实现图片中文字的识别，

实际是通过pytesseract调用tesseract的OCR来进行识别图片中的文案内容，然后把识别出的内容进行打印等操作

三、环境准备

pytesseract库
- 安装：pip install pytesseract【因为要调用pytesseract库所以需要提前安装】
tesseract
- 安装：https://blog.csdn.net/Alexa_/article/details/121192132
- 语言包讲述：在安装时记得选择语言包，我们常用的是英文、中文（默认是英文）：eng、chi_sim（可以在安装包路径\tessdata下查看是.traineddata文件，缺少的话也可以单独下载：https://developer.aliyun.com/article/832266）
- 设置pytesseract.py调用OCR路径：【安装好pytesseract之后调用会报错原因是没有指定OCR的路径】
  修改文件：pytesseract库所在文件夹的pytesseract.py文件（没设置路径报错文件点击跳转可以快速进入）

四、代码实现

import pytesseract

def images_to_string(num):
	# 打开本地图片，或者网络获取也可以
    name = '验证码\\'+ str(num) +'.png'
    img1 = Image.open(name)
	
    # 获取图片的长宽用于复杂背景图片文字的定位提取
    w, h = img1.size
    print('Original image size: %sx%s' % (w, h))
    # 因为是PNG图片，像素不是直接以RGB保存的，PNG的每个像素里还有透明度
    
    img1rbg = img1.convert('RGB')

    # 读取全部的像素数据
    src_strlist = img1rbg.load()

    # 获取主干颜色用于提取出确定颜色的文字，防止背景干扰
    # 可以打开图片然后画图工具标一下就能获取到想要颜色的坐标
    data = src_strlist[119, 26]
    print(data)

    # 双层循环开始替换全部的像素点颜色确保只保留符合我们要求的文字颜色
    for x in range(0, w):
        for y in range(0, h):
            # 判断当前点颜色是否等于主干颜色
            co = src_strlist[x, y]
            if co[0] < 30 and co[1] <30 :
                src_strlist[x, y] = (0, 0, 0)
            else:
                src_strlist[x, y] = (255, 255, 255)
    # 输出处理过的图片，用于查看
    nume01 = '验证码\\处理\\'+str(num)+ '.png'
    img1rbg.save(nume01)

    # 直接调用内存里的PIL image对象进行图片识别，这里lang是声明识别文字使用的语言包，默认是英文，chi_sim代表中文
    text = pytesseract.image_to_string(img1rbg,lang='chi_sim')
    # 打印结果
    print(text)
   # 保存 识别出的文字到文本
    with open('验证码\\11.txt','ab') as fier:
        fier.write('\n'.encode())
        fier.write(('这是第几张图片'+str(num)).encode())
        fier.write('\n'.encode())
        fier.write(text.encode())

# 调用函数，提取本地15张图片中的文字到TXT文件
for num in range(15):
    images_to_string(num)

五、拓展

遗留问题：对于规整的文案识别清晰度很高，但是对于一些崎岖的文字/数字识别很容易出问题。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

图形验证码文字识别——pytesseract 的相关文章

嵌套字典中的 Django 模板

我正在使用 Django 模板并且遇到了嵌套字典的一个问题 Dict result dict type 0 file name abc count 0 type 1 file name xyz count 50 我的 HTML 文件中的模
如何使用 colorchecker 在 opencv 中进行颜色校准？

我有数码相机获取的色彩检查器图像我如何使用它来使用 opencv 校准图像按照以下颜色检查器图像操作您是想问如何进行颜色校准或如何使用 OpenCV 进行校准为了进行颜色校准您可以使用校准板的最后一行灰色调以下是您应该逐步进行
TensorFlow：带有轴选项的 bincount

在 TensorFlow 中我可以使用 tf bincount 获取数组中每个元素的计数 x tf placeholder tf int32 None freq tf bincount x tf Session run freq feed
在 python 3 中使用子进程

我使用 subprocess 模块在 python 3 中运行 shell 命令这是我的代码 import subprocess filename somename py in practical i m using a real fil
从sklearn PCA获取特征值和向量

如何获取 PCA 应用程序的特征值和特征向量 from sklearn decomposition import PCA clf PCA 0 98 whiten True converse 98 variance X train clf f
Pyqt-如何因另一个组合框数据而更改组合框数据？

我有一个表有 4 列这 4 列中的两列是关于功能的一个是特征另一个是子特征在每一列中所有单元格都有组合框我可以在这些单元格中打开txt 我想当我选择电影院作为功能时我只想看到子功能组合框中的电影名称而不是我的数据中的
Pandas dataframe：每批行的操作

我有一个熊猫数据框df我想计算每批行的一些统计信息例如假设我有一个batch size 200000 对于每批batch sizerows 我想要一列的唯一值的数量ID我的数据框我怎样才能做这样的事情呢这是我想要的一个例子 prin
使用 NLTK 在 Python 中获取大量名词（或形容词）；或 Python Mad Libs

Like 这个问题 https stackoverflow com questions 7439555 noun adjective etc word lists or dictionaries common words 我有兴趣按词性获取
“一旦获取切片就无法更新查询”。最佳实践？

由于我的项目的性质我发现自己不断地从查询集中取出切片如下所示 Thread objects filter board requested board id order by updatedate 10 但这给我带来了实际对我选择的元素进
ImportError：运行 jupyter Notebook 时没有名为 IPython.paths 的模块？

我通过以下方式安装了 jupyter usr local opt python bin python2 7 m pip install jupyter 这将安装 ipython 版本 4 1 2 但是当我运行 jupyter Notebo
小部件之间的自定义信号

尝试将信号从一个 gtk EventBox 子级发送到另一个在 init HeadMode 第 75 行上出现错误类型错误未知信号名称消息发送 why usr bin env python coding utf8 import p
使用 Python 计算 Spark 中成对 (K,V) RDD 中每个 KEY 的平均值

我想与 Python 共享这个特定的 Apache Spark 解决方案因为它的文档非常贫乏我想通过 KEY 计算 K V 对存储在 Pairwise RDD 中的平均值示例数据如下所示 gt gt gt rdd1 take 10
ValueError：不支持连续[重复]

这个问题在这里已经有答案了我正在使用 GridSearchCV 进行线性回归的交叉验证不是分类器也不是逻辑回归我还使用 StandardScaler 对 X 进行标准化我的数据框有 17 个特征 X 和 5 个目标 y 观察约11
如何根据 HTTP 请求使用 Python 和 Flask 执行 shell 命令并流输出？

下列的这个帖子 https stackoverflow com questions 15092961 how to continuously display python output in a webpage 我能够tail f网页的日志
Pandas：如何将数据框插入 Clickhouse

我正在尝试将 Pandas 数据框插入 Clickhouse 这是我的代码 import pandas import sqlalchemy as sa uri clickhouse default localhost default ch
Werkzeug 中的线程和本地代理。用法

首先我想确保我正确理解了功能的分配分配本地代理功能以通过线程内的模块包共享变量对象我对吗其次用法对我来说仍然不清楚也许是因为我误解了作业我用烧瓶如果我有两个或更多模块 A B 我想将对象C从模块A导入到模块B 但我
`pyqt5'错误`元数据生成失败`

我正在尝试安装pyqt5使用带有 M1 芯片和 Python 3 9 12 的 mac 操作系统我怀疑M1芯片可能是原因我收到一个错误metadata generation failed 最小工作示例 directly in the t
bs4 `next_sibling` VS `find_next_sibling`

我在使用时遇到困难next sibling 并且类似地与next element 如果用作属性我不会得到任何返回但如果用作find next sibling or find next 然后就可以了来自doc https www cru
操作错误：(sqlite3.OperationalError) SQL 变量太多，同时将 SQL 与数据帧一起使用

我有一个熊猫数据框如下所示 activity User Id 0 VIEWED MOVIE 158d292ec18a49 1 VIEWED MOVIE 158d292ec18a49 2 VIEWED MOVIE 158d292ec18a4
python 中的 after() 与 update()

我是 python 新手开始使用 tkinter 作为画布到目前为止我使用 update 来更新我的画布但还有一个 after 方法谁能给我解释一下这个函数请举个例子两者之间有什么区别 root after integer c

随机推荐

maven仓库快速镜像

国内连接maven官方的仓库更新依赖库网速一般很慢收集一些国内快速的maven仓库镜像以备用国内OSChina提供的镜像非常不错
网络编程_常用的基本函数介绍——htonl、ntohl、htons、ntohs

1 htonl函数将主机的unsigned long值转换成网络字节顺序 32位一般主机跟网络上传输的字节顺序是不通的分大小端函数返回一个网络字节顺序的数字 include stdafx h include
uni-app如何配置隐私政策

uni app如何配置隐私政策在manifest json中的privacy中可以配置注意点隐私政策可以使用http 地址如果隐私政策需要使用本地文件可以把html放在hybrid文件夹中注意a链接的地址正确写法如下图
React 好用的工具库

俗话说的好工欲善其事必先利其器笔者在开发 React 项目的时候总结出一些很不错的 React 库可以提高开发效率满足业务需求接下来将一一介绍它们 UI组件库 Ant Design 要说 React 最受欢迎的 UI 组件库
elasticsearch7新特性_Elasticsearch 7.0 已经发布，盘他！

Elastic ON 北京分享了Elasticsearch7 0在Speed Scale Relevance等方面的很多新特性比快更快有传说中的那么牛逼吗盘他通过本文你能了解到 Elasticsearch Kibana 7 部署体
Linux中Docker入门知识基础

Linux中Docker入门知识docker基础 1 Docker概述我们开发的代码会接触到不同环境开发环境测试环境以及生产环境 1 1 Docker概述 Docker 是一个开源的应用容器引擎 Docker 可以让开发者打包他们的应
解密蓝牙mesh系列

转载自蓝牙技术联盟蓝牙mesh网络低功耗低功耗蓝牙低功耗蓝牙 Bluetooth Low Energy 是一项相当成功的无线技术如今已经很难找到不支持低功耗蓝牙的智能手机或平板电脑了可以说它是可穿戴技术兴起的关键因素在医疗设
wifi名称可以有空格吗_公司刚成立不久，公司名称可以变更吗？

最近有很多老板在问想要把公司的名字改一改可以吗所以今天护航财税的小编来告诉大家已经注册好的公司能不能变更名字 1 公司名称可以更改吗其实公司名称是可以更改的当企业在经营的过程中由于发展或其他原因需要想要更改公司的可以向工商局
git：回滚某次修改，revert某个commit的操作但不生成提交

说明在使用小乌龟进行回滚时我们发现通常是不会提交的而在gitbash里我们使用git revert时却发现会自动生成一次提交原因是命令不对通常我们需要使用git revert n sha 1 某次提交的sha 1值这样就不会
解决setBackgroundResource出现oom的问题

setBackgroundResource加载图片的额时候会出现错误 private final int imageIds R mipmap a R mipmap b R mipmap c R mipmap d R mipmap e Im
springcloud环境搭建——eureka

springcloud环境搭建 eureka 目录 springcloud环境搭建 eureka 新建IDEA项目初始化父工程父工程的pom文件初始化服务一 Eureka服务注册中心子module的pom 微服务eureka的配置步
上门服务小程序源码家政小程序源码同城到家小程序源码

上门服务小程序源码家政小程序源码同城到家小程序源码开发语言 thinkphp mysql 前端 uni app 支持小程序公众号H5 APP 编号 8 1 数据概况新增业务城市用户投票功能更加直观的查看业务城市的关注度人气
unity 各AR插件对比

上个项目使用到AR 使用了好几个AR SDK来测试先总结一下可能后续有所不同仅为当前各AR插件对比 2D 3D Android PC vuforia EasyAR HiAR 太虚AR 解释一下 vuforia并不是不支持PC平台而
Virtual DOM 算法

1 前言本文会在教你怎么用 300 400 行代码实现一个基本的 Virtual DOM 算法并且尝试尽量把 Virtual DOM 的算法思路阐述清楚希望在阅读本文后能让你深入理解 Virtual DOM 算法给你现有前端的编程
基于2维卷积神经网络的心电图分类

在这里给大家分享一篇关于用深度学习进行心电图识别的论文原文地址https arxiv org abs 1804 06812 我翻译成了中文以便大家快速学习中间难免有疏忽遗漏的地方请大家谅解深度医疗 1 心电图特征识别这篇文章是由韩
C++入门基础05：表达式(表达式基础、算术运算符与赋值运算符、逻辑关系运算符、成员访问运算符与条件运算符、位运算符、移位运算符与类型转换)

C 入门基础05 表达式表达式基础算术运算符与赋值运算符逻辑关系运算符成员访问运算符与条件运算符位运算符移位运算符与类型转换一表达式基础 include
LInux下串口编程详解细节

LInux下串口设置详解日期 2011 04 01 来源 Linux社区作者 huang879135 字体大中小串口的设置主要是设置struct termios结构体的各个成员值 include
【浙大版《Python 程序设计》题目集（解）】第6章函数-1 使用函数求特殊a串数列和（10分）

给定两个均不超过9的正整数a和n 要求编写函数fn a n 求a aa aaa aa aa n个a 之和 fn须返回的是数列和函数接口定义 fn a n 其中 a 和 n 都是用户传入的参数 a 的值在 1 9 范围 n 是 1 9 区间
快排函数 -- qsort函数（Quick Sort）

文章目录 1 qsort函数简介 1 1 函数原型 1 2 参数含义 2 比较函数介绍 3 比较函数使用案例 3 1 整型数组 3 2 浮点型数组 3 3 结构体类型字符串 4 利用冒泡排序模拟实现qsort函数的功能 1 qsort函数
图形验证码文字识别——pytesseract

图形验证码内容识别 pytesseract 一目的二实现方式三环境准备四代码实现五拓展一目的我们工作中会遇到一些需要把图片中的文字识别出来使用的例子比如图形验证码提取图片中的文章等如果工作量比较小或者不需要重