python实现OCR识别图片验证码

2023-11-20

用cv2模块读取和显示模块

#导包cv2拓展模块
import cv2
 
#先给窗体起名字
cv2.namedWindow("ShowImage1")
cv2.namedWindow("ShowImage2")
image1 = cv2.imread("img01.jpg",1)
image2 = cv2.imread("img01.jpg",0)  # 位置参数，第二个0代表灰度模式
# 创建窗口句柄
cv2.imshow("ShowImage1",image1)
cv2.imshow("ShowImage2",image2)
cv2.waitKey(0) # 0代表按任何键后继续执行程序
# 释放窗口句柄
cv2.destroyAllWindows()

OCR开源识别程序

Download for old versions of Tesseract
Tesseract 3
https://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-3.05.02-20180621.exe

调用tesseract程序识别图片

出处：毫无障碍学Python

10.2.1 简单的OCR-Tesseract包

图片

代码

import subprocess

# 1、调用tesseract识别图片，并将结果保存至result.txt文件中
ocr = subprocess.Popen("tesseract text1.jpg result")
# 2、识别过程中插入程序等待时间
ocr.wait()
# 3、打开并读取文本文件，使用strip()去除头尾
text1 = open("result.txt",mode ='r',encoding='utf-8').read().strip()
print(text1)

结果

How to change background image without changing drawn lines

待识别的验证码

图像识别OpenCV处理

import cv2, subprocess
# 已安装OpenCV-python模块
img = cv2.imread("media\\bank.jpg")  #讀圖
cv2.namedWindow("Image")  
cv2.imshow("Image", img) #顯示圖形
cv2.waitKey(0) #参数为0，则不会有返回值
cv2.destroyWindow("Image")
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)  #轉為灰階
_, inv = cv2.threshold(gray, 150, 255, cv2.THRESH_BINARY_INV)  #轉為反相黑白
for i in range(len(inv)):  #i為每一列
    for j in range(len(inv[i])):  #j為每一行
        if inv[i][j] == 255:  #顏色為白色
            count = 0 
            for k in range(-2, 3):
                for l in range(-2, 3):
                    try:
                        if inv[i + k][j + l] == 255:  #若是白點就將count加1
                            count += 1
                    except IndexError:
                        pass
            if count <= 6:  #週圍少於等於6個白點
                inv[i][j] = 0  #將白點去除
dilation = cv2.dilate(inv, (8,8), iterations=1)  #圖形加粗
cv2.imwrite("media\\bank_t.jpg", dilation)  #存檔文件
# 已安装tesseract-ocr-setup-3.02.02.exe
child = subprocess.Popen('tesseract media\\bank_t.jpg result')  #OCR辨識
child.wait()  #等待
text = open('result.txt').read().strip()  #读取文本
print("驗證碼為 " + text)  #打印输出

结果：

Tesseract Open Source OCR Engine v3.02 with Leptonica
驗證碼為 698139

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

python实现OCR识别图片验证码的相关文章

多索引上的 pandas dataframe groupby

我正在使用 Pandas dataframe 来读取 Excel 文件并对其进行一些操作我有一个包含多行的标题现在我想按几个列值进行分组但是我无法找到解决方案 Excel 示例 name address contact info fi
将整数列表划分为总和相等的 K 个子列表

类似的问题还有1 https stackoverflow com questions 27322804 partition of a set into k disjoint subsets with equal sum and 2 http
如何在 Windows 和 Python 2.7 上模拟 os.path.samefile 行为？

给定两个路径我必须比较它们是否指向同一个文件在 Unix 中这可以通过以下方式完成os path samefile 但正如文档所述它在 Windows 中不可用模拟此功能的最佳方法是什么它不需要模拟常见情况就我而言有以下简化
不区分大小写的用户输入字符串

使用哪个函数使用户输入字符串不区分大小写 correctAnswer London userGuess input What is the capital of Great Britain if userGuess London print
将多种类型存储为 C++ 字典中的值？

我想编写一个行为几乎等同于 Python 字典的 C 对象 C 的std map and std unordered map容纳了 Python 字典已有的一些功能但缺乏最重要的功能之一即能够添加任意对象和类型即使不可能您离实现 P
如何测试 Flask 开发服务器是否已启动？

我的 Flask 应用程序上有一个测试装置它启动开发服务器来测试一些用户交互对于第一个测试我想确保服务器已启动一般而言无需测试特定响应代码执行此操作的最佳方法是什么我希望我能用self assertTrue response
将 python 字典翻译为 C++

我有包含以下代码的 python 代码 d d 0 0 0 d 1 2 1 d 2 1 2 d 2 3 3 d 3 2 4 for i j in d print d i j d j i 不幸的是对于我的目的来说循环遍历 python 中
是否可以在数据类中使用 *args？

我最近开始使用数据类 https www python org dev peps pep 0557 它们将成为 3 7 的一个很好的补充我很好奇是否或如何可以使用数据类重新创建此类的相同功能 class Nav object def in
使用 Python 从基于 AJAX 的网站提取信息

我正在尝试使用 Python 检索基于 ajax 的网站例如 www snapbird org 上的查询结果由于它没有显示在页面源中我不确定如何继续我是一个Python新手因此如果我能得到一个指向正确方向的指针那就太好了如果更容
修改Keras中的层权重

我正在尝试修改 Keras 中某个层的输出我有一个编码器它将时间序列转换为潜在空间之后对于每个压缩的时间序列我想向时间序列添加一些数字例如我有 input d Input 100 h1 d Reshape 100 1 input
ValueError：当数组不是序列时设置带有序列的数组元素

您好此代码旨在存储使用 open cv 绘制的矩形的坐标并将结果编译为单个图像 import numpy as np import cv2 im cv2 imread 1 jpg im3 im copy gray cv2 cvtColo
如何在python中将所有参数转换为字典

我想要我的功能func args kwargs 返回一本字典其中包含我提供给它的所有参数例如 func arg1 arg2 arg3 value3 arg4 value4 应该返回一本这样的字典 arg1 value1 arg2 val
覆盖 Autobahn/Twisted WebsocketClientProtocol 类

我想重写我的 WebSocketClientFactory 类以允许传入数据填充作业队列这是我正在尝试的连接代码 factory WebSocketClientFactory ws localhost 7096 job queue Que
在 selenium 下运行 chromedriver 日志时，如何减少其详细程度？

我的功能测试的詹金斯失败报告充满了这样的行 selenium webdriver remote remote connection DEBUG Finished Request selenium webdriver remote remot
在 matplotlib 中使用轴绘制带有子点的图形时出现错误

我尝试使用下面的代码绘制子图但是我得到了 AttributeError numpy ndarray object has no attribute boxplot 但改变plt subplots 1 2 它正在用indexerror绘制箱
如何检查给定名称的变量是否是非本地变量？

给定一个堆栈帧和一个变量名我如何判断该变量是否是非局部的例子 import inspect def is nonlocal frame varname How do I implement this return varname not
Django 查询集和生成器

出乎意料的是我想知道以下使用生成器迭代结果集的方式是否会对正常迭代产生任何积极或消极的影响 eg def all items generator for item in Item objects all yield item for it
Python libusb pyusb“mach-o，但架构错误”

我在使用 pyusb 模块时遇到一些问题我已将问题范围缩小到一行并创建了一个小示例脚本来复制错误 usr bin env python This module was created to isolate the problem in
检查单元测试中是否调用了 Timer.cancel

我正在使用threading Timer包在 x 秒后执行方法但是在某些情况下我想提前执行此方法并取消计时器因此不会调用两次我如何对此进行单元测试我想知道计时器是否已停止以便不再调用该方法我现在使用以下代码不幸的是is a
使用 NumPy 函数计算 Pandas 的加权平均值

假设我们有一个像这样的 pandas 数据框 a b id 36 25 2 40 25 3 46 23 2 40 22 5 42 20 5 56 39 3 我想执行一个操作 a div b 然后按 id 分组最后使用 a 作为权重计算加权

随机推荐

quill编辑器使用

官方git https github com quilljs quill 官方文档 https quilljs com 中文文档 https kang bing kui gitbook io quill 编辑器是个正经编辑器就是文档太不正
android studio更新到3.6以上后布局文件不能切换到xml编辑器？那就点进来吧

android studio更新到3 6以上后布局文件不能切换到xml编辑器只能拖拽写UI了怎么可能看下面截图打开布局文件后默认是到预览界面的右上角的三个按钮就是用来切换视图的自己点击试试就知道啦
正则校验手机号

正则表达式可以用来校验手机号码的合法性如果你想使用正则表达式来校验中国大陆的手机号码可以使用如下的正则表达式 1 3 9 d 9 这个正则表达式可以匹配所有 13 到 19 开头的 11 位数字即所有中国大陆的手机号码例如如果你想
全网最全的人类图解析(上)——九大能量中心与64道闸门

以下内容来源皆来自亚洲人类图学院获得自己的人类图传送门文章目录简介一九大能量中心简介 1 头脑中心 Head Center 头脑中心的主题灵感 2 逻辑中心 Ajna Center 逻辑中心的主题概念化 3 喉咙中心 Th
CSDN平台上怎么样才能赚钱?

CSDN平台上有多种方式可以赚钱以下是其中几种常见的 1 写作赚钱 CSDN平台鼓励用户积极创作原创技术博客通过博客的阅读量和转发量来获取广告收益用户还可以发表付费文章或参与付费专栏在文章的阅读量和付费订阅量上获得收入 2 交流赚钱
java使用visio画类图,【什么是类图使用类图的方法】使用visio画类图

类图是显示了模型的静态结构特别是模型中存在的类类的内部结构以及它们与其他类的关系等那么你对类图了解多少呢以下是由小编整理关于什么是类图的内容希望大家喜欢类图的概述类图 Class diagram 由许多静态说明性的模型元素
【数据结构--二叉树】平衡二叉树

题目描述代码实现 Definition for a binary tree node struct TreeNode int val struct TreeNode left struct TreeNode right int TreeH
Could not proxy request /captchaImage from localhost to http://localhost:8080/.

项目场景项目场景配置若依环境前端通过 run npm dev 启动报500 问题描述根据报错分析无法将请求路径从本地主机代理到http 本地主机 8080 原因分析我们可以看到前端配置的端口号80 地址就是本机没有问题排除前
变分模态分解（VMD）运算步骤及源码解读

1 简述 VMD的目标是将实值输入信号 f f f分解为离散数量的子信号模态 u k u k uk 我们先假设每个模态在一个中心频率
Axure谷歌Chrome浏览器插件安装教程

1 引言经常看到这样的问题 1 我用Axure做的原型怎么不能用谷歌浏览器查看 2 到哪里下载Axure谷歌浏览器插件 3 Axure谷歌浏览器插件下载下来怎么安装其实这些问题百度一下都能找到答案不过有些答案对于新手来说比较麻烦就拿
c语言函数中调用的参数太多

c语言函数中调用的参数太多问题问题展示问题分析解决方法问题展示图中是我遇到的情况问题分析大家可以看到在函数中指针变量和后面的整数变量都成了灰色解决方法图中问题只需将中文逗号改为英文逗号即可一定要检查双引号或者逗号是
QT中使用Sqlite

QT中使用Sqlite 首先要在 pro中引用sql 引用方法新添加语句 QT sql 在原来的基础上追加 QT core gui sql 然后再widget h中添加对sql头文件的引用 include
idea connect timed out 解决方法

使用IntelliJ IDEA 创建Spring Boot项目时显示 connect timed out 解决方法 1 很多博客说将 https start spring io 改为 http start spring io 但是我这里不
手动切换 Kinect 的驱动程序（for OpenNI 1.* & Microsoft Kinect SDK 1.7）

微软最近推出了最新版的 Kinect SDK 能够实现实时的 Kinect Fusion 并提供了丰富的手势交互功能对体感交互开发人员的吸引力越来越大而 OpenNI 2 0 以上的版本也转为使用微软官方的 Kinect 驱动也显示了
移动端适配-01-百分比宽度

1 图片可以在parent中使用 1 line heigh和text align使水平和竖直居中 2 在img标签中加vertical align middle 2 3 background size 1 两个参数 background s
Ubuntu18.04安装cuda10.1+cudnn8.0.5+pytorch1.8.1【亲测～】

Ubuntu18 04安装cuda10 1 cudnn8 0 5 pytorch1 8 1 亲测目录第一步 Cuda10 1的安装第二步 Cudnn8 05的安装 1 进入官网 https developer nvidia com r
[思维模式-15]：《复盘》-3- “行”篇 - 操作复盘- 个人复盘

目录前言一将军不是教出来的而是打出来的二复盘是能力提升的有效方式三对什么进行个人复盘 1 新的事 2 重要的事 3 有价值的事 4 按照规范惯例处置不太奏效的事件未达预期的事四个人复盘的两种操作手法 1 自我简易复盘
cisco 小型园区与网络的构建及其应用

一实验目的熟练构建小型区域网络二实验设备 Cisco 2811 路由器 6台 cisco 3650 交换机 6台 cisco 2960 交换机7台 pc机8台服务器6台数据线缆若干三实验拓扑四实验步骤
applicationContext.xml第一行无缘无故报错!!!

eclipse的bug 在projects里clean一下就好了右键project的validate不管用
python实现OCR识别图片验证码

用cv2模块读取和显示模块导包cv2拓展模块 import cv2 先给窗体起名字 cv2 namedWindow ShowImage1 cv2 namedWindow ShowImage2 image1 cv2 imread img01