RPA经验分享--离线识别普通验证码

2023-11-18

了解RPA:
www.i-search.com.cn

学习RPA
https://support.i-search.com.cn/

下载RPA:
https://www.i-search.com.cn/?from=csdn

前言
以下方法适用于简易的验证码识别,需要根据自身情况进行调整。

一、配置环境
安装 pytesseract 库
首先我们需要检查是否已经安装了 pytesseract 库,经过检查8.0 以上版本的设计器,都是已内置了 pytesseract 库的,所以可以不用再安装。
想练练手也可以再重新安装一遍。
安装:cd 至 Python\Scripts,运行命令 pip3 install pytesseract

安装 Tesseract-OCR
我这里使用的是 4.1 版本 (64 位)
另外提供 32 位的安装包
也可自行去官网下载所需版本
记住使用对应位数的安装包进行安装,安装时全部 next 即可。

找到 pytesseract.py 配置 tesseract_cmd
(1)我使用的是 8.0 版本的设计器,pytesseract.py 的路径如图,一般是在 Python\Lib\site-packages\pytesseract 下:
在这里插入图片描述

(2)打开 pytesseract.py 配置 tesseract_cmd,配置路径为第二步安装的 Tesseract-OCR 下的 tesseract.exe 的路径,默认路径为 C:\Program Files\Tesseract-OCR\tesseract.exe, 根据自身安装情况进行配置,记住路径前加 r,防止字符转义。
在这里插入图片描述

二、对图片进行处理

  1. 保存验证码图片,对图片进行二值化处理
    我们对验证码图片进行截图保存,注意截图的位置需要自己进行调整,根据自身情况调整为最佳位置。
    在这里插入图片描述

from PIL import Image
#选择需要处理的验证码截图
img = Image.open(‘yzm.jpg’)
#模式L”为灰色图像,它的每个像素用8个bit表示,0表示黑,255表示白,其他数字表示不同的灰度。
Img = img.convert(‘L’)
#自定义灰度界限,大于这个值为黑色,小于这个值为白色。threshold可根据实际情况进行调整。
threshold = 135
table = []
for i in range(256):
if i < threshold:
table.append(0)
else:
table.append(1)
#图片二值化
photo = Img.point(table,‘1’)
#保存处理好的图片
photo.save(‘yzm.jpg’)
处理后的图片如下:
在这里插入图片描述

三、识别验证码
import pytesseract
from PIL import Image
#路径前加r防止转义
path = r’C:\yzm.jpg’
img = Image.open(path)
yzm= pytesseract.image_to_string(img)
print(yzm)

四、总结
我在第二值化处理之后发现处理后的图片几乎没有噪点,所以我这里并没有对图片进行降噪,便可直接进行识别。
如果图片噪点比较多是要对图片进行降噪再识别,可以自己在网上搜索降噪的代码。
大家要根据自身情况对图片进行处理。
文章来源:艺赛旗社区-LlIiNn,原文链接:https://support.i-search.com.cn/article/1615947401879

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

RPA经验分享--离线识别普通验证码 的相关文章

随机推荐

  • 智能指针的deleter机制

    一 介绍 智能指针的deleter机制是指 当智能指针的引用计数降为0时 智能指针会自动调用一个指定的析构函数 deleter 来释放所管理的内存 这个析构函数通常是一个函数对象 可以是一个函数指针 一个lambda表达式或者一个重载了函数
  • 基于模型的六轴机器人阻抗力控制算法(matlab simscape,机器人模型可换)

    基于模型的六轴机器人阻抗力控制算法 matlab simscape 机器人模型可换 视频中红色为期望轨迹 黑色为实际轨迹 工程可一键运行 可学到机器人阻抗力控制算法以及通过m文件设置simulink参数及调用simulink的方法 ID 4
  • FutureWarning: Criterion ‘mse‘ was deprecated in v1.0 and will be removed in version 1.2.

    出现FutureWarning Criterion mse was deprecated in v1 0 and will be removed in version 1 2 Use criterion squared error whic
  • c++如何按照空格分割字符串

    我们经常会需要在txt文本或csv中提取字符串 例如 调用了一次readline 之后 我们得到了如下一行string id 1 name 345 size 728 632 value 3 1415926 我们想把这行字符串按照空格进行分割
  • 【TypeScript】断言

    目录 概念 用法 实例 总结 概念 TypeScript类型断言是一个编译时语法 用于告诉编译器用户比编译器更加确定变量的类型 进而解除编译错误 类型断言有点类似于其他语言的类型转换 但它没有运行时的影响 只是在编译阶段起作用 所以 即使通
  • 树莓派下opencv3.4.0的安装与错误处理

    1 opencv3 4 0的下载 1 可以在树莓派的终端界面通过wegt命令下载 但下载速度可能很慢 终端输入下列代码进行下载 cd home pi Downloads wget https github com Itseez opencv
  • 【ElementUI组件】视频上传+计算视频时长

    效果如下 实现步骤 1 首先先安装官网的操作步骤安装elementui 或者 不安装直接引入 安装指令 npm i element ui S 引入方式 2 以下是参考代码 HTML代码 div div
  • 内网端口转发及穿透-

    转 内网端口转发及穿透 最近尝试了一些内网端口的转发和内网穿透 现在一起总结一下 0x01 正向和反向代理 正向代理中 proxy和client同属一个LAN 对server透明 反向代理中 proxy和server同属一个LAN 对cli
  • 执行npm install 时报错 Host key verification failed

    问题 安装依赖的时候出现Host key verification failed问题 整理了一下解决流程 1 要在git设置一下身份的名字和邮箱 git config global user name yourname gt 用户名 git
  • Unity中自定义协程函数

    Unity中提供了协程的方法 在处理一些需要异步的函数时非常方便 尤其是在处理网络请求响应的时候 但是协程函数有些时候需要自定义 这就需要自己实现满足条件的协程函数了 好在Unity提供了这样的类来帮助我们实现相关的功能 通过继承Custo
  • Springboot2.0中webflux到底优秀在哪里

    Spring boot webflux中所说的反应堆式编程reactor到底优秀在哪里 小编的Springboot2 0的课程已经快全部写完了 总结来看 对于有基础的同学学习难度不是很大 一周内就能上手 但是在小编看来编程如果说只会用 而不
  • 记一次wwwscan目录扫描后获取敏感目录登录后台

    1 开启wwwscan工具 2 配置信息 目标域名不要带协议头 直接www xxx com或者192 168 67 xxx 3 点击 扫描 等待扫描之后会在wwwscan的同级目录下生成结果文件 4 打开第三个文件 5 点击访问 说明 tx
  • [机器学习与scikit-learn-31]:算法-回归-线性模拟拟合拟合非线性数据-概述

    作者主页 文火冰糖的硅基工坊 文火冰糖 王文兵 的博客 文火冰糖的硅基工坊 CSDN博客 本文网址 https blog csdn net HiWangWenBing article details 123555129 目录 第1章 什么是
  • 进程和线程的详解和区别

    1 进程和线程概述 我们都知道计算机的核心是CPU 它承担了所有的计算任务 而操作系统是计算机的管理者 它负责任务的调度 资源的分配和管理 统领整个计算机硬件 应用程序是具有某种功能的程序 程序是运行于操作系统之上的 2 进程 我们编写的代
  • 交直流双电源无缝切换

    使用ATmega32编写交直流双电源无缝切换 输入过欠压保护 输出过流保护 主要使用了单片机自带的比较器功能 比较器的一端使用了LT431制作的2 5V基准源 include iom32v h define WDR asm WDR defi
  • 尚硅谷nodejs操作mongodb报错,MongoNotConnectedError: Client must be connected before running operations【已解决】

    1 准备好第一步的静态案例 2 启动mongodb服务 在cmd运行mongod Waiting for connections attr port 27017 ssl off 3 准备mongoose数据库模块化 4 新建AccountM
  • this.$el.querySelectorAll is not a function报错解决

    问题描述 使用el tree时 报错this el querySelectorAll is not a function 导致树无法渲染 问题解析 参考如下代码片段
  • [激光原理与应用-66]:激光器-器件 - 二极管

    第1章 二级管的基本原理 1 1 原理 现在的电子产品中 元件应用最多的是半导体材料 在集成电路中 也是应用的半导体单晶硅作为基底 通过离子注入技术而添加了硼和磷元素从而构成数以亿计的半导体晶体管 对于半导体元件来说 发挥作用的是PN结 在
  • 5G/NR 随机接入过程之Msg2

    21 6 Msg2 UE发送了preamble之后 将在RAR时间窗 RA Response window 内监听PDCCH 以接收对应RA RNTI的RAR 此时不考虑可能出现的测量gap 如果在RAR时间窗内没有接收到gNB回复的RAR
  • RPA经验分享--离线识别普通验证码

    了解RPA www i search com cn 学习RPA https support i search com cn 下载RPA https www i search com cn from csdn 前言 以下方法适用于简易的验证码