python调用pytesseract识别某网站的验证码(实战项目)

2023-05-16

一、首先安装 tesseract-ocr-setup-4.00.00dev.exe

下载地址 链接:https://pan.baidu.com/s/1PFIrfNeUjmrXlUABS8SquA 
提取码:dctm 

1.直接安装

2.安装完之后,将目录(C:\Program Files (x86)\Tesseract-OCR) 配置到path中 

3.新建一个系统变量,名称为“ TESSDATA_PREFIX”  内容跟步骤二一样的内容

二、配置完系统变量之后,我们先查看下是否安装好了

1.运行cmd

2.输入命令 tesseract.exe 1.png output -l eng  (图片为1.png)

3.那么就会在当前路径 输出一个outinput的txt文件了,文件里面的内容 就是识别出来的内容  

三、安装 PIL(Pillow-3.4.2-cp36-cp36m-win_amd64)

1.如果pip安装不行的话 这里下载地址分享给你们给你们

链接:https://pan.baidu.com/s/1_DOGYfVkx5u2pg73hP_hFA 
提取码:d25h 

四、安装 pytesseract

1.这个毫无疑问 直接 pip3 install pytesseract

五、最后 就是如何使用了

1.记住如果提示环境变量有问题  那就是因为你们创建那个叫做TESSDATA_PREFIX的系统变量,或者她对应的路径错误

2.使用代码展示

import pytesseract
from PIL import Image
code = pytesseract.image_to_string(Image.open(r"%s.png" %tel), lang='eng').replace(" ", "")

3.只要这三行代码,你就能得到 纯数字验证码了(当然这个如果你需要识别中文或者其他的文字,需要下载啥补丁包)。

六、最后分享某网址的注册脚本源代码(域名显示xxx)

 

import requests
import pytesseract
from PIL import Image
from requests.packages.urllib3.exceptions import InsecureRequestWarning

requests.packages.urllib3.disable_warnings(InsecureRequestWarning)


class Spider38363(object):
    def __init__(self):
        self.host = "https://www.xxxxx.com"
        self.requests = requests.session()
        self.msg = ""
        self.telprefix = str(input("请输入您需要注册的号码前七位:"))
        self.prefixstart = int(input("请输入您需要注册的号码后四位开始:"))
        self.telprefixend = int(input("请输入您需要注册的号码后四位结束:"))
        self.header = {
            'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) \
                          AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'}

    def registered_user(self, captcha, tel):
        flag = {}
        registbody = {'username': tel, 'mobile_phone': tel, 'password': '123ASD',
                      're_password': '123ASD', 'weixin': '123456',
                      'withdraw_realname': '%E4%BD%A0%E5%A5%BD%E8%80%81%E5%93%A5', 'captcha': captcha,
                      'reg_terminal': '1', 'e164': '86_18607410000', 'unique_id': ''}
        try:
            flag = self.requests.post(url=self.host + "/cn/cgi/api/register", data=registbody, verify=False,
                                      timeout=10,headers=self.header).json()
            self.msg = flag.get("msg")
        except Exception as ex:
            print("服务器异常 注册接口无法得到正确的请求:%s" % ex)
            pass
        if flag.get("status") == 1:
            return 1
        else:
            return 0

    def save_verifycode_image(self):
        with open("verifycode.png", "wb") as f:
            try:
                html = self.requests.get(url=self.host + "/cn/cgi/api//captcha?a=0.973962746915739", verify=False,
                                         timeout=10,headers=self.header).content
                f.write(html)
            except Exception as ex:
                print("服务器异常 保存图片接口无法得到正确的请求:%s" % ex)
                pass


if __name__ == "__main__":
    xiejiangpeng = Spider38363()
    success_number = 0
    failure_number = 0
    for i in range(xiejiangpeng.prefixstart, xiejiangpeng.telprefixend):
        tel = xiejiangpeng.telprefix + str(i)
        xiejiangpeng.save_verifycode_image()
        code = "1234"
        try:
            code = pytesseract.image_to_string(Image.open(r"verifycode.png"), lang='eng').replace(" ", "")
        except Exception as ex:
            print("ocr识别图片出错 %s " % ex)
        num = xiejiangpeng.registered_user(captcha=code, tel=tel)
        if num == 1:
            print("号码%s 注册成功" % tel)
            success_number = success_number + 1
        else:
            print("号码%s 注册失败 失败信息为%s" % (tel, xiejiangpeng.msg))
            failure_number = failure_number + 1
    print("程序运行完成,成功数%d   失败数%d" % (success_number, failure_number))
 

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

python调用pytesseract识别某网站的验证码(实战项目) 的相关文章

  • FFmpeg入门详解之19:音视频封装原理简介

    什么是数据封装和解封装 数据封装 xff08 baiData Encapsulation xff09 xff0c 笼统地讲 xff0c 就是把业务数据映射到du某个封装协议zhi的净dao荷中 xff0c 然后填充对应协议的包头 xff0c
  • FFmpeg入门详解之35:FFplay播放器

    ffplay的初体验及快捷键 ffplay是ffmpeg工程中提供的播放器 xff0c 功能相当的强大 xff0c 凡是ffmpeg支持的视音频格式它基本上都支持 甚至连VLC不支持的一些流媒体都可以播放 xff08 比如说RTMP xff
  • 达梦数据库入门:管理实例(Linux)

    达梦数据库管理实例 xff08 Linux xff09 1 xff1a 创建数据库实例 一 使用数据库助手 xff08 GUI xff09 创建数据库实例 xff08 安装用户 xff1a dmdba 安装路径 dm8 xff09 1 登录
  • Win11 WSL2 启用 systemd 及设置静态 / 固定 IP

    一 以管理员身份打开 Windows 终端 默认情况下 xff0c 鼠标右击桌面弹出的快捷菜单上有一项 在终端中打开 xff0c 点击它后就会启动 Windows 终端 此时的终端并不是以管理员身份运行的 点击 Windows 终端标题栏上
  • VSCode点击“Open In Default Browser”提示错误信息“Open browser failed!! ...”

    运行html文件点击 Open In Default Browser 时 xff0c 提示报错信息 Open browser failed Please check if you have installed the browser chr
  • 用VScode运行Vue项目(node.js环境的配置,如何以管理员身份运行cmd)

    用VScode运行Vue项目详细全过程 xff08 node js环境的配置 xff09 D gloria的博客 CSDN博客 基本按上面博主的步骤来的 xff0c 只是中间一些步骤记一下笔记 上面文章中运行cmd时 xff0c 要根据博主
  • 全世界最强的算法平台codeforces究竟有什么魅力?

    大家好 xff0c 之前说过由于和LeetCode结了梁子 xff0c 所以周末的LeetCode专题取消了 xff0c 给大家写点其他专题的算法问题 目前选择的是国外著名的编程竞赛平台 codeforces 它在竞赛圈名气比较大 xff0
  • 四步利用docker搭建samba服务器

    我的系统是centos7 打算共享 home目录供windows用故快速利用docker搭建samba服务 本教程利用dperson samba镜像作为容器 xff1a 步骤 xff1a 第一步 xff1a yum span class h
  • 2-6 链表逆序及其C++实现

    更多系列博文请点击 xff1a 0 数据结构与算法链接目录 2 6 链表逆序 我只介绍两种常用方法吧 xff0c 非递归方法 和 递归 方法 我觉得够用就行 1 非递归方法 xff1a 将第二个元素后面的元素依次插入到头结点后面 xff0c
  • SQL Server 通过SQL生成Java代码 (为了省事写的生成实体类中属性)

    SELECT 字段名 61 a name 类型 61 b name 字段说明 61 isnull g value 39 39 CONVERT VARCHAR 100 a name AS colname CONVERT VARCHAR 100
  • C++编译器VS2019和MinGW的问题

    C 43 43 编译器VS2019和MinGW的问题 xff1a 最近在啃C 43 43 Primer这本书 xff0c 在学习到第14章重载运算符时 xff0c 准备为自定义的类String重载一个输入运算符 gt gt xff0c 代码
  • 物理机debian环境搭建

    装系统全程ob腾哥配置 xff0c 记录一下 1 首先需要一个刻录u盘 xff0c 格式化 2 下载u盘刻录软件 xff0c refus 3 到镜像站或官网下载debian iso 4 插入u盘 xff0c 进行刻录 5 到电脑插入u盘 x
  • PYTHON简单代码去除TXT文档重复行内容去重复

    PYTHON简单代码去除TXT文档重复行内容去重复 fi span class token operator 61 span span class token builtin open span span class token punct
  • c语言嵌套结构体内存对齐

    结构体内存对齐规则 xff1a 1 第一个成员在结构体变量偏移量为0 的地址处 2 其他成员变量要对齐到某个数字 xff08 对齐数 xff09 的整数倍的地址处 对齐数 61 编译器默认的一个对齐数与该成员大小中的较小值 vs中默认值是8
  • ubuntu简单设置代理的办法

    直接输入命令 span class token builtin class name export span span class token assign left variable http proxy span span class
  • DockerFile集成mysql,nginx,zookeeper,redis,tomcat为一个镜像

    将mysql nginx zookeeper redis tomcat集成为一个docker镜像 实现运行一个镜像 xff0c 便全部自动化安装启动mysql nginx zookeeper redis tomcat 1 在CentOS7上
  • Squid反向手动编译--Debian10.x

    Squid反向手动编译 Debian10 x 实验环境 xff1a server01 xff1a 192 168 10 10 CA证书 DNS服务器 server02 xff1a 192 168 10 20 squid服务器 需要做ssl
  • Ubuntu18.04 intel wifi6 ax201无线网卡驱动安装

    Ubuntu18 04 intel wifi6 ax201无线网卡驱动安装 前言 新买的笔记本电脑装Ubuntu系统 xff0c 发现没有无线网卡 xff0c 经查阅资料发现由于网卡刚没多久 xff0c Ubuntu没有集成网卡驱动 xff
  • 目标检测: 数据集转换txt转为xml格式

    目录 1 txt数据集格式 2 xml数据集格式 3 转换代码 4 根据xml标签分割出图像中的目标物体 5 效果展示 1 txt数据集格式 第1元素代表类别 xff0c 第2 xff0c 3表示目标框的中心位置 xff0c 第4 xff0
  • ubuntu无线优先上网

    https blog csdn net wbcuc article details 116073622 如果电脑同时连着有线网络跟无线 Wifi 网络 xff0c 系统会默认 优先 使用有线网络 xff0c 即使用有线网络的网关作为默认路由

随机推荐

  • 扩展欧几里得

    转自 xff1a http www cnblogs com frog112111 archive 2012 08 19 2646012 html 欧几里德算法 欧几里德算法又称辗转相除法 xff0c 用于计算两个整数a b的最大公约数 基本
  • 扫描局域网在线IP

    wlan0为终端运行ifconfig后的网络名称 sudo apt get install arp scan sudo arp scan I wlan0 localnet
  • 英伟达TX2开箱入门 ubuntu16.04用sdkmanager刷机(JetPack4.2版本)

    英伟达TX2开箱入门 ubuntu16 04用sdkmanager刷机 xff08 JetPack4 2版本 xff09 准备工作系统版本参考博客 装机步骤一 硬件连接 43 开机二 刷机教程 xff08 附官网教程 xff09 准备工作
  • 可以ping通但ssh: connect to host 192.168.0.27 port 22: Connection refused

    前言 SSH分客户端openssh client和服务器openssh server 如果你只是想登陆别的机器 xff0c 只需要安装openssh client xff08 ubuntu有默认安装 xff0c 如果没有则sudo apt
  • ROS发布静态tf变换

    方法一 xff1a include lt ros ros h gt include lt tf transform broadcaster h gt int main int argc char argv ros init argc arg
  • ROS常见问题及解决方法

    1 undefined reference to 96 tf TransformBroadcaster TransformBroadcaster 问题描述 xff1a CMakeFiles imu data dir src imu data
  • git的配置管理 配置用户名、邮箱

    git是现在常用的版本管理工具 xff0c 在使用git操作代码时 xff0c 可以保留操作痕迹 xff0c 查看是谁操作的 xff0c 这时候就需要提前设置git的操作用户信息 git配置文件 git的配置文件有三份 xff0c 按照优先
  • IOS学习之—— xib的用法--自定义View

    05 xib的用法 自定义View 自定义View xib的用法 项目名称 xff1a 设置文件头 滚动广告 五张图片 步骤 xff08 1 xff09 创建 新文件 userInterface 中的 empty 文件 取名CZHeader
  • CCF画图

    include lt stdio h gt struct rectStruct int a b int m n struct rectStruct rects 100 int rectS 61 0 int n int inYLine int
  • win10家庭版组策略添加及关闭自动更新

    Win10家庭版添加组策略和win10关闭系统自动更新的方法 看着别人能玩组策略 xff0c 可是自己输入pgedit msc却弹出无法找到的弹窗 xff0c 人生痛苦的事莫过如此啊 xff01 说到这里我又想吐槽Microsoft xff
  • 废旧笔记本改造记(1)---安装Linux系统和Docker

    以前贪便宜 xff0c 买了腾讯云1核2G的云服务器 xff0c 现在发现这个真不够 xff0c 刚好今年买了一台新的笔记本 xff0c 今天就打算把我那台历尽7年风雨的戴尔笔记本电脑改造成为Linux系统 xff0c 一方面是为了之后练习
  • git常用命令

    git基本概念 工作区 xff1a 仓库的目录 工作区是独立于各个分支的 暂存区 xff1a 数据暂时存放的区域 xff0c 类似于工作区写入版本库前的缓存区 暂存区是独立于各个分支的 版本库 xff1a 存放所有已经提交到本地仓库的代码版
  • Ubuntu 18.04/20.04 xrdp远程桌面连接

    搞了一晚上vnc 各种vnc xff0c 连上之后就是白屏 xff0c 最后换xrdp了 xff0c 参考了下面这篇文章 xff0c https blog csdn net qq 25556149 article details 82216
  • 如何查看firefox的cookie IE的cookie

    一查看firefox的cookie 首先 firexfox的cookie的文件存放不像ie那么如容易找到 xff0c 而且里面的内容也不一般普通编辑器能查看的 文件存放位置 xff0c 一般WIN XP系统的FF cookie存放于 xff
  • ffmpeg 带alpha透明层的视频编码

    png编码 可以封装为 mp4 mov等 ffmpeg f image2 r 25 i input d png vf fps span class token operator 61 span 25 vcodec png output mo
  • Golang实现选择排序

    64 Golang Golang实现选择排序 选择排序 xff08 Selection sort xff09 是一种简单直观的排序算法 它的工作原理如下 首先在未排序序列中找到最小 xff08 大 xff09 元素 xff0c 存放到排序序
  • Docker方式启动tomcat,访问首页出现404错误

    1 使用命令 xff1a docker pull tomcat 从阿里云上下载一个latest版本的tomcat 版本是从阿里云上拉下的 8 5 50 xff0c 运行镜像 xff0c 进行相关网络端口映射 xff0c 如下命令 xff1a
  • 批量创建txt文件

    1 创建txt文档如 xff1a 123 txt 2 打开文档 123 txt 3 复制如下内容保存至123 txt 64 echo off for L x in 1 1 10 do 64 echo x gt x txt 4 重命名文件12
  • anime4k 在真机租用上的应用尝试

    技术调研 anime4k是为动画图片设计的超分辨率提升算法 xff0c 并且在GPU上能达到个位数毫秒级延迟 https github com bloc97 Anime4K 1 1 高清图片 61 低清图片 43 残差 2 残差的边缘越细
  • python调用pytesseract识别某网站的验证码(实战项目)

    一 首先安装 tesseract ocr setup 4 00 00dev exe 下载地址 链接 xff1a https pan baidu com s 1PFIrfNeUjmrXlUABS8SquA 提取码 xff1a dctm 1 直