Python+Selenium爬虫之动态验证码的处理

2023-11-19

可拖动验证码分为空缺区域为单独的图片和空缺区域与背景图片为一个共同图片，所以实现方式有2种。

1.拖动下方滑块完成拼图（单独图片）

实现原理： 查看空缺区域图片到左侧端点的距离d1，再次查看裁剪图片到左侧端点的距离d2,d1-d2的距离就是滑块拖动的距离。
实现方式：

1.获取图片验证码滑动区域的距离

def deal_verificationcode():
	s = Service("/usr/bin/chromedriver")
	options = webdriver.ChromeOptions()
	options.add_experimental_option('excludeSwitches', ['enable-automation'])
	options.add_argument('--headless')
	options.add_argument('--no-sandbox')
	global driver
	driver = webdriver.Chrome(service=s, options=options)
	driver.get(url)
	driver.find_element(by=By.TAG_NAME, value='textarea').send_keys(key)
	button = driver.find_element(by=By.XPATH, value='//*[@id="goodstrackText"]/div[1]/div[2]/div[1]/div/button')
	driver.execute_script("$(arguments[0]).click()", button)

	sleep(1)
	# 裁剪图片距离左侧位置
	left_distance1 = driver.find_element(By.ID, value='grap_cut').value_of_css_property('left')
	# 空缺区域距离左侧位置
	left_distance2 = driver.find_element(By.ID, value='grap_vacant').value_of_css_property('left')
	distance = float(left_distance2.split("px")[0]) - float(left_distance1.split("px")[0]) - float(10)

	run_slidingblock(distance)

2.距离获取后，拖动验证码

def run_slidingblock(distance):
	tracks = get_tracks(distance)
	num = 0
	for i in tracks:
		num += i
	if distance - 2 < num and num < distance + 2:
		track = tracks
	else:
		a = distance - num
		tracks.append(a)
		track = tracks
	drag = driver.find_element(by=By.ID, value='swipper-btn')
	ActionChains(driver).click_and_hold(drag).perform()
	for x in track:
		ActionChains(driver).move_by_offset(xoffset=x, yoffset=0).perform()
	ActionChains(driver).release().perform()

def get_tracks(distance, rate=0.6, t=0.2, v=0):
	"""
	将distance分割成小段的距离
	:param distance: 总距离
	:param rate: 加速减速的临界比例
	:param a1: 加速度
	:param a2: 减速度
	:param t: 单位时间
	:param t: 初始速度
	:return: 小段的距离集合
	"""
	tracks = []
	# 加速减速的临界值
	mid = rate * distance
	# 当前位移
	s = 0
	# 循环
	while s < distance:
		# 初始速度
		v0 = v
		if s < mid:
			a = 40
		else:
			a = -3
		# 计算当前t时间段走的距离
		s0 = v0 * t + 0.5 * a * t * t
		# 计算当前速度
		v = v0 + a * t
		# 四舍五入距离，因为像素没有小数
		tracks.append(round(s0))
		# 计算当前距离
		s += s0
	return tracks

2.拖动下方滑块完成拼图（共同图片）

实现原理： 计算背景图片中空缺区域到左侧端点的距离d1，再次查看裁剪图片到左侧端点的距离d2,d1-d2的距离就是滑块拖动的距离。
实现方式：

1.计算背景图片中空缺区域到左侧端点的距离

def deal_verificationcode():
	s = Service("/usr/bin/chromedriver")
	options = webdriver.ChromeOptions()
	options.add_experimental_option('excludeSwitches', ['enable-automation'])
	options.add_argument('--headless')
	options.add_argument('--no-sandbox')
	global driver
	driver = webdriver.Chrome(service=s, options=options)
	driver.get(url)
	sleep(1)
	driver.switch_to.frame('tcaptcha_iframe')
	get_img('cdn1')
	get_img('cdn2')
	x = FindPic('cdn1.jpg', 'cdn2.jpg')

	left_distance1 = driver.find_element(By.ID, value='slideBlock').value_of_css_property('left')
	log.info('验证码距离左侧距离为：' + str(left_distance1))
    distance = x - float(left_distance1.split("px")[0])
    
    run_slidingblock(distance)

2.距离获取后，拖动验证码

def run_slidingblock(distance):
	tracks = get_tracks(distance)
	num = 0
	for i in tracks:
		num += i
	if distance - 2 < num and num < distance + 2:
		track = tracks
	else:
		a = distance - num
		tracks.append(a)
		track = tracks
	drag = driver.find_element(by=By.ID, value='swipper-btn')
	ActionChains(driver).click_and_hold(drag).perform()
	for x in track:
		ActionChains(driver).move_by_offset(xoffset=x, yoffset=0).perform()
	ActionChains(driver).release().perform()

def get_tracks(distance, rate=0.6, t=0.2, v=0):
	"""
	将distance分割成小段的距离
	:param distance: 总距离
	:param rate: 加速减速的临界比例
	:param a1: 加速度
	:param a2: 减速度
	:param t: 单位时间
	:param t: 初始速度
	:return: 小段的距离集合
	"""
	tracks = []
	# 加速减速的临界值
	mid = rate * distance
	# 当前位移
	s = 0
	# 循环
	while s < distance:
		# 初始速度
		v0 = v
		if s < mid:
			a = 40
		else:
			a = -3
		# 计算当前t时间段走的距离
		s0 = v0 * t + 0.5 * a * t * t
		# 计算当前速度
		v = v0 + a * t
		# 四舍五入距离，因为像素没有小数
		tracks.append(round(s0))
		# 计算当前距离
		s += s0
	return tracks

所谓的人生开挂，不过是厚积薄发！欢迎评论和转载！

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

爬虫

python

selenium

Python+Selenium爬虫之动态验证码的处理的相关文章

如何将人物传奇带到前台？

我有一系列子图其中每个子图都有一个图例我想在每个子图之外与相邻子图重叠问题在于图例位于其自己的图的顶部但位于相邻图的下方 Legend 不将 zorder 作为参数所以我不知道如何解决这个问题这是我使用过的代码 import
如何在 Python 2.4 CSV 阅读器中禁用引用？

我正在编写一个 Python 实用程序需要解析一个我无法控制的大型且定期更新的 CSV 文件该实用程序必须在仅提供 Python 2 4 的服务器上运行 CSV 文件根本不引用字段值但Python 2 4版本的csv库 http ww
为什么我会得到“ufunc 'multiply' did not contains a loop with Signature Matching types dtype('S32') dtype('S32') dtype('S32')”，其值来自 raw_

我正在尝试创建一个非常简单的程序它将绘制一个抛物线其中v是速度 a是加速度和x是时间用户将输入值v and a then v and a and x将决定y 我试图用这个来做到这一点 x np linspace 0 9 10 a ra
使用 NumPy 的 Mittag-Leffler 函数的不稳定性

在尝试重现时Wolfram MathWorld 上的情节 http mathworld wolfram com Mittag LefflerFunction html 并试图帮助这个问题 https stackoverflow com qu
self.__dict__.update(**kwargs) 的风格是好是坏？

在 Python 中假设我有一些类 Circle 它继承自 Shape Shape 需要 x 和 y 坐标此外 Circle 需要半径我希望能够通过执行类似的操作来初始化 Circle c Circle x 1 y 5 r 3 Cir
为什么最简单的 requests_mock 示例在 pytest 中失败？

我有一个特殊的问题requests mock 我想用它pytest测试我的 API 包装器库我尝试过使用requests mock 文档中的第一个示例 http requests mock readthedocs io en latest
自定义 Keras 损失函数中的 conv2d

我正在尝试基于两个图像的拉普拉斯算子在带有 TF 后端的 Keras 中实现自定义损失函数 def blur loss y true y pred weighting of blur loss alpha 1 mae losses mean
如何使直方图列的宽度都相同

我在操作直方图时遇到了一些麻烦我有一个包含两列的 df 我将它们绘制为堆叠直方图我将它们放入特定的垃圾箱中请参阅下面的代码但我想在最后制作一个大垃圾箱 4000 10000 但是默认情况下大垃圾箱的列宽很大有没有办法让这个大垃
自适应支付 API 错误 580001

我正在 python 中向 paypal 自适应支付 API 发出 PAY 请求并收到通用错误 id 580001 没有其他信息 headers API credentials for the API caller business ac
进行异步调用时，“yield”在龙卷风中如何工作？

最近我在学习龙卷风简介我遇到了以下代码 class IndexHandler tornado web RequestHandler tornado web asynchronous tornado gen engine def get s
使用 matplotlib 设置或固定二元分布值

I ve animated a bivariate gaussian distribution using matplotlib 我已经计算过这个distribution通过调整COV matrix来考虑特定的变量我可以提供有关此过程的更
保存游戏最高分？

我使用 pygame 在 python 中制作了一个非常简单的游戏分数取决于玩家达到的级别我将级别作为变量称为score 我想在游戏开始或结束时显示顶级我会更乐意显示多个分数但我见过的所有其他线程都太复杂我无法理解所以请保持简单
Tkinter 如何根据此组合框自动更新第二个组合框

我在 Tkinter Python 中遇到了组合框更新的问题我有两个组合框组合框A with values A B C and 组合框B 我想要的是当值A在组合框中选择A然后在组合框中B显示值 1 2 3 当值B在组合框中选择A然后在
尝试将 cuda 与 pytorch 一起使用时出现运行时错误 999

我为我的 Geforce 2080 ti 安装了 Cuda 10 1 和最新的 Nvidia 驱动程序我尝试运行一个基本脚本来测试 pytorch 是否正常工作但出现以下错误 RuntimeError cuda runtime erro
如何在 matplotlib 中第一个 x 轴的底部添加第二个 x 轴？

我指的是已经提出的问题here https stackoverflow com questions 10514315 how to add a second x axis in matplotlib 在此示例中用户通过将第二个轴添加到与标
对远程 WebDriver 服务器的 URL 的 HTTP 请求...在 60 秒后超时

我将 Selenium 与 Internet Explorer Web 驱动程序 IEDriverServer 一起使用由于某种原因我找不到它的代码库来打开这个错误因此如果有人也能指出我的方向我将不胜感激这个问题似乎广泛存在于所
混合两个列表的Pythonic方法[重复]

这个问题在这里已经有答案了我有两个长度为 n 和 n 1 的列表 a 1 a 2 a n b 1 b 2 b n 1 我想要一个函数作为结果给出一个列表其中包含两个中的替代元素即 b 1 a 1 b n a n b n 1 以下方法有
Selenium - 模式对话框存在 - 如何接受信息？

我有以下问题在页面上提交一些日期后我有一个如图所示的模式对话框我想单击 ENTER 来浏览该模式但它不起作用我有以下代码 driver FindElement By CssSelector input submit Click A
将 .parquet 编码为 io.Bytes

目标将 Parquet 文件上传到 MinIO 这需要将文件转换为字节我已经能够做到这一点了 csv json and txt bytes data to csv encode utf 8 bytes json dumps self d
IOError：在 Linux 上的 ReportLab 中使用 matplotlib PNG 时“解码器 zip 不可用”，适用于 Windows

我正在使用 ReportLab 打印 matplotlib 生成的图表我可以在我的 Windows 开发机器上毫无问题地执行此操作然而当我部署到 Ubuntu 服务器时渲染失败并出现所述错误我假设我缺少一个 Python 模块但

随机推荐

云函数部署之网易云

云函数部署之网易云云函数什么是云函数就是可以让你没有服务器本地电脑不用下载Python也可以使用这个项目而且还是白嫖既解决了很多人部署的麻烦也给了那些被劝退的朋友回来的勇气十分钟便可以全部弄完 1 进入云函数这里拿腾讯云的
caffe im2col 详解

caffe im2col详解本文讲解的是caffe中卷积过程众所周知caffe中卷积采用的是im2col和sgemm的方式网上已经有很多的im2col的讲解原本不打算写这篇文章在此不得不吐槽下网上有不少的讲解caffe im2c
redis缓存雪崩、穿透、击穿

这篇文章我们来了解一下一些redis的高并发问题以及他的解决方法上图是一个简单的数据查询流程前台请求后台先从缓存中取数据取到直接返回结果取不到时从数据库中取数据库取到更新缓存并返回结果数据库也没取到那直接返回空结果一 r
CentOs8 安装 Mysql 8 步骤及问题解决

1 Mysql数据库采用的版本是Mysql8 在Mysql官方网站 MySQL 下载Mysql安装包 2 安装新版mysql之前我们需要将系统自带的mariadb lib卸载执行命令 rpm qa grep mariadb 若检查出系统
sql数据库查询

sql数据库查询要点查询在GROUP BY 的后面使用 HAVING指定筛选条件 select from 表 group by 分组条件 having 筛选条件内连接INNER JOIN 只返回符合条件的值 SELECT FROM t
IntelliJ IDEA中如何使用JUnit4

背景最近参与了一个Anroid医疗项目其中项目底层有很多基础类及通讯类而且很多涉及复杂的字节操作还有多线程同步及状态机处理这样的项目做一下TDD还是必要的尽量项目前期把风险降低一些现在的问题是本人使用的是IntelliJ开发的A
【JavaScript 逆向】猿人学 web 第十八题：jsvmp，洞察先机

案例目标网址第十八题 jsvmp 洞察先机猿人学本题目标抓取 5 页数字计算加和并提交结果常规 JavaScript 逆向思路一般情况下 JavaScript 逆向分为三步寻找入口逆向在大部分情况下就是找一些加密参数到底
2019 icpc西安邀请赛点分治

https nanti jisuanke com t 39277 求 sum 异或和为0的路径被其他路径包含的次数如果只是求异或和为0的路径数量其实是裸点分治但是加上要求之后就会复杂一些进行分类讨论再特殊处理根节点就行由于信
Unraid使用记录：使用Docker与虚拟机

文章目录前言使用Docker 使用示例相关说明使用虚拟机使用示例相关说明硬件直通后记前言 Unraid本身功能挺少的很多功能都是要通过插件 Docker和虚拟机来实现的 Docker可以简单的实现各种丰富的功能而虚拟机
群晖DS Video(Station)自动同步视频简介和海报(最新官方解决方案)

目录一前言二前提三实现 1 注册The Movie Database账号 2 创建API 3 修改群辉Hosts A 在群辉中开启SSH的访问 B 然后通过ssh命令登录到群辉后台 C 通过sudo i指令切换到root用户指令
python的循环控制结构_Python的控制结构之For、While、If循环问题

传统Python语言的主要控制结构是for循环然而需要注意的是for循环在Pandas中不常用因此Python中for循环的有效执行并不适用于Pandas模式一些常见控制结构如下 for循环 while循环 if else语句 tr
【建议收藏！】APP UI自动化测试，思路全总结在这里了。

首先想要说明一下 APP自动化测试可能很多公司不用但也是大部分自动化测试工程师高级测试工程师岗位招聘信息上要求的所以为了更好的待遇我们还是需要花时间去掌握的毕竟谁也不会跟钱过不去接下来一起总结一下APP UI自动化测试的思路吧
再论人与人的三大关系：生存关系、性关系和经济关系

黄仁宇在关系一文中认为人类的各种关系之中以生存的关系性关系和经济关系最为重要理想上的工作协作和团队精神已经不存在俺做过的几个规模在50人以下的这说明两个问题 1 小公司的目的不是发展而是不死然后赚钱也就是这是一笔买卖而
exe4j打包exe_JDK11及以后版本在Win下的打包发布方法

概述我在准备使用高版本jdk后遇到的最麻烦的问题就是打包发布了主要原因还是jdk的模块化带来的在经历了长时间折腾后终于成功完成了这个当然只是针对window下的想要使用高版本jdk打包发布Windows应用需要准备 exe
js中的对象函数原型

关于 Function Object 和 proto prototype 1 每一个对象实例都有一个 proto 属性这个属性就是指向对象构造函数的原型 let b new Function console log b proto Fu
【Matlab图片剪裁】

标题Matlab剪裁图片提取感兴趣部分问题描述当需要从一幅图片中提取一些感兴趣的内容时比如一些细小的文字图案等如果从整个图片中直接提取必然会大大增加计算量导致处理时间很长而且多数计算都是无效计算进而非常消耗资源解决办法
impala 错误

问题一 impala state store unrecognized service 原因当前节点未成功安装impala server impala state store impala catalog 解决方案 yum install
Qt生成log日志文件

摘要本文在Qt程序中实现了日志功能读者可以在此基础上进一步创作和拓展介绍系统日志一般指存放系统重要运行信息的log txt文件主要作用有两个 1 记录系统重要的运行信息 2 当系统突然崩溃时可以根据日志来跟踪和定位程序错误 Qt
常见CAD/CAM控件大全

前言 CAD CAM 计算机辅助设计与制造技术是随着计算机和数字化信息技术发展而形成的新技术是20世纪最杰出的工程成就之一也是数字化信息化制造技术的基础其发展和应用对制造业产生了巨大的影响和推动作用经过几十年的发展和应用不仅C
Python+Selenium爬虫之动态验证码的处理

目录 1 拖动下方滑块完成拼图单独图片 2 拖动下方滑块完成拼图共同图片可拖动验证码分为空缺区域为单独的图片和空缺区域与背景图片为一个共同图片所以实现方式有2种 1 拖动下方滑块完成拼图单独图片拖动验证码实现原理查看空缺区域

Python+Selenium爬虫之动态验证码的处理

1.拖动下方滑块完成拼图（单独图片）

2.拖动下方滑块完成拼图（共同图片）

Python+Selenium爬虫之动态验证码的处理 的相关文章

随机推荐

热门标签

Python+Selenium爬虫之动态验证码的处理的相关文章