Python爬虫 requests使用post请求登录需要验证码的网站

2023-05-16

具体代码为：

import requests
from bs4 import BeautifulSoup

s = requests.Session()

get_url = 'http://so.gushiwen.org/user/login.aspx?from=http://so.gushiwen.org/user/collect.aspx'
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.108 Safari/537.36',
}

r = s.get(url=get_url, headers=headers)

soup = BeautifulSoup(r.text, 'lxml')
a = soup.select('#__VIEWSTATE')[0].attrs.get('value')
b = soup.select('#__VIEWSTATEGENERATOR')[0].attrs.get('value')

# 获取验证码图片的url
image_url = 'http://so.gushiwen.org' + soup.select('#imgCode')[0].attrs.get('src')
# 将图片下载到本地
# print(image_url)
# import urllib.request
r = s.get(image_url)
# urllib.request.urlretrieve(image_url, './yanzhengma.jpg')
with open('./yanzhengma.jpg', 'wb') as fp:
    fp.write(r.content)

# 让用户输入验证码
code = input('请输入验证码:')

post_url = 'http://so.gushiwen.org/user/login.aspx?from=http%3a%2f%2fso.gushiwen.org%2fuser%2fcollect.aspx'
data = {
    '__VIEWSTATE': a,
    '__VIEWSTATEGENERATOR': b, 
    'from': 'http://so.gushiwen.org/user/collect.aspx',
    'email': '17312345678', # 账号
    'pwd': '123456',  # 密码
    'code': code,  # 验证码
    'denglu': '登录',
}

r = s.post(post_url, headers=headers, data=data)

print(r.text)

这里的图片验证码需要注意的是，要携带着一些信息去下载，否则每次都会改变验证码，本例中就是携带着cookies去下载的图片，然后在本地查看后输入验证码进行模拟登陆

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

requests

POST

请求登录需要验证码的网站

Python爬虫 requests使用post请求登录需要验证码的网站的相关文章

在PyGI中获取窗口句柄

在我的程序中我使用 PyGObject PyGI 和 GStreamer 在 GUI 中显示视频该视频显示在Gtk DrawingArea因此我需要获取它的窗口句柄realize 信号处理程序在 Linux 上我使用以下方法获取该句
Tkinter：消息小部件中锚点选项的正确值是多少？

我一直在学习 tkinterTkinter 中的消息小部件 https python course eu tkinter message widget in tkinter php at Python 课程和教程 https python
ValueError：请使用“Layer”实例初始化“TimeDistributed”层

我正在尝试构建一个可以在音频和视频样本上进行训练的模型但出现此错误ValueError Please initialize TimeDistributed layer with a Layer instance You passed Te
将 yerr/xerr 绘制为阴影区域而不是误差线

在 matplotlib 中如何将误差绘制为阴影区域而不是误差条例如而不是忽略示例图中各点之间的平滑插值这需要进行一些手动插值或者只是获得更高分辨率的数据您可以使用pyplot fill between https matpl
McNemar 在 Python 中的测试以及分类机器学习模型的比较 [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案有没有用 Python 实现的好的 McNemar 测试我在 Scipy stats 或 Scikit
如何为未捕获的异常处理程序编写单元测试

我有一个函数可以捕获uncaught例外情况如下有没有办法编写一个单元测试来执行uncaught exception handler 功能正常但测试正常退出 import logging def config logger logge
如何在python中附加两个字节？

说你有b x04 and b x00 你如何将它们组合起来b x0400 使用Python 3 gt gt gt a b x04 gt gt gt b b x00 gt gt gt a b b x04 x00
数据框 - 平均列

我在 pandas 中有以下数据框 Column 1 Column 2 Column3 Column 4 2 2 2 4 1 2 2 3 我正在创建一个数据框其中包含第 1 列和第 2 列第 3 列和第 4 列等的平均值 ColumnA
为什么第二个 request.session cookies 返回空？

我想使用 requests Session post 登录网站但是当我已经登录主页然后进入帐户页面时看来cookies还没有保存因为cookies是空的而且我无法进入正确的帐户页面 import requests from bs4
是否有一个包可以维护所有带有符号的货币列表？

是否有一个 python 包提供所有或相当完整货币的列表与符号如美元的有优秀的pycountry 贪财的 https github com limist py moneyed and ccy http code google com
如何将 sql 数据输出到 QCalendarWidget

我希望能够在日历小部件上突出显示 SQL 数据库中的一天就像启动程序时突出显示当前日期一样在我的示例中它是红色突出显示我想要发生的是当用户按下突出显示的日期时数据库中日期旁边的文本将显示在日历下方的标签上这是我使用 QT De
python 中的 h2o 框架子集

如何在 python 中对 h2o 框架进行子集化如果 x 是一个 df 并且 Origin 是一个变量那么在 pandas 中我们通常可以通过以下方式进行子集化 x x Origin AAF 但使用 h2o 框架会出现以下错误 H2O
numpy：如何连接数组？（获得多个范围的并集）

我使用Pythonnumpy 我有一个 numpy 索引数组a gt gt gt a array 5 7 12 18 20 29 gt gt gt type a
无法在 PyCharm 版本 9.3.3 中安装 NumPy。 Python版本3.8.2

在 PyCharm 中安装 NumPy 时出错尝试安装 Microsoft Visual C 14 0 还是行不通 NumPy 正在通过命令安装pip3 install numpy在 cmd 终端中但是当尝试将其安装在 PyCharm
Python守护进程：保持日志记录

我有一个将一些数据记录到磁盘的脚本 logging basicConfig filename davis debug log level logging DEBUG logging basicConfig filename davis er
寻找完美的正方形

我有这个Python代码 def sqrt x ans 0 if x gt 0 while ans ans lt x ans ans 1 if ans ans x print x is not a perfect square return
PyQt5：如何使QThread返回数据到主线程

I am a PyQt 5 4 1 1初学者我的Python是3 4 3 这是我尝试遵循的many https mayaposch wordpress com 2011 11 01 how to really truly use qthr
高效创建抗锯齿圆形蒙版

我正在尝试创建抗锯齿加权而不是布尔圆形掩模以制作用于卷积的圆形内核 radius 3 no of pixels to be 1 on either side of the center pixel shall be decimal a
在matlab中，如何读取python pickle文件？

在 python 中我生成了一个 p 数据文件 pickle dump allData open myallData p wb 现在我想在Matlab中读取myallData p 我的Matlab安装在Windows 8下其中没有Pyt
django jet 中的自定义徽标

我目前正在尝试对 django 管理面板的皮肤进行一些定制以使其更符合我们的品牌目前我们使用 django jet 来美化管理面板 django jet 可以自定义 css html 吗所有评论都说我应该更改一些 html 文件但我

随机推荐

openBLT-系统结构及框架

openBLT 系统结构及框架前言1 框架1 1设备层1 2中间件1 2 1 COM1 2 2 BACKDOOR1 2 3 FILE 1 3应用层前言 openBLT 是开源的小型嵌入式系统bootloader xff0c 目前支持ST
磁力计的基本工作原理

http www dzsc com data html 2010 11 29 87454 html ST集成传感器方案实现电子罗盘功能
Ubuntu（ROS+雷达）修改udev/rules/更改ttyUSB 使端口绑定

前提 xff1a 1 Linux xff08 Ubuntu xff09 系统 xff0c 本版本为Ubuntu16 04 2 确定USB口可以使用 xff08 拔插U盘看看有没有弹出文件夹窗口 xff09 参考博客 xff1a https
CAN总线标准帧/扩展帧滤波器设置

在CAN协议里 xff0c 报文的标识符不代表节点的地址 xff0c 而是跟报文的内容相关的因此 xff0c 发送者以广播的形式把报文发送给所有的接收者节点在接收报文时根据标识符 CAN ID 的值决定软件是否需要该报文 xff1b
http之半包粘包

短连接 xff1a 连接 gt 传输数据 gt 关闭连接 HTTP是无状态的 xff0c 浏览器和服务器每进行一次HTTP操作 xff0c 就建立一次连接 xff0c 但任务结束就中断连接也可以这样说 xff1a 短连接是指SOCKET连
Ardupilot飞控编译环境搭建

构建环境 Ardupilot具有完整的开发库 xff0c 其编译代码可以直接下载 xff0c 在Windows上 xff0c 可以利用Cygwin编译器来进行下载并编译 xff0c 对此怒飞垂云的教程中有详细的下载方法 xff1a 飞控固件
转：跳点搜索算法JPS及其优化（万字长文）

欢迎关注作者git博客 1 引言寻路算法用途众多 xff0c 例如在游戏和地图中 A 算法已经众所周知 xff0c 对于其优化也是层出不穷 xff0c 然而性能并没有取得突破性进展本文介绍JPS的效率多线程内存路径优化算法为了测
socket编程——sockaddr_in结构体操作

socket编程 sockaddr in结构体操作 sockaddr结构体 sockaddr的缺陷 xff1a struct sockaddr 是一个通用地址结构 xff0c 这是为了统一地址结构的表示方法 xff0c 统一接口函数 xff
Resource not found: rgbd_launch 解决方案

Resource not found rgbd launch 解决方案操作环境问题描述解决方案操作环境虚拟机 xff1a VMware 系统版本 xff1a Ubuntu 18 04 ROS版本 xff1a Melodic 摄像头 x
ModuleNotFoundError: No module named ‘cv2‘

ModuleNotFoundError No module named 39 cv2 39 问题描述模块安装模块安装问题解决问题描述系统环境 xff1a ubuntu 18 04 操作内容 xff1a 配置DenseFusion运行环境
系统辨识理论及MATLAB仿真——学习笔记（1）

系统辨识理论及MATLAB仿真学习笔记 xff08 1 xff09 前言目录第1章绪论1 1 建立数学模型的基本方法1 2 系统辨识的定义1 3 系统辨识的研究目的1 4 数学模型的分类1 5 几种常见的数学模型的数学表示1 6 系统辨识
甚小孔径终端（VSAT）卫星网络拓扑结构及接入方式

甚小孔径终端 xff08 VSAT xff09 卫星网络拓扑结构及接入方式文章目录甚小孔径终端 xff08 VSAT xff09 卫星网络拓扑结构及接入方式前言一 VSAT网络类型1 星型拓扑结构网络2 网状拓扑结构网络二 VSAT网
Ubuntu18.04 界面美化（mac风格）

Ubuntu mac 主题美化测试系统 xff1a Ubuntu 18 04 测试时间 xff1a 2022年2月26日先前准备安装主题的工具 xff1a GNOME Tweaks sudo apt get update sudo a
搭建github-ssh连接时，Could not resolve hostname github的解决方案(无法ping通github)

解决无法 ping 通 github com 的问题测试平台 xff1a Windows 10 测试时间 xff1a 2022年3月4日问题描述 xff1a 笔者在进行搭建本地 git 时 xff0c 需要通过 ssh 建立与 gith
Ubuntu18.04 CoppeliaSim Edu 安装教程 (2022年11月)

Ubuntu18 04 CoppeliaSim Edu 安装教程 1 软件包下载2 启动 CoppeliaSim3 终端快捷命令测试平台 xff1a Ubuntu 18 04 测试时间 xff1a 2022年11月10日本文以 Ubun
Ubuntu18.04 安装完成后的开发配置

Ubuntu18 04 安装完成后的开发配置 1 终端工具2 屏幕录制工具3 屏幕截图工具4 向日葵远程操作与开机自启动设置5 MarkDown笔记工具6 ROS 机器人操作系统安装7 编程开发工具8 机器人仿真环境Gazebo 安装Web
Ubuntu 20.04 安装 Latex 并使用 vscode 作为文本编辑器

Ubuntu 20 04 安装 Latex 并使用 vscode 作为文本编辑器 1 Texlive 下载与安装1 1 镜像文件下载1 2 安装步骤1 3 查看是否安装成功1 4 相关依赖安装 2 安装 windows 字体3 vscode
Windows下Keil 4工程默认Keil 5打开的解决办法

案例背景 xff1a 在安装Keil 4进行51系列单片机学习之后安装Keil 5进阶STM32系列单片机的学习刚安装完后 xff0c 之前编辑的Keil 4工程还是默认Keil 4打开 xff0c Keil 5的工程默认Keil5打开
Python3 利用requests 库进行post携带账号密码请求数据

span class hljs keyword import span urllib json requests url 61 span class hljs string 39 http 127 0 0 1 8000 account lo
Python爬虫 requests使用post请求登录需要验证码的网站

具体代码为 xff1a import requests span class hljs built in from span bs4 import BeautifulSoup s 61 requests Session get url 61

Python爬虫 requests使用post请求登录需要验证码的网站

Python爬虫 requests使用post请求登录需要验证码的网站 的相关文章

随机推荐

热门标签

Python爬虫 requests使用post请求登录需要验证码的网站的相关文章