Python dryscrape 抓取带有 cookies 的页面

2024-01-09

我想从网站获取一些数据，这需要登录。
我通过以下方式登录requests

url = "http://example.com"
response = requests.get(url, {"email":"[email protected] /cdn-cgi/l/email-protection", "password":"12345"})
cookies = response.cookies

然后我想从一些 JS 页面获取数据。通过requests这是不可能的，所以我必须使用干刮为了这。

import dryscrape
url = "http://example.com/js-page"
sess = dryscrape.Session()
sess.visit(url)

是否可以将cookie传递给visit()或者我必须寻找另一种解决方案？

为什么不通过 dryscrape 登录？

session = dryscrape.Session()
session.visit('<url_where_is_login_form>')
name = session.at_xpath('//*[@name="username"]') # Where <input name="username">
name.set("<login>")
password = session.at_xpath('//*[@name="password"]') # Where <input name="password">
password.set("<password>")
# Push the button
name.form().submit()
session.visit("<url to visit with proper cookies>")

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

webscraping

pythonrequests

Python dryscrape 抓取带有 cookies 的页面的相关文章

Python setuptools：如何在 setup.py 中添加私有存储库 (gitlab)？

我上传了 2 个包它们位于我的 gitlab 存储库中如果我想使用 pip 将它们安装在我的系统中这很容易因为 gitlab 可以帮助您 https docs gitlab com ee user packages pypi rep
切片稀疏（scipy）矩阵

我将不胜感激任何帮助以理解从 scipy sparse 包中切片 lil matrix A 时的以下行为实际上我想根据行和列的任意索引列表提取子矩阵当我使用这两行代码时 x1 A list 1 x2 x1 list 2 一切都很好
PyQt：如何通过匿名代理使用网页

这真让我抓狂我想在 QWebPage 中显示一个 url 但我想通过匿名代理来实现 Code setting up the proxy proxy QNetworkProxy proxy setHostName 189 75 98 199
从Python中的字符串中提取货币金额

我正在制作一个程序从字符串中获取货币并将其转换为其他货币例如如果字符串是 the car cost me 13 250 我需要得到 and 13250 我已经有了这个正则表达式 1 确实如此但是该字符串很有可能有多个价格并且全部使
将 numpy 数组写入文本文件的速度

我需要将一个非常高的两列数组写入文本文件而且速度非常慢我发现如果我将数组改造成更宽的数组写入速度会快得多例如 import time import numpy as np dataMat1 np random rand 1000
当我在 Pandas 中使用 df.corr 时，我的一些列丢失了

这是我的代码 import numpy as np import pandas as pd import seaborn as sns import matplotlib pyplot as plt data pd read csv dea
在 macOS 中通过 Python 访问进程的压缩 RAM（顶部的 CMPRS）的方法？

我试图弄清楚如何从 Python 访问任何给定进程占用的实际 RAM 量我发现 psutil Process PID memory info rss 工作得很好直到操作系统决定开始压缩某些进程的 RAM 然后所有的 memory in
更改 python tkinter canvas 中的线坐标

我画了一条线tkinter Canvas现在我想移动一端这可能吗例如和itemconfig import tkinter tk tkinter Tk canvas tkinter Canvas tk canvas pack line c
Python Pandas 根据另一列的总计从另一个数据帧中选择值

我下面有一个 DataFrame 但我需要根据取消和订单列从每个代码中选择行假设代码 xxx 的阶数为 6 1 5 1 阶数为 11 我需要一种算法可以选择满足总共 11 行的行阶数为 6 5 如果没有行匹配则选择最接近的 id 并
`list()` 被认为是一个函数吗？

list显然是内置类型 https docs python org 3 library stdtypes html list在Python中我看到底下有一条评论this https stackoverflow com a 53645813
如何使用 sys.path.append 在 Python 中导入文件？

我的桌面上有两个目录 DIR1 and DIR2其中包含以下文件 DIR1 file1 py DIR2 file2 py myfile txt 这些文件包含以下内容 file1 py import sys sys path append s
Pandas style.bar 颜色基于条件？

如何渲染其中一列的 Pandas dfstyle bar color属性是根据某些条件计算的 Example df style bar subset before after color ff781c vmin 0 0 vmax 1 0 而
将文本注释到轴并对齐为圆

我正在尝试在轴上绘制文本并将该文本与圆对齐更准确地说有一些具有不同坐标 x y 的点位于该圆内并使用以下命令创建 ax scatter x y s 100 我想用圆圈连接并标记每个点 Cnameb 文本的坐标由 xp yp 定义因此
在 Sphinx 中，有没有办法在声明参数的同时记录参数？

我更喜欢在声明参数的同一行记录每个参数根据需要以便应用D R Y http en wikipedia org wiki Don t repeat yourself 如果我有这样的代码 def foo flab nickers a ser
无法在 python 3.8 上将带有 webapp 的 python 部署到 azure

我正在尝试使用部署一个测试项目Flask使用以下方法将框架迁移到 Azure 云中Azure CLI https learn microsoft com en us azure app service containers quicksta
对数据帧的每 2 小时数据进行 Groupby

我有一个数据框 Time T201FN1ST2010 T201FN1VT2010 1791 2017 12 26 00 00 00 854 69 0 87 1792 2017 12 26 00 20 00 855 76 0 87 1793
如何使用 matplotlib 为圆柱体的每个单独面添加颜色

我正在尝试为圆柱体的每个面着色但是我不确定如何进行我尝试了以下方法 for i in range 10 col append for i in range 10 for j in range 20 col i append plt cm
在 virtualenvwrapper 中激活环境

我安装了virtualenv and virtualenvwrapper用这个命令我创建了一个环境 mkvirtualenv cv 它有效创建后我就处于新环境中现在我重新启动了我的电脑我想activate又是那个环境但是怎么样我使
长/宽数据到宽/长

我有一个数据框如下所示 import pandas as pd d decil 1 decil 1 decil 2 decil 2 decil 3 decil 3 decil kommune AA BB AA BB AA BB 2010
使用 urllib 编码时保持 url 参数有序

我正在尝试用 python 模拟 get 请求我有一个参数字典并使用 urllib urlencode 对它们进行 urlencode 我注意到虽然字典的形式是 k1 v1 k2 v2 k3 v3 urlencoding 后参数的顺序切

随机推荐

Java 到 JavaScript 编译器 [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案除了 GET 之外还有其他 Java 到 JavaScript 编译器吗目前我所有的工作都是用 Ja
在 C++ 中存储任意对象的列表

在 Java 中您可以拥有一个对象列表您可以添加多种类型的对象然后检索它们检查它们的类型并针对该类型执行适当的操作例如如果代码不完全正确我深表歉意我是凭记忆写的 List list new LinkedList list
Python 中的本地导入语句

我认为将 import 语句放置在靠近使用它的片段的位置可以使其依赖关系更加清晰从而提高可读性 Python 会缓存这个吗我应该关心吗这是一个坏主意吗 def Process import StringIO file handle
SplunkMint 上传 dSym

每次尝试运行以下脚本 SplunkMint 脚本自动上传 dsym 文件以进行符号化时我都会收到此错误 SCRIPT usr bin find SRCROOT name splunkmint postbuild dsym upload
SQL Server CE 密码允许使用的字符吗？

在我们开发的 Web 应用程序中我们生成 SQL Server CE 数据库文件并为这些文件生成密码密码是使用 System Web Security Membership GeneratePassword 生成的我认为Genera
如何在 Tomcat 中启用 java 断言

我想使用Javaassert我的 Spring Web 应用程序中的关键字主要是在我的域类上检查构造函数内的不变量但我看不到如何启用运行时断言检查对于普通的java应用程序我会使用 ea使用 java 命令进行切换但我不知道如何
如何处理 jQuery UI Selectmenu 更改事件

我使用 jquery ui 选择菜单自定义渲染选项 http jqueryui com selectmenu custom render 我该如何处理change event i try filesA on change function
如何在 ng-repeat (AngularJS) 中绑定多个 JSON 文件？

我有多个 JSON 文件主要 json MainRegister name Name1 url url1 json name Name2 url url2 json url1 json SubInformation description
使用 scipy.spatial 的数据类型问题

我想使用 scipy spatial 的 KDTree 来查找二维数组中的最近邻对本质上是一个列表列表其中嵌套列表的维度为 2 我生成列表列表将其通过管道传输到 numpy 的数组中然后创建 KDTree 实例然而每当我尝试对其
使用 Mockito 模拟 Jersey 客户端

您好我正在使用 JUnit 和 Mockito 测试 Jersey Client 1 19 版本我正在努力获取或阅读该实体我不知道如何从那里继续而且我也收到 IllegalStateException 下面是我用来为客户端响应创建模
如何在AWS上自动部署带有子模块的git存储库？

我的 git 存储库中有一个子模块我的目录结构如下 app folder1 folder2 submodule 5855 我已使用自动部署服务在 AWS 上部署了我的代码现在在服务器上我的父目录中有代码但子模块目录为空 Q1 如何
量角器 - 查找所有元素和找到的元素的循环长度，然后单击按钮

所以我一直在试图弄清楚如何根据 find All 元素的数量来单击按钮 x 次这意味着如果同一个类名找到 3 个元素那么我们循环 3 次这应该单击按钮 3 次我做了这样的事情新更新请查看底部的编辑帖子通常情况下element
StrictMode java.lang.Throwable：检测到未标记的套接字

启用 StrictMode 后我刚刚开始收到此异常 java lang Throwable 检测到未标记的套接字使用 TrafficStats setThreadSocketTag 跟踪所有网络使用情况有几种方法可以处理此异常首先
使用细粒度锁的代码示例（JCR Jackrabbit？）

我正在进行一项学术研究试图开发一种编程工具帮助实现细粒度锁定功能用于维护树状数据结构的并发程序例如程序员可能会编写一些接收树根节点并修改树的函数通过遍历某些路径并添加删除节点该工具将帮助他找到代码中节点应该被锁定的位置以及
PDO-bindParam 不起作用

我正在创建一个 PDO 类以在我的项目中使用但由于我是新手所以我无法将参数绑定到准备好的 sql 语句而不会出现任何错误这是执行此操作的函数 bindParam public static function bind get fun
java.net.URI.relativize 不适用于 JAR URI

我有两个 URI 对象一个指向 JAR 文件中的文件夹另一个指向同一 JAR 文件中的文件该文件位于第一个 URI 指定的目录的子文件夹中我喜欢创建一个相对 URI 因此生成的 URI 仅包含 JAR 中文件的相对路径文件夹URI
IIS 上的 Python：如何？

我有 PHP dotNet 背景并且对 Python 着迷我想逐步将功能从 PHP 转置为 Python 并排运行各个部分由于应用程序规模庞大这一过渡可能需要 2 年时间因此我必须使用 IIS 我有 15 年的 Web 编程背景
使用 AFIncrementalStore 和 NSFetchedResultsController 出现死锁

这几天我一直在苦苦思索这个问题但我一生都无法弄清楚到底发生了什么我对核心数据很陌生但我对它足够了解可以避免死锁情况然而对于这个项目我决定尝试合并 AFIncrementalStore 我构建了一个示例项目来测试 APIClie
使用 flex 将 Python 多行字符串与转义字符匹配

我想知道如何将 python 多行注释与 flex 相匹配我遇到了一些麻烦以下工作正常Regexr https regexr com 但不被flex识别我不知道如何修复它 1 2 以前我使用过 3 0 2 3 它可以检测以下评论 A
Python dryscrape 抓取带有 cookies 的页面

我想从网站获取一些数据这需要登录我通过以下方式登录requests url http example com response requests get url email email protected cdn cgi l email

Python dryscrape 抓取带有 cookies 的页面

Python dryscrape 抓取带有 cookies 的页面 的相关文章

随机推荐

热门标签

Python dryscrape 抓取带有 cookies 的页面的相关文章