Requests.content 与 Chrome 检查元素不匹配

2024-01-02

我正在使用 BeautifulSoup 和 Requests 来抓取所有食谱用户数据。

当检查 HTML 代码时，我发现我想要的数据包含在

<article class="profile-review-card">

但是当我使用以下代码时

URL = 'http://allrecipes.com/cook/2010/reviews/'
response = requests.get(URL ).content
soup = BeautifulSoup(response, 'html.parser')
X = soup.find_all('article', class_ = "profile-review-card"  )

虽然 soup 和 response 充满了 html，但 X 是空的。我查看了一下，发现检查元素和 requests.get(URL).content 之间存在一些不一致，这是怎么回事？

Chrome 检查显示的内容 https://i.stack.imgur.com/5VtgG.png

那是因为它是使用 Ajax/javascript 加载的。 Requests 库无法处理这个问题，您需要使用可以执行这些脚本并获取 dom 的东西。有多种选择，我将列出几个以帮助您入门。

Selenium http://selenium-python.readthedocs.org/
ghost.py http://jeanphix.me/Ghost.py/

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

html

beautifulsoup

pythonrequests

Requests.content 与 Chrome 检查元素不匹配的相关文章

Pandas 中允许重复列

我将一个大的 CSV 包含股票财务数据文件分割成更小的块 CSV 文件的格式不同像 Excel 数据透视表之类的东西第一列的前几行包含一些标题公司名称 ID 等在以下列中重复因为一家公司有多个属性而不是一家公司只有一栏在前几行
如何创建一个语句来打印以特定单词开头的单词？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案如何在 python 中打印从特定字母开始的单词而不使用函数而是使用方法或循环 1 我有一个字符串想要打印以 m 开头的单词 S
python suds SOAP 请求中的名称空间前缀错误

我使用 python suds 来实现客户端并且在发送的 SOAP 标头中得到了错误的命名空间前缀用于定义由element ref 在 wsdl 中 wsdl 正在引用数据类型 xsd 文件请参见下文问题出在函数上GetRecord
W3C 验证器：“握手警报：unrecognized_name”

我正在尝试验证我的网站W3C Nu Html 检查器 https validator w3 org nu doc https 3A 2F 2Fwww healthdrop in 2F但我遇到了以下错误不知道为什么 IO 错误握手警报 u
HTML2canvas 和 Canvas2image，下载的屏幕截图不显示我的 HTML 图像

我一直在开发一个 HTML 页面我想将其转换为图像我一直在使用 html2canvas 和 canvas2image 脚本并采用此代码http jsfiddle net 8ypxW 3 http jsfiddle net 8ypxW 3
iOS7 中“-webkit-overflow-scrolling: touch” 最初的屏幕外元素被破坏

既然转基因种子已经发布了我们现在可以谈谈了看起来 iOS7 中的 webkit overflow scrolling touch 已损坏最初不在屏幕上的元素的触摸事件不会触发或者在某些情况下只是不可靠这是一个例子
Numpy 过滤器平滑零区域

我有一个 0 及更大整数的 2D numpy 数组其中值代表区域标签例如 array 9 9 9 0 0 0 0 1 1 1 9 9 9 9 0 7 1 1 1 1 9 9 9 9 0 2 2 1 1 1 9 9 9 8 0 2 2 1
Google Chrome 106 可拖动导致元素消失

使用拖放元素时绝对定位元素中包含的大多数其他元素都会从屏幕上消失如果我调整窗口大小这些元素会出现但在开始拖动时会再次消失我在最新版本的 Google Chrome 106 和 Beta 版本 107 0 5304 18 以及现在的
如何使用列表作为pandas数据框中的值？

我有一个数据框需要列的子集包含具有多个值的条目下面是一个带有运行时列的数据框其中包含程序在各种条件下的运行时 df condition a runtimes 1 1 5 2 condition b runtimes 0 5 0 7
Python 将日志滚动到变量

我有一个使用多线程并在服务器后台运行的应用程序为了无需登录服务器即可监控应用程序我决定包括Bottle http bottlepy org为了响应一些HTTP端点并报告状态执行远程关闭等我还想添加一种查阅日志文件的方法我可以使用以
使用 JS 合并具有相同值的相邻 HTML 表格单元格

我已经为此苦苦挣扎了一段时间我有一个根据一些 JSON 数据自动生成的表该数据可能会有所不同我想合并第一列中具有相同值的相邻单元格例如此表中的鱼和鸟 table tr td fish td td salmon td tr tr
Tkinter - 浮动窗口 - 调整大小

灵感来自this https stackoverflow com a 22424245 13629335问题我想为我的根窗口编写自己的调整大小函数但我刚刚注意到我的代码显示了一些性能问题如果你快速调整它的大小你会发现窗口没有像我希望
迭代 my_dict.keys() 并修改字典中的值是否会使迭代器失效？

我的例子是这样的 for my key in my dict keys my dict my key mutate 上述代码的行为是否已定义假设my dict是一本字典并且mutate是一个改变其对象的方法我担心的是改变字典中的值可能
如何获取 UIWebView 中元素的位置？

我在 iPad 程序中加载了 html 的 UIWebView 通过使用 webkit column width 我将 html 分为几列 padding 0px height 1024px webkit column gap 0px we
在Python中按属性获取对象列表中的索引

我有具有属性 id 的对象列表我想找到具有特定 id 的对象的索引我写了这样的东西 index 1 for i in range len my list if my list i id specific id index i break
字典和数组作为类变量与实例变量

这是赚取积分的简单方法请解释以下内容 class C a b 0 c def init self self x def d self k v self x k v self a k v self b v self c append v d
Elastic Beanstalk 中的 enum34 问题

我正在尝试在 Elastic Beanstalk 中设置 django 环境当我尝试通过requirements txt 文件安装时我遇到了python3 6 问题 File opt python run venv bin pip li
检查字典键是否有空值

我有以下字典 dict1 city name yass region zipcode phone address tehsil planet mars 我正在尝试创建一个基于 dict1 的新字典但是它不会包含带有空字符串的键它不会包
Python 无法使用套接字绑定我的外部/公共 IP 地址，给出错误但是当使用本地 IP 地址时，错误不会显示

这是出现主要错误的代码与我的本地 IP 的绑定将起作用 s bind 192 168 1 4 port 与我的公共 IP 的绑定失败并出现以下错误 s bind 99 99 99 99 port WinError 10049 请求的地址在
您可以使用关键字参数而不提供默认值吗？

我习惯于在 Python 中使用这样的函数方法定义 def my function arg1 None arg2 default do stuff here 如果我不供应arg1 or arg2 那么默认值None or default

随机推荐

Java 中的持久数据结构

有谁知道关于在 Java 中创建和使用持久数据结构的库或至少一些研究吗我并不是将持久性称为长期存储而是将持久性称为不变性请参阅维基百科条目 http en wikipedia org wiki Persistent data stru
ASP.NET Identity - 将用户 ID 主键默认类型从字符串更改为 int 以及使用自定义表名称时出错

我正在使用 Microsoft AspNet Identity 2 0 0 beta1 和 Entity Framework 6 1 0 beta1 2014 年 2 月 11 日发布当我尝试将用户 ID 主键的默认类型从字符串更改为 i
通过套接字读取和写入字节数据包

我想通过 Socket 将 Android 设备连接到外部设备 Socket 连接外部设备成功现在如果外部设备需要任何数据则按照以下顺序将字节数据包数据的请求发送到套接字如果外部设备接收数据正确则发送字节数据作为响应参数方法名
如何使用 C# 从 BIOS 获取 CPU 温度信息？

如何使用 C 从 Bios 获取 CPU 温度信息我尝试了中的代码CPU温度监控 https stackoverflow com questions 2923984 cpu temperature monitoring c 但没有运气 e
将纯字符串转换为 MAC 地址格式

我正在尝试将一些字符串输入转换为正确的格式以使用 MAC 地址所以我需要转换 00A0C914C829 to 00 A0 C9 14 C8 29 我有这个PowerShell脚本来实现这一点 string 00A0C914C829 out
人民博士。数据读取器 - 类型错误：字符串索引必须是整数

直到今天这段代码都运行得很好现在我收到此错误消息 TypeError 字符串索引必须是整数 import pandas datareader as pdr Equity Indices GSPC ES F NQ F YM F RUT D
从 POST 解码 base64 以在 PIL 中使用

我正在 Flask 中制作一个简单的 API 它接受以 base64 编码的图像然后使用 Pillow 对其进行解码以进行进一步处理我看过一些例子 1 https stackoverflow com questions 19908975
单机MongoDB如何避免服务器故障导致数据丢失？

我读到 mongoDB 不会立即将数据写入磁盘它会定期执行此操作关于如何处理这个问题有什么想法吗您可以启用日记功能 journal 查看http www adathedev co uk 2011 03 mongodb journali
主窗体退出时，窗体关闭时不弹出窗口（阻止弹出窗口并强制关闭其他窗体）

如果这个问题重复出现请接受我的歉意我搜索了现有的问题和解决方案但没有找到解决我的问题的确切解决方案我正在开发winform应用程序我有一个主form1 它创建form2 Form2 有关闭按钮和覆盖的 FormClosing 方法
如何检测具有特定签名的JavaScript函数是否已被注册？

假设您有两个具有以下签名的函数 addClass class addClass class duration These live in a third party library no prizes for guessing which
更新数组对象值

我想更新我保存在工厂中的全局数组中的一些值我使用 get 方法来获取数据但 set 函数不知何故无法完成其工作并且数组中的值不会更新我缺少什么 factory messageList function var Messages ti
crash_rows 未折叠并且更新包无法修复

这个脚本对我不起作用输出的表没有折叠行我已经更新了我的所有软件包有人可以验证吗 remove list ls library knitr library kableExtra collapse rows dt lt data fram
Matplotlib：在远程计算机上显示绘图

我有一个 python 代码在名为 A 的远程计算机上进行一些计算我通过以下方式连接到 Assh来自一台名为 B 的机器有没有办法让B机上显示这个数字当然您可以启用 X11 转发通常这是通过传递来完成的 X or Y选项ssh当您
为什么 Font Awesome 无法在我的 jekyll 构建的 Github 网站上运行？

我正在使用 Jekyll 构建我的博客网站该网站由 Github 托管并且我正在尝试合并 font awesome fa 图标没有显示现在我的 Github 页面也没有更新我最新的博客文章我尝试将字体很棒的样式表链接到我的CSS 我
coqide - 无法从同一文件夹加载模块

我无法加载 CoqIde 中同一文件夹中的模块我正在尝试从 Software Foundations 加载源代码我正在包含 SF 源代码的文件夹中运行 coqidecoqide or coqide 然后打开并运行该文件后我收到此错误
如何将光标指针属性应用于（单击）事件处理程序？

i class cursor pointer i 我们的代码库有很多这样的冗余类我一直在寻找一种在有单击事件处理程序时应用光标指针属性的方法在 Angular 2 之前您可以将 css 应用到 Angular 属性但这已不再可能
获取Excel文件的内容创建日期

我的目标是显示 Excel 文件的日期但如果我从互联网下载该文件则会自动将创建日期和修改日期设置为当前时间和日期我查看了文件的属性发现在详细信息部分中的个人信息下有一个名为源的部分其中有一个名为使用原始日期文件创建
Angular 2 Reactive Forms：无法找到带有路径的控件

我尝试将角色动态添加到我的用户角色应用程序中我有一个 Formarray 可以在其中显示编辑视图中用户的角色还有一个用于向用户添加更多角色的按钮但是当我按下添加角色按钮时我收到以下错误消息错误错误无法找到路径为 roles
C++ 字符串中的 STL 排序函数

所以我一直在尝试根据字符的频率对字符串进行排序然而我一直使用的在线法官向我显示了错误 Line 17 invalid use of non static member function bool olution helper char c
Requests.content 与 Chrome 检查元素不匹配

我正在使用 BeautifulSoup 和 Requests 来抓取所有食谱用户数据当检查 HTML 代码时我发现我想要的数据包含在

Requests.content 与 Chrome 检查元素不匹配

Requests.content 与 Chrome 检查元素不匹配 的相关文章

随机推荐

热门标签

Requests.content 与 Chrome 检查元素不匹配的相关文章