为什么 urllib.urlopen.read() 与源代码不对应？

2023-11-26

我正在尝试获取以下网页：

import urllib
urllib.urlopen("http://www.gallimard-jeunesse.fr/searchjeunesse/advanced/(order)/author?catalog[0]=1&SearchAction=1").read()

结果与我使用 Google Chrome 检查网页源代码时看到的不符。

您能告诉我为什么会发生这种情况以及如何改进我的代码来克服这个问题吗？

感谢您的帮助。

你从中得到什么urlopen是原始网页，意味着没有执行 javascript，不使用 css；你从 Chrome（或其他浏览器）获得的是最终网页，其中包括可执行的 javascript（可能会改变 HTML）、CSS 渲染等。所有这些都不会发生在urlopen...

因此存在差异，希望这一点很清楚

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

urllib

urlopen

为什么 urllib.urlopen.read() 与源代码不对应？的相关文章

python sys.path 故障排除

python 文档位于http docs python org library sys html http docs python org library sys html比如说sys path is 从环境变量 PYTHONPATH 以及
从文本文件中删除特定字符

我对 Python 和编码都很陌生我当时正在做一个小项目但遇到了一个问题 44 1 6 23 2 7 49 2 3 53 2 1 68 1 6 71 2 7 我只需要从每行中删除第三个和第六个字符或者更具体地说从整个文件中删除字符
使用python查找txt文件中字母出现的次数

我需要从 txt 文件中读取该字母并打印 txt 文件中出现的次数到目前为止我已经能够在一行中打印内容但计数有问题有人可以指导吗 infile open grades txt content infile read for char
稀有对象的 python 类型注释，例如 psycopg2 对象

我了解内置类型但是我如何指定稀有对象例如数据库连接对象 def get connection and cursor gt tuple psycopg2 extensions cursor psycopg2 extensions conn
使用 django-rest-framework 设置对象级权限

尝试使用 django rest framework 最干净最规范地管理 django guardian 对象级权限我想将对象的读取权限 module view object 分配给在执行 POST 时发出请求的用户我的基于阶级的观点
使用 Django 将文件异步上传到 Amazon S3

我使用此文件存储引擎在上传文件时将文件存储到 Amazon S3 http code welldev org django storages wiki Home http code welldev org django storages w
Series.sort() 和 Series.order() 有什么区别？

s pd Series nr randint 0 10 5 index nr randint 0 10 5 s Output 1 3 7 6 2 0 9 7 1 6 order 按值排序并返回一个新系列 s order Output 2 0
使用 Paramiko 进行 DSA 密钥转发？

我正在使用 Paramiko 在远程服务器上执行 bash 脚本在其中一些脚本中存在与其他服务器的 ssh 连接如果我只使用 bash 不使用 Python 我的 DSA 密钥将被第一个远程服务器上的 bash 脚本转发并使用以连接
协程从未被等待

我正在使用一个简单的上下文管理器其中包含一个异步循环 class Runner def init self self loop asyncio get event loop def enter self return self def e
使用python从gst管道抓取帧到opencv

我在用着OpenCV http opencv org 和GStreamer0 10 我使用此管道通过自定义套接字通过 UDP 接收 MPEG ts 数据包sockfd由 python 提供并显示它xvimagesink 而且效果很好以下命
运行 Python 单元测试，以便成功时不打印任何内容，失败时仅打印 AssertionError()

我有一个标准单元测试格式的测试模块 class my test unittest TestCase def test 1 self tests def test 2 self tests etc 我的公司有一个专有的测试工具它将作为命令行
Python将文本文件解析为嵌套字典

考虑以下数据结构 HEADER1 key value key value HEADER2 key value key value HEADER3 key value HEADER4 key value key value 原始数据中没有缩进
使用 for 循环创建一系列元组

我已经搜索过但找不到答案尽管我确信它已经存在了我对 python 很陌生但我以前用其他语言做过这种事情我正在以行形式读取数据文件我想将每行数据存储在它自己的元组中以便在 for 循环之外访问 tup i inLine wher
Plotly：如何检查基本图形结构（版本 4）

对于旧版本的plotly 例如在 Jupyterlab 中您可以简单地运行figure像这样检查你的图形的基础知识 Ouput data marker color red size 10 symbol 104 mode markers l
如何将带有参数的Python装饰器实现为类？

我正在尝试实现一个接受一些参数的装饰器通常带有参数的装饰器被实现为双重嵌套闭包如下所示 def mydecorator param1 param2 do something with params def wrapper fn def
minizinc python 安装

我通过 anaconda 提示符在 python 上安装了 minizinc 就像其他软件包一样 pip install minizinc 该软件包表示已成功安装我可以导入该模块但是我正在遵循基本示例https minizinc py
带 Flask 的 RPI dht22：无法将第 4 行设置为输入 - 等待 PulseIn 消息超时

我正在尝试制作一个 Raspberry Pi 3 REST API 使用 DHT22 提供温度和湿度整个代码 from flask import Flask jsonify request from sds011 import SDS01
rpy2 无法加载外部库

希望有人能帮忙解决这个问题 R版本 2 14 1rpy2版本 2 2 5蟒蛇版本 2 7 3 一直在尝试在 python 脚本中使用 rpy2 加载 R venneuler 包该包以 rJava 作为依赖项 venneuler 和 rJa
pandas 中数据帧中的随机/洗牌行

我目前正在尝试找到一种方法来按行随机化数据框中的项目我在 pandas 中按列洗牌排列找到了这个线程在 pandas 中对 DataFrame 进行改组排列 https stackoverflow com questions 157
无法安装最新版本的 Numpy (1.22.3)

我正在尝试安装最新版本的 numpy 即 1 22 3 但看起来 pip 无法找到最后一个版本我知道我可以从源代码本地安装它但我想了解为什么我无法使用 pip 安装它 PS 我有最新版本的pip 22 0 4 ERROR Could n

随机推荐

将文档作为参数传递给 Java 中的 XSL Translation

我正在为我的 XSL 添加国际化功能我见过很多创建dictionary xml 文件并通过document dictionary xml 将其加载到我的XSL 中的示例我想做类似的事情但我不想在磁盘上创建和存储dictionary x
Bootstrap 4 卡列宽度

我正在使用文档中的代码创建一个包含 3 4 张卡片的卡片列布局我只从一个开始这是我的代码 div class card columns div class card img class card img top img fluid sr
如何设置 PHP 回显文本的样式？ [关闭]

Closed 这个问题需要细节或清晰度目前不接受答案我有以下代码
iOS facebook sdk 如何下载相册、个人资料照片数据

我想让我的 iPhone 应用程序用户查看并从他们的 Facebook 个人资料照片中选择下载照片以用作个人资料图片我目前正在使用Facebook SSO SDK并成功登录并访问Graph信息已尝试使用以下方式访问照片信息成功 SS
如何获取重定向UDP报文的原始目的端口？

Using 这东西我可以获得原始目的IP地址socket PF INET SOCK DGRAM 0 socket 如何获取原目的港取决于重定向机制如果您使用 REDIRECT 即底层的 NAT 则需要使用 SO ORIGINAL DST
如何将 javascript 文件的服务限制为仅向经过身份验证的用户提供？

我有一个 WebAPI 2 AngularJS SPA 应用程序它使用 Identity 2 进行身份验证我的代码在本地存储一个用于身份验证的令牌我想实现一个功能允许我的应用程序在下载初始 index html 页面后为经过身份验证
游戏开发入门

我想开始游戏开发我读了很多文章但没有走得太远我正在学习计算机科学并且有 C 经验一个学期的 Java NET 甚至汇编程序但我不会从那开始我想开发小型游戏例如俄罗斯方块以及后来的某种跳跃和奔跑我想从事视觉方面的工作
R：在 foreach %dopar% 中显示错误和警告消息

我刚开始使用 foreach dopar 进行并行并且对于它如何处理错误或警告有一些问题当我在 foreach dopar 中使用 try 和自定义错误消息时本机错误消息不会显示 test lt function x if x 2
Java中的隐藏方法是什么？甚至 JavaDoc 的解释也令人困惑

Javadoc says 调用的隐藏方法的版本是超类中的版本调用的重写方法的版本是子类中的版本没有给我敲响警钟任何显示其含义的清晰示例都将受到高度赞赏 public class Animal public static void fo
如何在 Knex where like 查询中转义 %？

我在用着knex生成我的 SQL 查询在knex文档它显示了这一点 knex users where columnName like rowlikeme 现在在我的应用程序中我这样做了 function search term ter
可以在应用程序内购买 iOS 7 模拟器吗？ [关闭]

Closed 这个问题不符合堆栈溢出指南目前不接受答案看来苹果再次拿走了ios 7模拟器来测试应用内购买的权利我的游戏在其他版本的 ios 模拟器上运行良好可以在应用程序购买中进行测试但突然它在 ios 7 模拟器上停止并抛出错
如何升级到 C++17？

我使用 Atom 作为我的 IDE 我当前的 cplusplus 201402这是 C 14 我的编译器是g 海湾合作委员会 9 2 0 如何升级到 C 17 或 C 20 我搜索到的所有内容都涉及使用另一个 IDE Microsoft V
检测基于纬度/经度的多边形中的点

我想在服务器端仅使用 C 检测基于纬度经度的坐标是否位于由基于纬度经度的点组成的区域多边形内我相信正确的方法是光线投射但也许已经有一个 C 实现了因为它并不简单另外我知道 SQL Server 有一些几何函数例如STIn
解析 Joda 时间部分

我想从字符串生成部分但在 API 中找不到任何支持该功能的内容显然我可以在 Joda Time 框架之外编写自己的解析器并创建 Partials 但我无法想象 API 尚不具备执行此操作的能力使用 Threeten JSR 310
java.sql.SQLException：此驱动程序不支持 SQL Server 版本 8。 SQL 状态 = 08S01，错误代码 = 0

我已将我的应用程序升级到Websphere 7 0from Websphere 6 1 我在用Microsoft SQL server jdbc driver 4 0对于这个应用程序当我使用sqljdbc4 jar连接到数据库进行身份验证
如何使用 pandas 从 Word 文档 (.docx) 文件中的表创建数据框

我有一个带有数据表的word文件 docx 我正在尝试使用该表创建一个pandas数据框我使用了docx和pandas模块但我无法创建数据框 from docx import Document document Document req
使用 char(36) 类型对第一列进行编码

所以我有一个 UserProfile 模型类作为 SimpleMembership 的一部分在其中我需要存储存在于另一个类型的数据库中的遗留标识符char 36 我很想将其更改为更明智的内容例如 uniqueIdentifier 但这
Spring Security：如何以编程方式清除“记住我”cookie？

我在网络应用程序中使用注销方法如下所示但如果我检查remember me注销不起作用因为 cookie 未清除如何在我的方法中以编程方式清除此 cookie 或如何制定更好的注销方法 public void logout Anony
使用 setAs() 在 R 中指定 colClasses 时收到警告 [关闭]

这个问题不太可能对任何未来的访客有帮助它只与一个较小的地理区域一个特定的时间点或一个非常狭窄的情况相关通常不适用于全世界的互联网受众为了帮助使这个问题更广泛地适用访问帮助中心我尝试使用这里提供的答案 Greg Snowquest
为什么 urllib.urlopen.read() 与源代码不对应？

我正在尝试获取以下网页 import urllib urllib urlopen http www gallimard jeunesse fr searchjeunesse advanced order author catalog 0 1

为什么 urllib.urlopen.read() 与源代码不对应？

为什么 urllib.urlopen.read() 与源代码不对应？ 的相关文章

随机推荐

热门标签

为什么 urllib.urlopen.read() 与源代码不对应？的相关文章