我正在尝试获取以下网页:
import urllib
urllib.urlopen("http://www.gallimard-jeunesse.fr/searchjeunesse/advanced/(order)/author?catalog[0]=1&SearchAction=1").read()
结果与我使用 Google Chrome 检查网页源代码时看到的不符。
您能告诉我为什么会发生这种情况以及如何改进我的代码来克服这个问题吗?
感谢您的帮助。
你从中得到什么urlopen
是原始网页,意味着没有执行 javascript,不使用 css;你从 Chrome(或其他浏览器)获得的是最终网页,其中包括可执行的 javascript(可能会改变 HTML)、CSS 渲染等。所有这些都不会发生在urlopen
...
因此存在差异,希望这一点很清楚
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)