你好,我正在练习我的请求和网络抓取技巧,所以我尝试抓取 youtube 上的趋势页面,并提取趋势视频的标题,这是这个链接youtube https://www.youtube.com/feed/trending
这是我正在运行的代码
import requests
from bs4 import BeautifulSoup
url = 'https://www.youtube.com/feed/trending'
html = requests.get(url)
soup = BeautifulSoup(html.content, "html.parser")
a = soup.find_all("a", {"id": "video-title"})
print(a)
及其返回 [],我不明白为什么它在源代码中返回 [],
打印变量的内容html.content
- 它包含该 ID 吗?
我敢打赌,youtube.com 是一个严重依赖 javascript 的网站,但是requests
模块没有js引擎。你的浏览器看到的通常不是模块的样子requests
sees.
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)