现在我正在使用 beautiful soup 来解析 html 页面。但有时我通过find_all得到的结果小于页数。例如这个页面有 18 个标题跨度。但是当我使用以下代码时,它只有两个!谁能告诉我为什么。先感谢您!
soup = BeautifulSoup(page, 'html.parser')
hrefDivList = soup.find_all("span", class_ = "headline")
#print hrefDivList
print len(hrefDivList)
您可以尝试为 Beautifulsoup 使用不同的解析器。
import requests
from bs4 import BeautifulSoup
url = "<your url>"
r = requests.get(url)
soup = BeautifulSoup(r.content, 'lxml')
hrefDivList = soup.find_all("span", attrs={"class": "headline"})
print len(hrefDivList)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)