soup.find("tagName", { "id" : "articlebody" })
为什么这不返回<div id="articlebody"> ... </div>
标签和中间的东西?它什么也不返回。我知道它确实存在,因为我正盯着它
soup.prettify()
soup.find("div", { "id" : "articlebody" })
也不起作用。
(EDIT:我发现 BeautifulSoup 没有正确解析我的页面,这可能意味着我尝试解析的页面没有以 SGML 或其他方式正确格式化)
您应该发布示例文档,因为代码工作正常:
>>> import BeautifulSoup
>>> soup = BeautifulSoup.BeautifulSoup('<html><body><div id="articlebody"> ... </div></body></html')
>>> soup.find("div", {"id": "articlebody"})
<div id="articlebody"> ... </div>
Finding <div>
在里面<div>
s 也有效:
>>> soup = BeautifulSoup.BeautifulSoup('<html><body><div><div id="articlebody"> ... </div></div></body></html')
>>> soup.find("div", {"id": "articlebody"})
<div id="articlebody"> ... </div>
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)