如何使用 Beautiful Soup 提取没有属性的

标签?

2023-12-13

假设一个网页包含以下内容:

<p style="display: none;"><input id="ak_js" name="ak_js" type="hidden" value="68"/></p>

<p><b>Lack of sales.. ANY sales.</b></p>

我正在尝试编写仅提取第二个标签的代码。基本上所有不包含属性的段落标签。 我尝试了下面的两段代码,但它们没有得到我想要的结果。

text = BeautifulSoup(requests.get(url).text)

for tag in text.find_all("p", attrs = False):
    .....

for tag in text.find_all(re.compile("^<p>$")):
    ....

解决这个问题的最佳方法是什么?


你可以给一个 lambdafind_all并用它过滤。

soup.find_all(lambda tag: tag.name == 'p' and not tag.attrs)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何使用 Beautiful Soup 提取没有属性的

标签? 的相关文章

随机推荐