我想用 Beautiful Soup 做一个非常简单的替换。假设我想访问页面中的所有 A 标记并将“?foo”附加到它们的 href 中。有人可以发布或链接到如何做这样简单的事情的示例吗?
from BeautifulSoup import BeautifulSoup
soup = BeautifulSoup('''
<html>
<head><title>Testing</title></head>
<body>
<a href="http://foo.com/">foo</a>
<a href="http://bar.com/bar">Bar</a>
</body>
</html>''')
for link in soup.findAll('a'): # find all links
link['href'] = link['href'] + '?foo'
print soup
打印:
<html>
<head><title>Testing</title></head>
<body>
<a href="http://foo.com/?foo">foo</a>
<a href="http://bar.com/bar?foo">Bar</a>
</body>
</html>
The 文档 http://www.crummy.com/software/BeautifulSoup/documentation.html还有一些更改属性的示例 http://www.crummy.com/software/BeautifulSoup/documentation.html#Changing%20attribute%20values。这是一个内容广泛的教程,涵盖了 BeautifulSoup 的所有常见方面。我不知道文档中缺少什么,也许你应该澄清一下。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)