我需要执行以下操作:
- 获取html文档
- 查找所有出现的“img”标签
- 获取它们的 'src' 属性
- 将创建的 url 传递给处理
- 将 'src' 属性更改为新属性
- 使用 Python 2.7 完成所有这些工作
附:我听说过 lxml 和 BeautifulSoup。您建议如何解决这个问题?也许使用正则表达式会更好?或者其他什么?
from BeautifulSoup import BeautifulSoup
soup = BeautifulSoup(html_string)
for link in soup.findAll('a')
link['src'] = 'New src'
html_string = str(soup)
我不是特别喜欢 BeautifulSoup,但它可以满足你的需要。如果没有必要的话,尽量不要过度解决你的解决方案,这是解决一般问题可以做的最简单的事情之一。
也就是说,构建未来同样重要,但您的所有 6 个要求都可以归结为一个,“我想更改‘src’或所有指向 X 的链接”
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)