如何使用 python sub 删除

2024-03-25

我有一个 html 文件,我想用空格替换空段落。

mystring = "This <p></p><p>is a test</p><p></p><p></p>"
result = mystring.sub("<p></p>" , "&nbsp;")

这是行不通的。


Please, 不要尝试使用正则表达式解析 HTML https://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454。使用适当的解析模块,例如htmlparser or BeautifulSoup为了达成这个。现在“忍受”较短的学习曲线并受益:

  1. 您的解析代码将更加健壮,可以处理您可能没有考虑到的极端情况,这些情况会因正则表达式而失败
  2. 对于未来的 HTML 解析/修改任务,您将能够更快地完成任务,因此时间投资最终也会得到回报。

你不会后悔的!利润有保证!

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何使用 python sub 删除

的相关文章

随机推荐