如何删除整个文档中特定元素的所有属性。我正在尝试这样的事情:
from bs4 import UnicodeDammit
from lxml import html
content = open("source.html").read()
document = UnicodeDammit(content, is_html=True)
parser = html.HTMLParser(encoding=document.original_encoding)
root = html.document_fromstring(content, parser=parser)
for attr in root.xpath('.//table/@*'):
del attr.attrib
这里我尝试使用xpath删除文档中所有表中的所有属性,但它不起作用。
这是一种可能的方法,假设您要删除all某些元素的属性,例如table
:
for table in root.xpath('//table[@*]'):
table.attrib.clear()
上面的代码循环遍历所有table
包含任何属性,然后调用clear()
元素的方法attrib
属性,因为该属性只是一个 python 字典。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)