我使用以下代码来定位 div:
parser = etree.HTMLParser()
tree = etree.parse(StringIO(page), parser)
div = tree.xpath("//div[@class='content']")[0]
我唯一的问题是,执行此操作后,我不想依赖 lxml 来提取所述 div 的内容:我只想取回 div 包含的原始 XML。这是可行的还是我必须完全放弃这种方法?
我想您正在寻找:
etree.tostring(div)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)