我正在编写代码来解析用 XML 编写的配置文件,其中 XML 标签混合大小写,并且大小写很重要。 Beautiful Soup 似乎默认将 XML 标签转换为小写,我想更改此行为。
我不是第一个就这个主题提出问题的人 [参见here https://stackoverflow.com/questions/567999/preventing-beautifulsoup-from-converting-my-xml-tags-to-lowercase]。但是,我不明白该问题的答案,并且在 BeautifulSoup-3.1.0.1 BeautifulSoup.py 中似乎不包含任何“实例”encodedName
" or "Tag.__str__
"
import html5lib
from html5lib import treebuilders
f = open("mydocument.html")
parser = html5lib.XMLParser(tree=treebuilders.getTreeBuilder("beautifulsoup"))
document = parser.parse(f)
“document”现在是一个类似 BeautifulSoup 的树,但保留了标签的情况。看html5lib http://code.google.com/p/html5lib/用于文档和安装。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)