lxml etree xmlparser 删除不需要的命名空间

2024-05-06

我有一个 xml 文档，我正在尝试使用 Etree.lxml 解析它

<Envelope xmlns="http://www.example.com/zzz/yyy">
  <Header>
    <Version>1</Version>
  </Header>
  <Body>
    some stuff
  <Body>
<Envelope>

我的代码是：

path = "path to xml file"
from lxml import etree as ET
parser = ET.XMLParser(ns_clean=True)
dom = ET.parse(path, parser)
dom.getroot()

当我尝试获取 dom.getroot() 时，我得到：

<Element {http://www.example.com/zzz/yyy}Envelope at 28adacac>

然而我只想：

<Element Envelope at 28adacac>

当我做

dom.getroot().find("Body")

我没有得到任何回报。然而，当我

dom.getroot().find("{http://www.example.com/zzz/yyy}Body")

我得到一个结果。

我认为将 ns_clean=True 传递给解析器可以防止这种情况。

有任何想法吗？

import io
import lxml.etree as ET

content='''\
<Envelope xmlns="http://www.example.com/zzz/yyy">
  <Header>
    <Version>1</Version>
  </Header>
  <Body>
    some stuff
  </Body>
</Envelope>
'''    
dom = ET.parse(io.BytesIO(content))

您可以使用以下命令找到命名空间感知节点xpath method:

body=dom.xpath('//ns:Body',namespaces={'ns':'http://www.example.com/zzz/yyy'})
print(body)
# [<Element {http://www.example.com/zzz/yyy}Body at 90b2d4c>]

如果您确实想删除名称空间，可以使用 XSL 转换：

# http://wiki.tei-c.org/index.php/Remove-Namespaces.xsl
xslt='''<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output method="xml" indent="no"/>

<xsl:template match="/|comment()|processing-instruction()">
    <xsl:copy>
      <xsl:apply-templates/>
    </xsl:copy>
</xsl:template>

<xsl:template match="*">
    <xsl:element name="{local-name()}">
      <xsl:apply-templates select="@*|node()"/>
    </xsl:element>
</xsl:template>

<xsl:template match="@*">
    <xsl:attribute name="{local-name()}">
      <xsl:value-of select="."/>
    </xsl:attribute>
</xsl:template>
</xsl:stylesheet>
'''

xslt_doc=ET.parse(io.BytesIO(xslt))
transform=ET.XSLT(xslt_doc)
dom=transform(dom)

在这里我们看到命名空间已被删除：

print(ET.tostring(dom))
# <Envelope>
#   <Header>
#     <Version>1</Version>
#   </Header>
#   <Body>
#     some stuff
#   </Body>
# </Envelope>

现在您可以通过以下方式找到 Body 节点：

print(dom.find("Body"))
# <Element Body at 8506cd4>

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

lxml

xmlparsing

elementtree

lxml etree xmlparser 删除不需要的命名空间的相关文章

Spark 请求最大计数

我是 Spark 的初学者我尝试请求允许我检索最常访问的网页我的要求如下 mostPopularWebPageDF logDF groupBy webPage agg functions count webPage alias cntW
Python模块可以访问英语词典，包括单词的定义[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一个 python 模块它可以帮助我从英语词典中获取单词的定义当然有enchant 这可以帮助我检查该单词是否存在于英语中
如何迭代按值排序的 Python 字典？

我有一本字典比如 a 6 b 1 c 2 我想迭代一下by value 不是通过键换句话说 b 1 c 2 a 6 最直接的方法是什么 sorted dictionary items key lambda x x 1 对于那些讨厌 la
如何使用 Plotly 中的直方图将所有离群值分入一个分箱？

所以问题是我可以在 Plotly 中绘制直方图其中所有大于某个阈值的值都将被分组到一个箱中吗所需的输出但使用标准情节Histogram类我只能得到这个输出 import pandas as pd from plotly import
从 ffmpeg 获取实时输出以在进度条中使用（PyQt4，stdout）

我已经查看了很多问题但仍然无法完全弄清楚我正在使用 PyQt 并且希望能够运行ffmpeg i file mp4 file avi并获取流式输出以便我可以创建进度条我看过这些问题 ffmpeg可以显示进度条吗 https stack
Django 模型在模板中不可迭代

我试图迭代模型以获取列表中的第一个图像但它给了我错误即模型不可迭代以下是我的模型和模板的代码我只需要获取与单个产品相关的列表中的第一个图像模型 py class Product models Model title models
忽略 Mercurial hook 中的某些 Mercurial 命令

我有一个像这样的善变钩子 hooks pretxncommit myhook python path to file myhook 代码如下所示 def myhook ui repo kwargs do some stuff 但在我的例子中
切片 Dataframe 时出现 KeyError

我的代码如下所示 d pd read csv Collector Output csv df pd DataFrame data d dfa df copy dfa dfa rename columns OBJECTID Object ID
python suds SOAP 请求中的名称空间前缀错误

我使用 python suds 来实现客户端并且在发送的 SOAP 标头中得到了错误的命名空间前缀用于定义由element ref 在 wsdl 中 wsdl 正在引用数据类型 xsd 文件请参见下文问题出在函数上GetRecord
如何通过在 Python 3.x 上按键来启动和中断循环

我有这段代码当按下 P 键时会中断循环但除非我按下非 P 键否则循环不会工作 def main openGame while True purchase imageGrab if a sum gt 1200 fleaButton ti
如何解决使用 Spark 从 S3 重新分区大量数据时从内存中逐出缓存的表分区元数据的问题？

在尝试从 S3 重新分区数据帧时我收到一个一般错误 Caused by org apache spark SparkException Job aborted due to stage failure Task 33 in stage 1
奇怪的 MySQL Python mod_wsgi 无法连接到 'localhost' (49) 上的 MySQL 服务器问题

StackOverflow上也有类似的问题但我还没有发现完全相同的情况这是在使用 MySQL 的 OS X Leopard 机器上一些起始信息 MySQL Server version 5 1 30 Apache 2 2 13 Uni
将 matplotlib 颜色图集中在特定值上

我正在使用 matplotlib 颜色图 seismic 绘制绘图并且希望白色以 0 为中心当我在不进行任何更改的情况下运行脚本时白色从 0 下降到 10 我尝试设置 vmin 50 vmax 50 但在这种情况下我完全失去了白色关
将 JSON 对象传递给带有请求的 url

所以我想利用 Kenneth 的优秀请求模块 https github com kennethreitz requests 在尝试使用时偶然发现了这个问题自由库API http wiki freebase com wiki API 基本上
Python 将日志滚动到变量

我有一个使用多线程并在服务器后台运行的应用程序为了无需登录服务器即可监控应用程序我决定包括Bottle http bottlepy org为了响应一些HTTP端点并报告状态执行远程关闭等我还想添加一种查阅日志文件的方法我可以使用以
python Soap zeep模块获取结果

我从 SOAP API 得到如下结果 client zeep Client wsdl self wsdl transport transport auth header lb E authenticate self login res cl
使用 PyTorch 分布式 NCCL 连接失败

我正在尝试使用 torch distributed 将 PyTorch 张量从一台机器发送到另一台机器 dist init process group 函数正常工作但是 dist broadcast 函数中出现连接失败这是我在节点 0
当鼠标悬停在上面时，intellisense vscode 不显示参数或文档

我正在尝试将整个工作流程从 Eclipse 和 Jupyter Notebook 迁移到 VS Code 我安装了 python 扩展它应该带有 Intellisense 但它只是部分更糟糕我在输入句点后收到建议但当将鼠标悬停在其上方
字典和数组作为类变量与实例变量

这是赚取积分的简单方法请解释以下内容 class C a b 0 c def init self self x def d self k v self x k v self a k v self b v self c append v d
检查字典键是否有空值

我有以下字典 dict1 city name yass region zipcode phone address tehsil planet mars 我正在尝试创建一个基于 dict1 的新字典但是它不会包含带有空字符串的键它不会包

随机推荐

Scala：如何将“MatchesRegex”细化与包含反引号的正则表达式（细化库）一起使用？

The refined https github com fthomas refined库允许定义与给定匹配的细化regex 如图所示Readme import eu timepit refined import eu timepit re
如何在 Intellij IDEA 中构建和运行 Storm Topology

我按照 Storm Starter 说明并在 IntelliJ 中导入了 Twitter Storm 为了测试我编辑了感叹拓扑一点并使用以下 Maven 命令来构建并运行它 mvn f m2 pom xml compile exec ja
可运行的 JAR 无法与引用的库一起使用

我想创建一个可运行的 JAR 其中包含引用的库即jackson http jackson codehaus org 在 Eclipse 中通过导出过去有fat jar这似乎是 Eclipse 提供导出到可运行 JAR 之前的 goto
foo.Name undefined（类型接口{}没有字段或方法名称）

我使用本机 golang 包 container list 来管理堆栈中的 inotify 事件当我访问堆栈的项目时我的类型失败我认为 import golang org x exp inotify container list lo
C# 接口实现关系只是“Can-Do”关系？

今天有人告诉我 C 中的接口实现只是 Can Do 关系而不是 Is A 关系这与我长期以来所相信的LSP 里氏替换原理相冲突我一直认为所有的继承都应该意味着 Is A 关系所以如果接口实现只是一种 Can Do 关系如果有一
UICollectionView 单元格旋转后不水平

我有一个 UICollectionView 带有一个用于创建单元格的按钮该单元格应按创建顺序显示在空间允许的情况下横向和纵向 1 2 3 4 文本视图受到灵活宽度的限制以填充单元格单元格的大小取决于设备和旋转每行允许 1 2 3
是否可以仅在一张表上运行“symfonydoctrine build --all”任务？

如果我运行以下任务它会构建所有内容并清除数据库 php symfony doctrine build all 我希望此任务仅针对我放入 schema yml 的新表运行是否可以我认为你应该为此使用迁移首先您需要恢复初始状态当模式
实时搜索错误

我正在获取用户偏好和角色一切正常并且数据接收正确默认值放置在单选按钮上以突出显示用户当前拥有的选项我正在使用 Antd Design Table 组件问题当我将用户首选项更改为打印文档时它确实通过数据库的状态成功更改了它但是现
“该网站似乎使用了滚动链接定位效果。这可能不适用于异步平移”

我从 Firefox 收到了这个不寻常的警告它所指的定位效果是div我将旋转作为滚动高度的一个因素我从来没有遇到过任何问题但是这是我应该担心的事情吗如果没有这个警告是否有这样的效果演示此问题的 JavaScript 是 gear
有没有一种有效的方法来优化我的序列化代码？

这个问题缺乏细节因此我决定创建另一个问题而不是编辑这个问题新问题在这里我可以并行化我的代码吗还是不值得 https stackoverflow com questions 17937438 can i parallelize my
将左按钮添加到 UINavigationBar (iPhone)

我创建了一个新的基于导航的 iPhone 应用程序我将其添加到 RootViewController 中 void viewDidLoad super viewDidLoad UIBarButtonItem addButton UIBar
Qt 远程文件浏览器

我想知道是否有人使用过 Qt 远程文件浏览器根据我的理解我有两个选择当涉及到远程文件时将 QFileDilaog 与自定义代理模型结合使用该模型将负责提供远程文件目录结构使用自定义对话框并为本地文件提供标准文件系统模型为远
Windows Phone 7 中的 ASCII 编码

有没有办法在 Windows Phone 7 中使用 ASCIIEncoding 除非我做错了什么Encoding ASCII不存在我需要它来进行 C gt PHP 加密因为 PHP 在 SHA1 加密中仅使用 ASCII 有什么建议么
如何使用 Qt Test 控制 QFileDialog？

我有两个问题我怎样才能访问QFileDialog并使用 Qt Test 模块在文件名字段中写入文件的路径我这么问是因为我正在 Qt 中开发一些 GUI 测试现在我需要打开一个文本文件以下代码创建QFileDialog并获取文件路
以编程方式清除 Silverlight 应用程序存储？

我为一些客户发布了 Silverlight 应用程序我在发布更新时遇到问题我希望当用户最初加载网页时如果他们的应用程序存储比上次更新网站时旧那么this http www softcity com article internet
Outlook Interop C# 排序项目不起作用

我偶然发现了一个问题即 Outlook 项目表排序方法没有给出所需的结果尽管方法 GetLast 始终返回相同的电子邮件项目无论是升序还是降序代码如下 Application olApp new Application NameSp
如何从JSP中获取java类的对象

我有一个结果jsp页面它打印java类的字符串变量有人能给我任何想法吗我使用简单的 httpServlet 作为操作类 Class A String name public void setName this name callMet
如何在机器人框架中使用“Run Keyword If”

我刚刚开始研究机器人框架我正在尝试使用Try Keyword If关键字但我在网上看到的所有示例都在一行中显示了解决方案而我在 RIDE 中有列和行如果当前页面上有一个 ID 为当前状态的按钮那么我想访问 URL www xy
React Router V5 在路由中使用上下文变量的最佳方式

在我的应用程序中我定义了路线如下所示
lxml etree xmlparser 删除不需要的命名空间

我有一个 xml 文档我正在尝试使用 Etree lxml 解析它

lxml etree xmlparser 删除不需要的命名空间

lxml etree xmlparser 删除不需要的命名空间 的相关文章

随机推荐

热门标签

lxml etree xmlparser 删除不需要的命名空间的相关文章