Python ElementTree 模块：使用“find”、“findall”方法时如何忽略 XML 文件的命名空间来定位匹配元素

2024-02-11

我想用的方法findall定位源 xml 文件的某些元素ElementTree module.

但是，源 xml 文件 (test.xml) 具有命名空间。我截断了 xml 文件的一部分作为示例：

<?xml version="1.0" encoding="iso-8859-1"?>
<XML_HEADER xmlns="http://www.test.com">
    <TYPE>Updates</TYPE>
    <DATE>9/26/2012 10:30:34 AM</DATE>
    <COPYRIGHT_NOTICE>All Rights Reserved.</COPYRIGHT_NOTICE>
    <LICENSE>newlicense.htm</LICENSE>
    <DEAL_LEVEL>
        <PAID_OFF>N</PAID_OFF>
        </DEAL_LEVEL>
</XML_HEADER>

示例Python代码如下：

from xml.etree import ElementTree as ET
tree = ET.parse(r"test.xml")
el1 = tree.findall("DEAL_LEVEL/PAID_OFF") # Return None
el2 = tree.findall("{http://www.test.com}DEAL_LEVEL/{http://www.test.com}PAID_OFF") # Return <Element '{http://www.test.com}DEAL_LEVEL/PAID_OFF' at 0xb78b90>

虽然使用"{http://www.test.com}"可行，在每个标签前面添加命名空间非常不方便。

使用类似函数时如何忽略名称空间find, findall, ...?

最好不要修改 XML 文档本身，而是对其进行解析，然后修改结果中的标签。这样您就可以处理多个命名空间和命名空间别名：

from io import StringIO  # for Python 2 import from StringIO instead
import xml.etree.ElementTree as ET

# instead of ET.fromstring(xml)
it = ET.iterparse(StringIO(xml))
for _, el in it:
    _, _, el.tag = el.tag.rpartition('}') # strip ns
root = it.root

这是基于讨论here http://bugs.python.org/issue18304.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

namespaces

find

elementtree

findAll

Python ElementTree 模块：使用“find”、“findall”方法时如何忽略 XML 文件的命名空间来定位匹配元素的相关文章

python中的编码检测库[重复]

这个问题在这里已经有答案了这在某种程度上与我的问题有关here https stackoverflow com questions 2305997 unicodedecodeerror problem with mechanize 我处理
QSortFilterProxyModel + QAbstractItemModel modelIndex.internalPointer() 导致崩溃

我在 PyQt 4 8 Python 2 7 中实现了自己的 QAbstractItemModel class FriendListModel QtCore QAbstractItemModel def init self groups c
使用 Marshmallow 中的数据更新行 (SQLAlchemy)

我正在使用 Flask Flask SQLAlchemy Flask Marshmallow marshmallow sqlalchemy 尝试实现 REST api PUT 方法我还没有找到任何使用 SQLA 和 Marshmallow
使用 Flask SQLAlchemy 进行表（模型）继承

我遵循了这个建议question https stackoverflow com questions 1337095 sqlalchemy inheritance但我仍然收到此错误 sqlalchemy exc NoForeignKeysE
同情因子简单关系

我在 sympy 中有一个简单的因式分解问题无法解决我在 sympy 处理相当复杂的积分方面取得了巨大成功但我对一些简单的事情感到困惑如何得到 phi 2 2 phi phi 0 phi 0 2 8 因式分解 phi phi 0 2
将 stdout 重定向到 Python 中的文件？ [复制]

这个问题在这里已经有答案了如何将 stdout 重定向到 Python 中的任意文件当长时间运行的 Python 脚本例如 Web 应用程序从 ssh 会话内启动并处于后台并且 ssh 会话关闭时应用程序将引发 IOError
Python - 为什么这段代码被视为生成器？

我有一个名为 mb 的列表其格式为 Company Name Rep Mth 1 Calls Mth 1 Inv Totals Mth 1 Inv Vol Mth 2 等等在下面的代码中我只是添加了一个包含 38 个 0 的新列表这
Python 中的二进制相移键控

我目前正在编写一些代码以使用音频转换通过激光传输消息文件和其他数据我当前的代码使用 python 中 binascii 模块中的 hexlify 函数将数据转换为二进制然后为 1 发出一个音调为 0 发出不同的音调这在理论上是
用于打印 C/C++ 文件的所有函数定义的 Python 脚本

我想要一个 python 脚本来打印 C C 文件中定义的所有函数的列表 e g abc c定义两个函数为 void func1 int func2 int i printf d i return 1 我只想搜索文件 abc c 并打印其中
如何通过 Python socket.send() 发送字符串以外的任何内容

我对 Python 编程非常陌生但出于必要我必须快速地将一些东西组合在一起我正在尝试通过 UDP 发送一些数据除了当我执行 socket send 时我必须以字符串形式输入数据之外一切都正常这是我的程序这样你就可以看到我在做
Python 3.x 中的 PIL ImageTk 等效项

我正在使用 Tkinter 开发一个应用程序它使用以下数据库png图标的图像文件为了在应用程序中使用所述图像我使用 PIL 打开它们Image open 运行它通过ImageTk PhotoImage函数然后将其传递给小部件构造函数
Python3模拟用另一个函数替换函数

如何使用 python 中的另一个函数来模拟一个函数该函数也将提供一个模拟对象我有类似以下操作的代码 def foo arg1 arg2 r bar arg1 does interesting things 我想替换的实现bar函数让
如何通过facebook-sdk python api获取用户帖子？

我使用 facebook jssdk 授权我的应用程序读取用户个人资料和用户帖子 FB login function response scope user status user likes user photos user videos
出现意外的关键字参数“timeout”（Python 中的 google-cloud-storage）

使用 google cloud storage 的 Python 项目在本地运行良好但是当它从 App Engine 运行时会显示错误 Traceback most recent call last File opt python3 7
Python将csv数据导出到文件中

我有以下运行良好的代码但我无法修剪数据并将其存储在数据文件中 import nltk tweets love this car this view amazing not looking forward the concert def g
如何创建指向指针数组的 Python ctypes 指针

我需要学习如何处理char 在下面的 C 方法中通过 Python ctypes 我通过使用调用其他只需要单个指针的方法做得很好create string buffer 但此方法需要一个指向指针数组的指针 ladybugConvertToM
if/else 在 while 循环内正确缩进[关闭]

Closed 这个问题是无法重现或由拼写错误引起 help closed questions 目前不接受答案我开始学习 Python 编程大约几周了我遇到了一些麻烦下面的代码是一个小程序用于检查列表中是否有偶数如果找到第一个偶数
如何在包更新之间保留数据文件？

我正在使用data files的论证setuptools setup 将配置文件安装到 etc和用户主目录但是更新包pip install
通过子类化 `io.TextIOWrapper` 来子类化文件 - 但它的构造函数有什么签名？

我正在尝试子类化io TextIOWrapper下列的这个帖子 https stackoverflow com a 23796737 974555 虽然我的目标不同以此开始注意动机 https stackoverflow com a
Elastic Beanstalk 上的 Django + MySQL - 查询 MySQL 时出错

当我在 Elastic beanstalk 上托管的 Django 应用程序上查询 MySQL 时出现错误错误说 admin login 处出现操作错误 1045 用户 adminDB 172 30 23 5 的访问被拒绝使用密码 Y

随机推荐

永远保留此构建选项 - Jenkins

我知道有一个Keep this build forever詹金斯上的按钮对此我有一个疑问我有一个由一项主要工作和许多子工作分为各个阶段组成的配置我想知道如果我点击主作业中的按钮子作业中的文物是否也会永久存储或者我应该进入每个子
如何检索 YouTube 上直播活动的开始时间？

我正在尝试返回并将已完成或正在进行的实时事件与现实世界的时间戳例如 Twitter 的逐个播放同步我不拥有相关的实时事件显然这仅对可以倒带或重播的事件有用例如许多与游戏相关的广播有没有办法检索现场活动的开始时间我尝试过以下方
无法使用创建的新用户登录 sql server

我创建了一个名为登录测试 SQL 身份验证然后我创建了一个名为usertest通过此登录用户创建成功我将身份验证模式更改为混合模式并重新启动了 SQLSERVERAGENT 和 MSSQLSERVER 服务当我尝试使用创建的新用户
我可以将 TypeScript 类型定义为 typeof 的所有可能结果值吗？

我希望将类型定义为使用typeof某物上的操作员本质上我正在寻找一种更快的方法来做到这一点而不需要任何类型的中间函数或变量 function getTypeOf value any return typeof value type T
从 dcm4che2 迁移到 dcm4che3

我使用了下面提到的来自此存储库的 dcm4che2 APIhttp www dcm4che org maven2 dcm4che http www dcm4che org maven2 dcm4che 在我的java项目中 dcm4che
从 Linux 连接到 Windows IPython 内核

我有一台 Windows 机器我在其中启动 IPython 内核来做一些在另一台机器上不可能做的事情我有一台 Linux 机器我想从它连接到 Windows 机器上运行的 IPython 内核我可以通过 SSH 从 Linux 计
Django 二进制或 BLOB 模型字段

我有一个 C 程序可以将 pdf 插入 MySQL 数据库中现在我想通过 django 检索该 pdf 但 django 的models FileField需要一个上传到参数这意味着在幕后它实际上将文件存储在文件系统上而不是数据库
Magick Image 在图像后面创建阴影

已经尝试了一段时间现在尝试使用以下代码获得阴影 using MagickImage image new MagickImage C Users David Pictures YnTf9 png MagickImage shadow new
VB.NET：如何动态选择列表视图项？

我需要根据之前选择的内容动态选择列表视图中的项目从数据库中检索过去选择的项目并将其添加到 Arraylist 中然后需要从许多不同的列表视图中选择这些项目像这样通过索引执行此操作listRef1 Items 2 Checked Tru
内容后出现随机空白（Webkit 浏览器错误）

我的服务页面底部出现未知的空白我在用着column count 2 将图像分成两列更新这是 Webkit 浏览器问题问题是底部的额外空间mainCont 左侧栏如果图像全部对齐那么就会有大约 30 像素的不需要的空白不过如果
运行 Haskell 代码时的架构 x86_64、Haskell OSX iconv

当我在计算机上编译有效的 Haskell 代码时它抛出了架构 x86 64 的错误它在我朋友的具有相同架构的计算机上运行良好 ghc make BoardMain hs Linking BoardMain Undefined symbo
Android Studio - Vanguard 检测到（检测到不兼容的软件），但它甚至没有作为进程安装或打开

Android studio 昨天工作正常今天我启动了 android studio 突然它抛出检测到不兼容的软件我没有安装 Riot Vanguard 不久前删除了它我仔细检查以找到安装我找不到东西为什么Android stu
如何使用 NGINX 入口控制器从 Cloudflare 恢复原始客户端 IP

我使用 Cloudflare 作为 CDN 它隐藏了客户端的真实 IP 地址我使用 NGINX 入口控制器作为在 Google Kubernetes 引擎中运行的负载均衡器所以我尝试恢复原始 IP 地址并尝试点击此链接https sup
夏令时时间戳计算

中欧夏令时从三月的最后一个星期日开始我们将时钟设置为 02 00 至 03 00 如果我在数据库请求中进行时间戳计算假设在 01 59 会发生什么情况 UPDATE sessions SET aliveuntil CURRENT TIM
如何将包含（图像标签和一些文本）的 HTML 代码或数据转换为图像以供下载

我想将一些 Html 代码渲染为图像以供我的网站下载我正在使用 html2canvas 它可以很好地为文本创建图像但我想从 html div img text paragraph 创建图像我正在使用下面的代码将 html 渲染为图像
将二进制数转换为十进制数

我需要一个程序来将 Java 或 C 中的二进制数转换为十进制数有人可以帮助我吗 Java String binary 110010101011 int decimal Integer parseInt binary 2 C includ
Python imaplib：正确显示非 ASCII 字符

我正在使用 Python 3 5 和imaplib从 GMail 获取电子邮件并打印其正文正文包含非 ASCII 字符这些以一种奇怪的方式编码我不知道如何解决这个问题 import email import imaplib c im
在 IE 中用 ngOnit() 编写时，可观察订阅不起作用

我定义了一个行为主体组件 ts bsub1 BehaviorSubject
如何加载特定控制器的钩子

我是 codeigniter 的新手我想加载管理面板控制器的挂钩 hook post controller constructor array class gt AdminData function gt myfunction filen
Python ElementTree 模块：使用“find”、“findall”方法时如何忽略 XML 文件的命名空间来定位匹配元素

我想用的方法findall定位源 xml 文件的某些元素ElementTree module 但是源 xml 文件 test xml 具有命名空间我截断了 xml 文件的一部分作为示例

Python ElementTree 模块：使用“find”、“findall”方法时如何忽略 XML 文件的命名空间来定位匹配元素

Python ElementTree 模块：使用“find”、“findall”方法时如何忽略 XML 文件的命名空间来定位匹配元素 的相关文章

随机推荐

热门标签

Python ElementTree 模块：使用“find”、“findall”方法时如何忽略 XML 文件的命名空间来定位匹配元素的相关文章