如何获取命名空间元素的属性

2024-04-17

我正在解析每天从供应商那里收到的 XML 文档，它大量使用命名空间。我已将问题最小化到最小子集：

我需要解析一些元素，所有这些元素都是具有特定属性的元素的子元素。
我能够使用lxml.etree.Element.findall(TAG, root.nsmap)找到我需要检查其属性的候选节点。

然后我尝试检查每个的属性Elements通过我知道它使用的名称：具体是ss:Name。如果该属性的值是所需的值，我将更深入地研究所述Element（继续做其他事情）。

我怎样才能做到这一点？

我正在解析的XML大致是

<FOO xmlns="SOME_REALLY_LONG_STRING"
 some gorp declaring a bunch of namespaces one of which is 
 xmlns:ss="THE_VERY_SAME_REALLY_LONG_STRING_AS_ROOT"
>
    <child_of_foo>
        ....
    </child_of_foo>
    ...
    <SomethingIWant ss:Name="bar" OTHER_ATTRIBS_I_DONT_CARE_ABOUT>
        ....
        <MoreThingsToLookAtLater>
            ....
        </MoreThingsToLookAtLater>
        ....
    </SomethingIWant>
    ...
</FOO>

我找到了我想要的第一个元素SomethingIWant就像这样（最终我想要它们，所以我找到了所有）

import lxml
from lxml import etree

tree = etree.parse(myfilename)
root = tree.getroot()
# i want just the first one for now
my_sheet = root.findall('ss:RecordSet', root.nsmap)[0]

现在我想得到ss:Name属性来自此元素，以检查它，但我不确定如何？

我知道my_sheet.attrib将向我显示原始 URI，后跟属性名称，但我不希望这样。我需要检查它是否具有特定命名空间属性的特定值。（因为如果它是错误的，我可以完全跳过这个元素进行进一步处理）。

我尝试使用lxml.etree.ElementTree.attrib.get()但我似乎没有得到任何有用的东西。

有任何想法吗？

的优点之一lxml标准 python XML 解析器是lxml完全支持 XPath 1.0 规范xpath()方法。所以我会选择xpath()大多数时候的方法。您当前案例的工作示例：

from lxml import etree

xml = """<FOO xmlns="SOME_REALLY_LONG_STRING"
 xmlns:ss="THE_VERY_SAME_REALLY_LONG_STRING_AS_ROOT"
>
    <child_of_foo>
        ....
    </child_of_foo>
    ...
    <SomethingIWant ss:Name="bar">
        ....
    </SomethingIWant>
    ...
</FOO>"""

root = etree.fromstring(xml)
ns = {'ss': 'THE_VERY_SAME_REALLY_LONG_STRING_AS_ROOT'}

# i want just the first one for now
result = root.xpath('//@ss:Name', namespaces=ns)[0]
print(result)

output :

bar

UPDATE :

修改后的示例演示如何从当前获取命名空间中的属性element :

ns = {'ss': 'THE_VERY_SAME_REALLY_LONG_STRING_AS_ROOT', 'd': 'SOME_REALLY_LONG_STRING'}

element = root.xpath('//d:SomethingIWant', namespaces=ns)[0]
print(etree.tostring(element))

attribute = element.xpath('@ss:Name', namespaces=ns)[0]
print(attribute)

output :

<SomethingIWant xmlns="SOME_REALLY_LONG_STRING" xmlns:ss="THE_VERY_SAME_REALLY_LONG_STRING_AS_ROOT" ss:Name="bar">
        ....
    </SomethingIWant>
    ...

bar

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

xml

xmlparsing

lxml

如何获取命名空间元素的属性的相关文章

Python GTK + webkit - 在 gtk.main() 之后插入 JavaScript

我在终端中尝试了这个一切正常但是如果我在脚本内运行这个我无法在 gtk main 之后插入 JavaScript import gtk import webkit w gtk Window b webkit WebView w add
Tipfy：如何在模板中显示blob？

鉴于在 gae 上使用tipfy http www tipfy org python 以下模型 greeting avatar db Blob avatar 显示 blob 此处为图像的模板标签是什么在这种情况下斑点是一个图像这很棒
通用详细视图 ProfileView 必须使用对象 pk 或 slug 调用

我是 Django 2 0 的新手在访问我的个人资料页面视图时收到此错误它适用于像这样的网址path users
对于相同的查询，MySQL Workbench 比 Python 快得多

MySQL Workbench 中的以下查询需要 0 156 秒才能完成 SELECT date time minute price id FROM minute prices WHERE contract id 673 AND TIMES
scikit-learn 和tensorflow 有什么区别？可以一起使用它们吗？

对于这个问题我无法得到满意的答案据我了解 TensorFlow是一个数值计算库经常用于深度学习应用而Scikit learn是一个通用机器学习框架但它们之间的确切区别是什么 TensorFlow 的目的和功能是什么我可以一起使用它
reStructuredText：README.rst 未在 PyPI 上解析

我有一个托管在 Github 和 PyPI 上的 Python 项目在 Github 上 https github com sloria TextBlob blob master README rst https github com s
返回上个月的日期时间对象

如果 timedelta 在它的构造函数中有一个月份参数就好了那么最简单的方法是什么 EDIT 正如下面指出的那样我并没有认真考虑这一点我真正想要的是上个月的任何一天因为最终我只会获取年份和月份因此给定一个日期时间对象返回的最
如何使用 Celery 多工作人员启用自动缩放？

命令celery worker A proj autoscale 10 1 loglevel info启动具有自动缩放功能的工作人员当创建多个工人时 me mypc projects x celery multi start mywork
PyArmor - 打包为一个可执行文件

当我执行此命令时您好使用 PyArmor pyarmor pack main py 它将它打包到一个名为的文件夹中dist里面包含我的 exe 以及许多 Python 扩展文件据我所知 PyArmor 使用 PyInstaller 来
用于多个窗口的 Tkinter 示例代码，为什么按钮无法正确加载？

我正在编写一个程序应该按一下按钮即可打开一个窗口按另一个按钮关闭新打开的窗口我使用类以便稍后可以将代码插入到更大的程序中但是我无法正确加载按钮 import tkinter as tk class Demo1 tk Frame
如何使用 django-pyodbc (ubuntu 16.04) 配置数据库设置 Django-MSSQL？

我是 Django 新手目前正在尝试使用另一个数据库来保存我的模型即MS SQL 我的数据库部署在docker容器中 903876e64b67 microsoft mssql server linux bin sh c opt mssq
如何分析组合的 python 和 c 代码

我有一个由多个 python 脚本组成的应用程序其中一些脚本正在调用 C 代码该应用程序现在的运行速度比以前慢得多因此我想对其进行分析以查看问题所在是否有工具软件包或只是一种分析此类应用程序的方法有一个工具可以将 python
线性同余生成器 - 如何选择种子和统计检验

我需要做一个线性同余生成器它将成功通过所选的统计测试我的问题是如何正确选择发电机的数字以及我应该选择哪些统计检验我想均匀性的卡方频率测试每代收集10 000个号码的方法将 0 1 细分为10个相等的细分柯尔莫哥洛夫斯米尔
Django Rest Framework POST 更新（如果存在或创建）

我是 DRF 的新手我阅读了 API 文档也许这是显而易见的但我找不到一个方便的方法来做到这一点我有一个Answer与 a 具有一对一关系的对象Question 在前端我曾经使用 POST 方法来创建发送到的答案api answe
更换壳牌管道[重复]

这个问题在这里已经有答案了在 subprocess 模块的 Python 2 7 文档中我找到了以下片段 p1 Popen dmesg stdout PIPE p2 Popen grep hda stdin p1 stdout stdo
在 matplotlib 中绘制多边形的并集[重复]

这个问题在这里已经有答案了我正在尝试绘制几个多边形的并集matplotlib 具有一定的 alpha 水平我当前的代码在交叉点处颜色较深有没有办法让交叉路口与其他地方的颜色相同 import matplotlib pyplot as
如何使用 os.chdir 转到减去最后一步的路径？

例如一个方法传递了一个路径作为参数这个路径可能是 C a b c d 如果我想使用 os chdir 更改为 C a b 怎么办 c 没有最后一个文件夹 os chdir 可以接受命令吗 os chdir 可以采取作为论点是的然
沿轴 0 重复 scipy csr 稀疏矩阵

我想重复 scipy csr 稀疏矩阵的行但是当我尝试调用 numpy 的重复方法时它只是将稀疏矩阵视为对象并且只会将其作为 ndarray 中的对象重复我浏览了文档但找不到任何实用程序来重复 scipy csr 稀疏矩阵的行我
如何在Tensorflow中保存估计器以供以后使用？

我按照教程 TF Layers 指南构建卷积神经网络以下是代码 https github com tensorflow tensorflow blob r1 1 tensorflow examples tutorials layers
在线性布局内的 ScrollView 内并排对齐 TextView

我有一个带有滚动视图的线性布局我想保留它的当前格式但只需将 textView2a 和 textView3a 并排放置而不会破坏我当前的布局格式我已经包含了我最近的尝试但它们似乎不正确提前致谢 Java菜鸟当前有效的 XML

随机推荐

Perl 6 语法与我认为的不匹配

我正在做代码出现第 9 天 http adventofcode com 2017 day 9 您坐了一会儿并记录了流的一部分您的谜题输入这些字符代表组开头的序列并结束于在一个组内有零个或多个其他东西用逗号分隔要么是另一个组
Python 中检查两个冻结集是否相等的时间复杂度

在网上找不到详细信息当比较两个冻结集时 Python 是否会迭代其中一个集合中的元素或者是否检查冻结集的哈希值因为冻结集是可哈希的由于参考文档对此没有任何说明因此它依赖于实现因此除了查看您正在使用的 Python 版本的源代码
Kotlin 中的变量，与 Java 的区别：“var”与“val”？

我在尝试学习Kotlin https en wikipedia org wiki Kotlin programming language 什么是val var and internalKotlin 与 Java 相比 In Java Rad
在 NSTextField 中输入时过滤 NSTable - 自动选择第一行

我有一个NSTextView过滤的字段NSTable表作为用户在输入中键入的内容我已经成功实现了表过滤现在我的目标是自动选择第一个结果表中的第一行并允许用户在键入搜索查询时使用箭头键在结果之间移动在表中的结果之间移动时输入字段
如何在 Windows 上的 Perl 中访问包含空格的路径？

我正在将 Unix Perl 脚本转换为在 Windows 上运行我遇到的问题是路径中含有空格 open IN C Program Files MySQL MySQL Server 5 1 bin mysql exe u root ppw
从 App.xaml.cs 导航

我想将应用程序栏添加到我的应用程序的多个页面因此我将应用程序栏定义为应用程序资源以便它可以被多个页面使用现在这些按钮的事件处理程序位于App这里提到的类http msdn microsoft com en us library h
如何确定所选节点是 TreeView 中的子节点还是父节点？

如何判断所选节点是子节点还是父节点TreeView控制具体如何实现此类检查取决于您如何定义子和父节点但每个都暴露了两个属性TreeNode提供重要信息的对象 The Nodes财产 http msdn microsoft com
如何编写本地化的屏幕键盘

我必须为我们公司的程序编写一个屏幕键盘该程序主要用于具有触摸功能的工业PC 我们不能使用windows默认键盘因为我们不需要键盘上的所有按键所以我被要求用 C 编写一个自定义的我已经找到了这个博客 http www siao2 co
pandas - 数据框中唯一行出现的数量

如何计算每个唯一行的出现次数DataFrame data x1 A B A A B A A A x2 1 3 2 2 3 1 2 3 df pd DataFrame data df x1 x2 0 A 1 1 B 3 2 A 2 3 A 2
AWS Lambda：无法导入模块

请原谅我我对 Lambda 和 Node 都是新手我正在尝试复制this https gist github com bhberson 7a2847888596e67fd69bgit 使用 AWS IoT 按钮订购披萨我当前的代码是
根据屏幕尺寸有固定方向

我在手机上构建了一个 Android 应用程序现在我要更新该应用程序以支持平板电脑尺寸的屏幕特别是 Galaxy Tab 10 1 我弄清楚了整个res layout的事情所以没关系但是我构建的应用程序具有固定的屏幕方向Andro
iPhone 平台的开源框架/项目 [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我正在寻找适用于 iPhone 平台的开源框架项目集合我发现了很多好的框架和资源例如ASIHTTP
使用 appSettings 配置自定义 Serilog 接收器

我创建了一个新的 Serilog 自定义接收器并尝试通过 appSettings 配置它自定义接收器名为 DiagnosticsBroadcaster 它的 LoggerSinkConfiguration 扩展是 public stat
更新 WooCommerce 产品价格和库存

我有外部 REST API 我从中构建一个如下所示的数组 arr array 1 gt array code gt 0100686 qty gt 2 price gt 65 22 2 gt array code gt 0100687 qty
使用groupSVGElements后如何选择子元素

我正在将 svg 加载到具有子元素的 Fabric 中我使用 groupSVGElements 对它们进行分组我需要能够选择每个子元素这是一个 onclick 事件允许我选择一个子对象我把这个小提琴放在一起http jsfiddl
如何从 WebAPI 中的自定义绑定器调用默认模型绑定？

我在 WebAPI 中有一个自定义模型绑定器它使用 Sytem Web Http ModelBinding 命名空间中的以下方法该方法is用于为 Web API 创建自定义模型绑定程序的正确命名空间 public bool BindMo
如何在 Prolog 中为变量（如字符串）分配多个值？

今天早些时候我寻求帮助以在序言中构建数据库以及如何通过参数搜索有人提出了这个您还可以向每个处理器添加术语列表例如 processor pentium g4400 brand intel family pentium series g
如何从两个不同的数组中替换 numpy 数组的元素

对于数组 array2 np array np nan np nan np nan np nan 45 np nan 33 np nan np nan 32 np nan np nan 44 np nan 10 53 np nan 我需要按
Angular w/Jest：“verify()”与“expectOne()”？

我有一个失败的测试我不知道如何修复我从 Jest 收到的错误消息似乎是矛盾的问题与两个人的行为有关Angular HttpTestingController https angular io api common http testi
如何获取命名空间元素的属性

我正在解析每天从供应商那里收到的 XML 文档它大量使用命名空间我已将问题最小化到最小子集我需要解析一些元素所有这些元素都是具有特定属性的元素的子元素我能够使用lxml etree Element findall TAG root

如何获取命名空间元素的属性

如何获取命名空间元素的属性 的相关文章

随机推荐

热门标签

如何获取命名空间元素的属性的相关文章