在 Python 中使用 lxml 将 XML 转换为字典

2024-03-10

StackOverflow 上似乎有很多用于将 XML 转换为 Python 字典的解决方案，但它们都没有生成我正在寻找的输出。我有以下 XML：

<?xml version="1.0" encoding="UTF-8"?>
<status xmlns:mystatus="http://localhost/mystatus">
<section1
    mystatus:field1="data1"
    mystatus:field2="data2" />
<section2
    mystatus:lineA="outputA"
    mystatus:lineB="outputB" />
</status>

lxml 有一个优雅简单的解决方案 http://lxml.de/FAQ.html#how-can-i-map-an-xml-tree-into-a-dict-of-dicts将 XML 转换为字典：

def recursive_dict(element):
 return element.tag, dict(map(recursive_dict, element)) or element.text

不幸的是，我得到：

('status', {'section2': None, 'section1': None})

代替：

('status', {'section2': 
                       {'field1':'data1','field2':'data2'}, 
            'section1': 
                       {'lineA':'outputA','lineB':'outputB'}
            })

我无法弄清楚如何在不使 recursive_dict() 函数变得非常复杂的情况下获得所需的输出。

我不受 lxml 的束缚，而且我也可以接受字典的不同组织，只要它为我提供 xml 中的所有信息即可。谢谢！

我个人喜欢xmltodict from here https://github.com/martinblech/xmltodict。使用 pip 你可以像这样安装它pip install xmltodict.

请注意，这实际上创建了OrderedDict对象。用法示例：

import xmltodict as xd

with open('test.xml','r') as f:
    d = xd.parse(f)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

xml

Dictionary

在 Python 中使用 lxml 将 XML 转换为字典的相关文章

美丽的汤从谷歌搜索中提取href

谷歌搜索给出了以下 HTML 的第一个结果 h3 class r a href https rads stackoverflow com amzn click com 0470284889 class l vst em Quantitati
带括号的上下文管理器

我试图了解新的新内容带括号的上下文管理器Python 3 10 中的功能新功能中的顶部项目here https docs python org 3 10 whatsnew 3 10 html 我的测试示例是尝试编写 with open f
帮助需要在可选条件下编写正则表达式[关闭]

我有一个日志文件包含如下内容 log Using data from yyyy mm dd 2011 8 3 0 files queued for scanning Warning E test H ndler pdf File not F
Python 小数.InvalidOperation 错误

当我运行这样的东西时我总是收到此错误 from decimal import getcontext prec 30 b 2 3 Decimal b Error Traceback most recent call last File Te
如何在Python中的BeautifulSoup4中使用.next_sibling时忽略空行

由于我想删除 html 网站中重复的占位符因此我使用 BeautifulSoup 的 next sibling 运算符只要重复项位于同一行就可以正常工作参见数据但有时它们之间有一个空行所以我希望 next sibling 忽略它
流畅的 NHibernate 和 XML 列

我正在从头开始构建一个新站点并正在考虑使用 Fluent NHibernate 作为我的 ORM 我认为它可以轻松处理所有事情可能除了我的 XML 列我从来没有使用 NHibernate 构建过网站尽管我使用过 Hibernate
Python 使用 M2Crypto 通过 S/MIME 对消息进行签名

我现在花了几个小时但找不到我的错误我想要一个简单的例程来创建 S MIME 签名消息稍后可以与 smtplib 一起使用这是我到目前为止所拥有的 usr bin python2 7 coding utf 8 from future
十六进制数的按位异或

我们如何在 Python 中对十六进制数进行异或例如我想要异或 ABCD and 12EF 答案应该是 B922 我使用了下面的代码但它给出了错误的结果 xor two strings of different lengths def
可移植的非关系数据库

我想尝试尝试非关系数据库最好的解决方案是便携式这意味着它不需要安装理想情况下只需将目录复制粘贴到某个地方即可使其工作我不介意第一次使用时是否需要编辑一些配置文件或运行配置工具可从 python 访问适用于 Windows
Selenium：等到 WebElement 中的文本发生变化

我在用着selenium使用Python 2 7 从网页上的搜索框检索内容搜索框动态检索结果并在框本身中显示结果 from selenium import webdriver from selenium webdriver common
在ansible中合并字典

我目前正在构建一个使用 ansible 安装 PHP 的角色并且在合并字典时遇到一些困难我尝试了多种方法来做到这一点但我无法让它像我想要的那样工作 A vars file my default values key value my
InvalidArgumentException：消息：无效参数：“using”必须是字符串

我对 python 很陌生试图创建可重用的代码当我尝试通过传递 Login 类下使用的所有参数来调用 test main py 中的 Login 类和函数 login user 时我收到错误 InvalidArgumentExcept
如何使用 msgpack 进行读写？

如何序列化反序列化字典data with msgpack http msgpack org The Python 文档 http msgpack python readthedocs io en latest badge latest似乎
有没有任何方法可以使用 openpyxl 获取 .xlsx 工作表中存在的行数和列数？

有没有任何方法可以使用 openpyxl 获取 xlsx 工作表中存在的行数和列数在xlrd中 sheet ncols sheet nrows 将给出列数和行数 openpyxl中有这样的方法吗给定一个变量sheet 可以通过以下方式之
x11 - 导入错误：没有名为“kivy.core.window.window_x11”的模块

目前我正在尝试构建一个我通过 buildozer 用 Python 和 Kivy 编写的应用程序无论我在做什么我都会遇到 window x11 的问题即使我在代码中注释掉所有与 Windows 相关的内容或执行本文中描述的所有操作这
Flask SQLAlchemy 与 MyPy - 模型类型错误

我遇到了以下组合问题flask sqlalchemy and mypy 当我定义一个新的 ORM 对象时例如 class Foo db Model pass where db是使用创建的数据库SQL炼金术应用于flask app mypy
如何将 pytest 装置与 django TestCase 一起使用

我如何在TestCase方法类似问题的几个答案似乎暗示我的例子应该有效 import pytest from django test import TestCase from myapp models import Category py
网页抓取 - 如何识别网页上的主要内容

给定一个新闻文章网页来自任何主要新闻来源例如时报或彭博社我想识别该页面上的主要文章内容并丢弃其他杂项元素例如广告菜单侧边栏用户评论在大多数主要新闻网站上都可以使用的通用方法是什么有哪些好的数据挖掘工具或库最好是基于Py
psutil：测量特定进程的CPU使用率

我正在尝试测量进程树的 cpu 使用率目前获取进程没有子进程的 cpu usage 就可以了但我得到了奇怪的结果 import psutil p psutil Process PID p cpu percent 还给我float g
如何让你的精灵在pygame中跳跃

目前我已经制作了一个平台游戏可以左右移动我的角色他从地上开始关于如何让他跳的任何想法因为我不明白目前如果我按住向上键我的玩家精灵将连续向上移动或者如果我按下它我的玩家精灵将向上移动并保持向上我想找个办法远离他让我重新跌

随机推荐

如何查看IntelliJ中的编译错误列表？

我正在寻找一种方法来查看 IntelliJ 中的所有编译错误类似于它们在 Eclipse 中的显示方式我尝试在这里和谷歌搜索但还没有真正找到解决方案我真的很喜欢 IntelliJ 我最近从 Eclipse 转换到它我希望这只是我所
iPhone自定义UINavigationBar按钮

我有一个有 4 个选项卡的应用程序每个选项卡都是一个 UINavigationController 4 个 UINavigationBar 选项卡应该看起来相同具有自定义背景图像自定义后退按钮和触发功能的自定义右键我只想在我的代码中
根据空闲用户使用 Angularjs 自动注销

是否可以使用 angularjs 确定用户是否处于非活动状态并在 10 分钟不活动后自动将其注销我试图避免使用 jQuery 但我找不到任何关于如何在 AngularJS 中执行此操作的教程或文章任何帮助将不胜感激我写了一个模块叫N
是否可以使用 C# 在 Microsoft Bot 框架中开发本地化？

我想要一个支持多种语言的机器人我知道通过本地化这是可能的但我找不到使用 c 的解决方案 Microsoft Bot 框架文档中有一篇有关本地化的文章有一个 Node js 的例子但我是用c 实现的那么任何人都可以给我一个想法或任
继承和接口

这是对此的后续问题question https stackoverflow com questions 267045 is there a benefit to having both an abstract class and an in
逐行构建 pyarrow 表的最快方法

我有一本大字典我想迭代它来构建一个 pyarrow 表字典的值是不同类型的元组需要解压缩并存储在最终 pyarrow 表中的单独列中我确实提前知道了架构键还需要存储为列我有下面的方法可以逐行构建表格是否还有另一种更快的方法对
如何为 Android EditText 设置光标背景透明

当我触摸 Android 上的 EditText 来更改文本时我遇到了这个问题 A white frame appears around the red cursor and I need it to be transparent for
从文本文件中删除带有另一个文件中的行号的行

我有一个文本文件其中包含一个巨大的行号列表我必须从另一个主文件中删除它这是我的数据的样子行 txt 1 2 4 5 22 36 400 and documents txt string1 string2 string3 如果我有一个
Rust中如何处理不精确的浮点运算结果？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案 Rust 中如何处理浮点运算 fn main let vector vec 1 01 f64 1 02 1 03 1 01 1 05
为 zsh + Prezto 主题安装 powerline 字体

我目前正在使用 Zsh Prezto 进行脚本 shell 配置我一直在使用sorin主题但我有点不满意我想切换到paradox https github com paradox460 prezto blob paradox modu
单个项目中的 Identityserver4 和 API

我有一个 IdentityServer4 asp net core 主机设置资源所有者密码授予 http docs identityserver io en release quickstarts 2 resource owner pass
“文档”与“内容.文档”

我正在尝试编写一个 Firefox 扩展将元素添加到加载的页面到目前为止我通过以下方式获取了文档的根元素 var domBody content document getElementsByTagName BODY item 0 并通
WinForms 或 WPF 的文本差异可视化控件

继续我的上一个问题 https stackoverflow com questions 138331 any decent text diffmerge engine for net 有什么好的文本差异可视化控件吗类似于 StackOve
如何以编程方式控制行的切换？

我将 MaterialTable 与 REACT 基于 Material UI Table material table com 的 React 数据表一起使用更准确地说是详细面板 material table com docs fea
使用 Javascript 生成的 cookie（不是由服务器在标头中发送）是否会被攻击者窃取/使用？

我使用 Javascript 保存 cookie 并使用 Javascript 从 cookie 获取值我通过 ajax 标头中的 https 传达 cookie 的内容我不会使用服务器的会话攻击者有什么办法可以获取cookie的内容
在

不允许在堵塞这是可以理解的现在我必须在一个内部传输用户输入的数据堵塞恶意用户可能会输入或两者问题是处理这种情况的首选方法是什么 Strip 替换成空格用错误消息打击用户或者是否有官方的方式来实际传输它们从技术上讲 CDAT

从 BottomNavigationView android 中删除动画/移动模式[重复]

这个问题在这里已经有答案了我正在构建一个应用程序其中有一个 BottomNavigationView 一切正常直到我进入活动导航是这样的问题是它有这个默认动画所以它每次都会将活动元素推得比其他元素更高另一个例子所以我的问题是
为什么响应中没有“Set-Cookie”标头？

我发现有时浏览器无法从我的网站获取 cookie 所以我使用curl检查header 信息为 C Documents and Settings jack gt curl http localhost I HTTP 1 1 200 OK Ex
jQuery .click .animate 向下移动，然后向后移动

到目前为止我设法让它在点击时以 120 的增量向下移动但我希望它向上和向下移动而不是向下移动我希望我已经解释了这一点以便某人能够理解如果我做对了您将需要切换页脚的位置这可以通过 toggle 函数来完成
在 Python 中使用 lxml 将 XML 转换为字典

StackOverflow 上似乎有很多用于将 XML 转换为 Python 字典的解决方案但它们都没有生成我正在寻找的输出我有以下 XML

在 Python 中使用 lxml 将 XML 转换为字典

在 Python 中使用 lxml 将 XML 转换为字典 的相关文章

随机推荐

热门标签

在 Python 中使用 lxml 将 XML 转换为字典的相关文章