从 XML 文档生成嵌套列表

2024-05-04

在 python 中工作，我的目标是解析我制作的 XML 文档并创建一个嵌套的列表列表，以便稍后访问它们并解析提要。 XML 文档类似于以下代码片段：

<?xml version="1.0'>
<sources>
    <!--Source List by Institution-->
    <sourceList source="cbc">
        <f>http://rss.cbc.ca/lineup/topstories.xml</f>
    </sourceList>
    <sourceList source="bbc">
        <f>http://feeds.bbci.co.uk/news/rss.xml</f>
        <f>http://feeds.bbci.co.uk/news/world/rss.xml</f>
        <f>http://feeds.bbci.co.uk/news/uk/rss.xml</f>
    </sourceList>
    <sourceList source="reuters">
        <f>http://feeds.reuters.com/reuters/topNews</f>
        <f>http://feeds.reuters.com/news/artsculture</f>
    </sourceList>
</sources>

我想要类似嵌套列表的东西，其中最里面的列表将是<f></f>标签和上面的列表将使用源名称创建。source="reuters"将会是路透社。从 XML 文档中检索信息不是问题，我正在这样做elementtree循环检索node.get('source')问题是我无法生成具有所需名称和不同来源所需的不同长度的列表。我已尝试附加，但不确定如何附加到包含检索到的名称的列表。字典会更好吗？在这种情况下，最佳做法是什么？我怎样才能做到这一点？如果需要更多信息，请发表评论，我一定会添加它。

根据您的描述，带有根据源名称的键和根据提要列表的值的字典可能可以解决问题。

这是构建这样一个野兽的一种方法：

from lxml import etree
from pprint import pprint

news_sources = {
    source.attrib['source'] : [feed.text for feed in source.xpath('./f')]
    for source in etree.parse('x.xml').xpath('/sources/sourceList')}

pprint(news_sources)

另一个样本，没有lxml or xpath:

import xml.etree.ElementTree as ET
from pprint import pprint

news_sources = {
    source.attrib['source'] : [feed.text for feed in source]
    for source in ET.parse('x.xml').getroot()}

pprint(news_sources)

最后，如果您对列表推导式过敏：

import xml.etree.ElementTree as ET
from pprint import pprint

xml = ET.parse('x.xml')
root = xml.getroot()
news_sources = {}
for sourceList in root:
    sourceListName = sourceList.attrib['source']
    news_sources[sourceListName] = []
    for feed in sourceList:
       feedName = feed.text
       news_sources[sourceListName].append(feedName)

pprint(news_sources)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

从 XML 文档生成嵌套列表的相关文章

使用特定的类/函数预加载 Jupyter Notebook

我想预加载一个笔记本其中包含我在另一个文件中定义的特定类函数更具体地说我想用 python 来做到这一点比如加载一个配置文件包含所有相关的类函数目前我正在使用 python 生成笔记本并在服务器上自动启动它们因为不同的
元组有什么用？

我现在正在学习 Python 课程我们刚刚介绍了元组作为数据类型之一我阅读了它的维基百科页面但是我无法弄清楚这种数据类型在实践中会有什么用处我可以提供一些需要一组不可变数字的示例吗也许是在 Python 中这与列表有何不同每
如何用python脚本控制TP LINK路由器

我想知道是否有一个工具可以让我连接到路由器并关闭它然后从 python 脚本重新启动它我知道如果我写 import os os system ssh l root 192 168 2 1 我可以通过 python 连接到我的路由器但是
Python 中的哈希映射

我想用Python实现HashMap 我想请求用户输入根据他的输入我从 HashMap 中检索一些信息如果用户输入HashMap的某个键我想检索相应的值如何在 Python 中实现此功能 HashMap
如何使用 opencv.omnidir 模块对鱼眼图像进行去扭曲

我正在尝试使用全向模块 http docs opencv org trunk db dd2 namespacecv 1 1omnidir html用于对鱼眼图像进行扭曲处理Python 我正在尝试适应这一点C 教程 http docs op
将html数据解析成python列表进行操作

我正在尝试读取 html 网站并提取其数据例如我想查看公司过去 5 年的 EPS 每股收益基本上我可以读入它并且可以使用 BeautifulSoup 或 html2text 创建一个巨大的文本块然后我想搜索该文件我一直在使用
将 python2.7 与 Emacs 24.3 和 python-mode.el 一起使用

我是 Emacs 新手我正在尝试设置我的 python 环境到目前为止我已经了解到在 python 缓冲区中使用 python mode el C c C c将当前缓冲区的内容加载到交互式 python shell 中显然使用了什么
您可以格式化 pandas 整数以进行显示，例如浮点数的“pd.options.display.float_format”？

我见过this https stackoverflow com questions 18404946 py pandas formatdataframe and this https stackoverflow com questions
如何将张量流模型部署到azure ml工作台

我在用Azure ML Workbench执行二元分类到目前为止一切正常我有很好的准确性我想将模型部署为用于推理的 Web 服务我真的不知道从哪里开始 azure 提供了这个doc https learn microsoft co
datetime.datetime.now() 返回旧值

我正在通过匹配日期查找 python 中的数据存储条目我想要的是每天选择今天的条目但由于某种原因当我将代码上传到 gae 服务器时它只能工作一天第二天它仍然返回相同的值例如当我上传代码并在 07 01 2014 执行它时它
在Python中检索PostgreSQL数据库的新记录

在数据库表中第二列和第三列有数字将会不断添加新行每次每当数据库表中添加新行时 python 都需要不断检查它们当 sql 表中收到的新行数低于 105 时 python 应打印一条通知消息警告数量已降至 105 以下另一方面
如何使用python在一个文件中写入多行

如果我知道要写多少行我就知道如何将多行写入一个文件但是当我想写多行时问题就出现了但是我不知道它们会是多少我正在开发一个应用程序它从网站上抓取并将结果的链接存储在文本文件中但是我们不知道它会回复多少行我的代码现在如下 r
javascript 是否有等效的 __repr__ ？

我最接近Python的东西repr这是 function User name password this name name this password password User prototype toString function r
pip 列出活动 virtualenv 中的全局包

将 pip 从 1 4 x 升级到 1 5 后pip freeze输出我的全局安装系统软件包的列表而不是我的 virtualenv 中安装的软件包的列表我尝试再次降级到 1 4 但这并不能解决我的问题这有点类似于这个问题 http
如何在 Windows 命令行中使用参数运行 Python 脚本

这是我的蟒蛇hello py script def hello a b print hello and that s your sum sum a b print sum import sys if name main hello sys
Pandas 将多行列数据帧转换为单行多列数据帧

我的数据框如下 code df Car measurements Before After amb temp 30 268212 26 627491 engine temp 41 812730 39 254255 engine eff 15
根据列 value_counts 过滤数据框（pandas）

我是第一次尝试熊猫我有一个包含两列的数据框 user id and string 每个 user id 可能有多个字符串因此会多次出现在数据帧中我想从中导出另一个数据框一个只有那些user ids列出至少有 2 个或更多string
如何在 pygtk 中创建新信号

我创建了一个 python 对象但我想在它上面发送信号我让它继承自 gobject GObject 但似乎没有任何方法可以在我的对象上创建新信号您还可以在类定义中定义信号 class MyGObjectClass gobject GO
Python ImportError：无法导入名称 __init__.py

我收到此错误 ImportError cannot import name life table from cdc life tables C Users tony OneDrive Documents Retirement retirem
使用 z = f(x, y) 形式的 B 样条方法来拟合 z = f(x)

作为一个潜在的解决方案这个问题 https stackoverflow com questions 76476327 how to avoid creating many binary switching variables in gekk

随机推荐

iPhone 中的视频过滤速度很慢

我正在尝试在 iPhone 中过滤视频这是我的程序结构和源代码 AppDelegate h AppDelegate m ViewController h ViewController m AppDelegate 文件与默认文件相同这是我
Git Bash Shell 可以使用默认的 Windows 快捷方式进行复制和粘贴吗？

我希望能够使用 Ctrl C 和 Ctrl V 复制并粘贴到 Git Bash Shell 中但是 shell 具有 Ctrl Insert 和 Shift Insert 作为这些操作我没有看到更改这些快捷键的明显方法我错过了一些明显
android中找不到资源异常

我正在尝试在我的 Android 应用程序中创建一个列表视图但我在运行项目时遇到资源未找到异常 Activity main xml
如何查看某个函数以 3 秒的间隔被调用了多少次？

我想检查我的函数在 3 秒内可以运行多少次我写了这段代码 include
web.config 位置元素中无法识别 InheritInChildApplications 属性

我尝试过包裹我的
如何在 SwiftUI 中导航到另一个视图时消除动画故障

当导航到 SwiftUI 中包含列表的视图时模拟器和真实设备上都会出现动画故障就在导航动画结束时列表项似乎跳了几个像素到其指定位置请参阅以下简单示例内容视图 struct ContentView View var body s
如何使用python将dataframe的行数据转换为json中的列名作为键，行数据作为值

我在转换数据帧的按行数据时遇到问题其中列名作为键行数据作为值我想将此按行 json 传递给另一个 API 作为输入我无法获取此 json 数据 for row in df iterrows out row to json orien
itext更改所有超链接的缩放级别以继承现有pdf中的缩放

我正在使用以下代码将所有超链接的缩放级别更改为继承缩放但无法改变可能我在 PdfName DEST 和条件中犯了一些错误因为第一页的 pdf 中没有 DEST 数组查看屏幕截图 for int count 0 count lt re
如何选中/取消选中 ExpandableListView 内的 CheckedTextView（子项）项？

我的设计我创建了一个自定义适配器 SignalsExpandableListAdapter 与我的 ExpandableListView 的 CheckedTextView public class SignalsExpandableLi
尽管 CRC 错误，仍强制 gzip 解压缩

我认为有办法做到这一点但我不确定如何做基本上我正在编写一个压缩程序当我尝试解压缩压缩数据时该程序导致了 crc 错误通常这意味着解压缩器实际上将我的数据识别为正确的格式并将其解压缩但是当它将结果与 CRC 指示的预期长度进行
Android：如何按下软键盘上方的按钮

我有一个保存按钮我想将其与软键盘一起按下因此当用户单击布局中的 EditText 时按钮必须保持在键盘上方现在该按钮隐藏在键盘下方你怎么做到这一点提前致谢您需要将键盘的输入模式设置为adjustResize 您可以通过将
屏幕截图中低分辨率文本的 OCR

我正在编写一个 OCR 应用程序来从屏幕截图图像中读取字符目前我只关注数字我的方法部分基于这篇博文 http blog damiles com 2008 11 basic ocr in opencv http blog damiles
错误：从列表创建 Spark 数据帧时 TimestampType 无法接受对象

我正在尝试从以下列表创建一个数据框 data 1 abc 2020 08 20 10 00 00 I 1 abc 2020 08 20 10 01 00 U 1 abc 2020 08 21 10 02 00 U 2 pqr 2020 08
如何访问混合对象（stdClass）和数组构造中的特定值？

我的变量如下所示 var dump content object stdClass 5 1 errors gt array 1 0 gt object stdClass 6 2 message gt string 24 Invalid or
Material UI Icons npm 安装问题：无法解析依赖树

问题已解决问题末尾的解决方案我试图安装材质 UI 图标 https mui com components material icons 在我使用 npm 的 Netflix Clone React js 项目中但出现以下错误 PS D
IBM Worklight - $("#pagePort").load() 在 Windows Phone 8 中不起作用

我在用着 pagePort load 用于在我的应用程序的页面之间导航并且它在 Android 模拟器和设备中完美运行但是当我尝试从 Windows Phone 8 模拟器运行我的应用程序时它无法更改其页面为了使changePa
再次对存储库和持久性一无所知

这就是我要做的我有一个通用的存储库类Repository
std::mutex 和 std::shared_mutex 之间的区别

我遇到了一个std shared mutex in C 17 到底是什么std shared mutex以及它有何不同std mutex 如中所述文档 http en cppreference com w cpp thread shared
内存不足异常

我有一个非常占用内存的应用程序它在一些大数组中保存了大量的数据我最近注意到偶尔出现 OutOfMemoryException 这些 OutOfMemoryExceptions 早在我的应用程序 ASP Net 用完可用的 800mb 内
从 XML 文档生成嵌套列表

在 python 中工作我的目标是解析我制作的 XML 文档并创建一个嵌套的列表列表以便稍后访问它们并解析提要 XML 文档类似于以下代码片段

从 XML 文档生成嵌套列表

从 XML 文档生成嵌套列表 的相关文章

随机推荐

热门标签

从 XML 文档生成嵌套列表的相关文章