如何使用 BeautifulSoup 访问命名空间 XML 元素？

2023-12-19

我有一个 XML 文档，其内容如下：

<xml>
<web:Web>
<web:Total>4000</web:Total>
<web:Offset>0</web:Offset>
</web:Web>
</xml>

我的问题是如何使用 python 中的 BeautifulSoup 这样的库来访问它们？

xmlDom.web["Web"].总计？不起作用？

美丽汤 http://www.crummy.com/software/BeautifulSoup/本身不是 DOM 库（它不实现 DOM API）。更复杂的是，您在该 xml 片段中使用了命名空间。要解析特定的 XML 片段，您可以使用 BeautifulSoup，如下所示：

from BeautifulSoup import BeautifulSoup

xml = """<xml>
  <web:Web>
    <web:Total>4000</web:Total>
    <web:Offset>0</web:Offset>
  </web:Web>
</xml>"""

doc = BeautifulSoup( xml )
print doc.find( 'web:total' ).string
print doc.find( 'web:offset' ).string

如果您没有使用命名空间，代码可能如下所示：

from BeautifulSoup import BeautifulSoup

xml = """<xml>
  <Web>
    <Total>4000</Total>
    <Offset>0</Offset>
  </Web>
</xml>"""

doc = BeautifulSoup( xml )
print doc.xml.web.total.string
print doc.xml.web.offset.string

这里的关键是 BeautifulSoup 不知道（或关心）关于命名空间的任何事情。因此web:Web被视为web:web标签而不是作为Web标签属于web命名空间。虽然 BeautifulSoup 添加了web:web到xml元素字典，python语法无法识别web:web作为单个标识符。

您可以通过阅读以下内容了解更多信息文档 http://www.crummy.com/software/BeautifulSoup/documentation.html.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何使用 BeautifulSoup 访问命名空间 XML 元素？的相关文章

使用python查找txt文件中字母出现的次数

我需要从 txt 文件中读取该字母并打印 txt 文件中出现的次数到目前为止我已经能够在一行中打印内容但计数有问题有人可以指导吗 infile open grades txt content infile read for char
稀有对象的 python 类型注释，例如 psycopg2 对象

我了解内置类型但是我如何指定稀有对象例如数据库连接对象 def get connection and cursor gt tuple psycopg2 extensions cursor psycopg2 extensions conn
使用 django-rest-framework 设置对象级权限

尝试使用 django rest framework 最干净最规范地管理 django guardian 对象级权限我想将对象的读取权限 module view object 分配给在执行 POST 时发出请求的用户我的基于阶级的观点
在python中将数据库表写入文件的最快方法

我正在尝试从数据库中提取大量数据并将其写入 csv 文件我正在尝试找出最快的方法来做到这一点我发现在 fetchall 的结果上运行 writerows 比下面的代码慢 40 with open filename a as f writ
Matplotlib：如何有效地将大量线段着色为独立渐变

Python 绘图库如何有效地将大量线段着色为独立渐变已经阅读this https stackoverflow com questions 8500700 how to plot a gradient color line in ma
Python Tkinter 模块不显示输出

我正在尝试学习 Python 并尝试使用 Python 中的 GUI 并遇到了这个 Tkinter 模块我的代码运行但运行时窗口没有出现我的代码如下 from Tkinter import to create a root windo
AttributeError：“模块”对象没有属性[重复]

这个问题在这里已经有答案了我有两个 python 模块 a py import b def hello print hello print a py print hello print b hi b py import a def hi
根据其他单元格值更改多个单元格值

我想更改包含的单元格moving to movingToOpenor movingToClose基于下一个单元格中给出的状态有时循环会被中断并且不会从open to close or close to open 这是我当前的数据框 Dat
从 Flask 运行 NPM 构建

我有一个 React 前端我想在与我的 python 后端 API 相同的源上提供服务我正在尝试使用 Flask 来实现此目的但我遇到了 Flask 找不到我的静态文件的问题我的前端构建是用生成的npm run build in s
如何查找或安装适用于 Python 的主题 tkinter ttk

过去 3 个月我一直在制作一个机器人仅用代码就可以完美运行现在我的下一个目标是为它制作一个 GUI 但是我发现了一些障碍主要的一个是能够看起来不像一个 30 年前的程序我使用的是 Windows 7 我仅使用 Python 3 3
是否需要关闭没有引用它们的文件？

作为一个完全的编程初学者我试图理解打开和关闭文件的基本概念我正在做的一项练习是创建一个脚本允许我将内容从一个文件复制到另一个文件 in file open from file indata in file read out file
使用 Python 将连续日期分组在一起

Given dates datetime 2014 10 11 datetime 2014 10 1 datetime 2014 10 2 datetime 2014 10 3 datetime 2014 10 5 datetime 201
为什么 __dict__ 和 __weakref__ 类从未在 Python 中重新定义？

类创建似乎从来没有re 定义 dict and weakref class属性即如果它们已经存在于超类的字典中则它们不会添加到其子类的字典中但始终re 定义 doc and module class属性为什么 gt gt gt c
如何指示 urwid 列表框的项目数多于当前显示的项目数？

有没有办法向用户显示 urwid 列表框在显示部分上方下方有其他项目我正在考虑类似滚动条的东西它可以显示条目的数量或者列表框顶部底部的单独栏如果这个行为无法实现有哪些方法可以实现这个通知在我的研究过程中我发现这个问题 ht
AWS Lambda 不读取环境变量

我正在编写一个 python 脚本来查询 Qualys API 中的漏洞元数据我在 AWS 中将其作为 lambda 函数执行我已经在控制台中设置了环境变量但是当我执行函数时出现以下错误 module initialization
minizinc python 安装

我通过 anaconda 提示符在 python 上安装了 minizinc 就像其他软件包一样 pip install minizinc 该软件包表示已成功安装我可以导入该模块但是我正在遵循基本示例https minizinc py
如何给URL添加变量？

我正在尝试从网站收集数据我有一个 Excel 文件其中包含该网站的所有不同扩展名 F i www example com example2 我有一个脚本可以成功从网站中提取 HTML 但现在我想为所有扩展自动执行此操作然而当我说 s
pandas 中数据帧中的随机/洗牌行

我目前正在尝试找到一种方法来按行随机化数据框中的项目我在 pandas 中按列洗牌排列找到了这个线程在 pandas 中对 DataFrame 进行改组排列 https stackoverflow com questions 157
如何使用 python 定位和读取 Data Matrix 代码

我正在尝试读取微管底部的数据矩阵条形码我试过libdmtx http libdmtx sourceforge net 它有 python 绑定当矩阵的点是方形时工作得相当好但当矩阵的点是圆形时工作得更糟如下所示另一个复杂问题是在某
IndexError - 具有匀称形状的笛卡尔 PolygonPatch

我曾经使用 shapely 制作一个圆圈并将其绘制在之前填充的图上这曾经工作得很好最近我收到索引错误我将代码分解为最简单的操作但它甚至无法执行最简单的循环 import descartes import shapely geome

随机推荐

如何将 ActiveX 与 ASP.NET 结合使用

我创建了一个 ActiveX 组件但无法在 ASP NET 中访问该 ActiveX 组件使用 JavaScript 创建 ActiveX 对象时它给出 Microsoft JScript 运行时错误自动化服务器无法创建对象错误消
Android - 在视图页面中的不同片段之间导航时隐藏的 FAB

我正在尝试做一些非常简单的事情我希望 FAB 仅出现在 TabLayout 中的一个选项卡上并在导航到另一选项卡时隐藏例如一个选项卡允许您在 FAB 中添加新项目但下一个选项卡不允许您添加项目我遵循典型 XML 设计布局
为什么*这个*不是*这个*？

我刚刚编写了这段代码来表示这个正在杀死我的错误 Grrr 我想知道为什么当我得到错误方法未定义我已经在 Safari 中检查过 parserDidStart 方法中的这个变量不是 EpisodeController 类型而是 Episo
HTML 文件中的 javascript 调试

如何在 javascript 函数的 HTML 页面中放置断点以便在执行行时查看变量的值这样做最简单的方法是什么 thanks 使用关键字调试器尝试调用硬断点只要你的浏览器有JavaScript 调试启用然后调试器语句将告诉它
Spring Boot 设置 SSL 连接时出错

我正在尝试将 Spring Boot 应用程序连接到 PostGresql 数据库但每次我得到error in setting up SSL connection error My application properties文件如下 s
检测 VBA 中是否选择了表单控件选项按钮

我有一个使用 ActiveX 选项按钮可以正常工作的代码但是我希望宏也能在 Mac 上运行因此我尝试用表单控件替换 ActiveX 控件使用 ActiveX 为了检查是否选择了两个选项按钮之一我所要做的就是 Sub OptionB
第一次使用另一个画布作为源参数时，画布绘制图像速度较慢

第一次使用另一个画布作为绘图源时我看到画布绘制速度很慢随后的 canvas 到 canvas drawImage 调用都很好直到我交换图像然后我再次看到相同的问题下面的示例代码加载图像然后创建 4 个画布第一个画布从图像本身
如何在 Stackblitz 项目中加载 JSON？

我在 Stackblitz 工作我的文件之一是一个包含一些数据的 JSON 文件我想将此 JSON 数据放入我的 javascript 文件中index js 但如何呢当我尝试加载它时xhr 像这样 function loadJSON
一对多映射到超类的属性

我有一个超类Questions及其子类MultipleChoiceQuestions 超类有一个字段activity 我想创建一个Set
ActiveMQ Artemis 队列在消费客户端关闭后被删除

I am newbie on JMS and ActiveMQ Artemis and I have the following problem I put a message in a requests queue normally fr
如何在关闭弹出窗口时重新加载父页面？

我在主页上有一个链接按钮条款和条件当使用单击它时会使用此代码显示弹出窗口 Dim myScript As String myScript ScriptManager RegisterStartupScript Me Me GetTyp
如何用“-”或“_”替换URL“ ”？

在YII中如果用于 url 的标题中有空格则默认情况下空格会被号替换像这样的事情 www domain com event view id DJ 罗巴格鲁姆我想做的是我想用破折号或下划线替换号像这样的事情 www
如何解决重复的gradle依赖问题

我尝试用 robolectric 测试我的代码问题是它有重复的参考文献例如 java lang RuntimeException java lang RuntimeException Duplicate class org apach
Flask-restful (python) 无法解析表单数据中的发布数据

我在用Python Flask Restful提出邮寄请求我用邮递员 Chrome 测试我的 api 我将 ContentType 设置为应用程序 json在邮递员的标题部分而且我只能以原始值的形式获取参数当我更改为表单数据时我收到
等待由外部配置程序“pd.csi.storage.gke.io”创建或由系统管理员手动创建卷。 Windows 迷你库

我创建了一个 PVC 然后尝试扩大卷声明的大小卷扩展设置为 true 如下 minikube kubectl get sc NAME PROVISIONER RECLAIMPOLICY VOLUMEBINDINGMODE ALLOWVOL
使用 dpl 在 heroku 上部署不适用于新的 Farady 版本

我在 gitlab 上的 CI CD 使用 dpl 在 heroku 上部署代码它一直像魅力一样工作直到新版本的法拉第我猜这就是原因被获取这是我的 gitlab CI 终端工作时昨天的内容 dpl provider herok
是否可以在没有 Terracotta Enterprise Suite 的情况下使用 Ehcache 实现分布式缓存？

我尝试寻找如何为应用程序实现分布式缓存 Ehcache 已经在我的项目中用于缓存这就是为什么我搜索如何使用它来解决这个问题但不幸的是这似乎需要 Terracotta Enterprise Suite 而且它是商业的不是吗是否有另一
startUsingNetworkFeature 和 requestRouteToHost 在 6.0 中已贬值替代此

用于发送彩信的就绪设备在 Kitkat 中工作正常但在 Pro KitKat 版本中工作正常开始使用网络功能已折旧 final int result mConnMgr startUsingNetworkFeature Connectivi
与 Service Worker 一起存储 REST 请求以同步它们

我正在考虑使用服务人员将我的应用程序离线我已经通过缓存资源获得了令人满意的结果但我还必须检查 onfetch 是否连接到互联网如果没有存储请求并将其推送到同步我知道未来的 onsync 将对此有所帮助但我需要即使是临时解
如何使用 BeautifulSoup 访问命名空间 XML 元素？

我有一个 XML 文档其内容如下

如何使用 BeautifulSoup 访问命名空间 XML 元素？

如何使用 BeautifulSoup 访问命名空间 XML 元素？ 的相关文章

随机推荐

热门标签

如何使用 BeautifulSoup 访问命名空间 XML 元素？的相关文章