BeautifulSoup XML 仅打印第一行

2024-03-28

我正在使用 BeautifulSoup4 （和 lxml）来解析 XML 文件，由于某种原因，当我打印 soup.prettify() 时，它只打印第一行：

from bs4 import BeautifulSoup

f = open('xmlDoc.xml', "r")

soup = BeautifulSoup(f, 'xml')

print soup.prettify()

#>>> <?xml version="1.0" encoding="utf-8"?>

知道为什么它没有抓住一切吗？

UPDATE:

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>

<!-- Data Junction generated file.
Macro type "1000" is reserved. -->
<djmacros>
  <macro name="Test" type="5000" value="TestValue">
    <description>test</description>
  </macro>
  <macro name="AnotherTest" type="0" value="TestValue2"/>
  <macro name="TestLocation" type="1000" value="C:\RandomLocation">
    <description> </description>
  </macro>
<djmacros>

文件位置位于 EOF 处：

>>> soup = BeautifulSoup("", 'xml')
>>> soup.prettify()
'<?xml version="1.0" encoding="utf-8">\n'

或者内容不是有效的 xml：

>>> soup = BeautifulSoup("no <root/> element", 'xml')
>>> soup.prettify()
'<?xml version="1.0" encoding="utf-8">\n'

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

xml

beautifulsoup

BeautifulSoup XML 仅打印第一行的相关文章

Celery计划任务中的打印语句不会出现在终端中

当我跑步时celery A tasks2 celery worker B我想看到每秒打印芹菜任务目前没有打印任何内容为什么这不起作用 from app import app from celery import Celery from
带有指针数组的 cython

我在 python 中有一个 numpy ndarrays 列表具有不同的长度并且需要非常快速地访问 python 中的列表我认为指针数组就可以解决问题我试过 float type t list of arrays no of ar
如何使用 pandas 选择所有非 NaN 列和非 NaN 最后一列？

如果标题有点令人困惑请原谅我假设我有test h5 下面是使用读取该文件的结果df read hdf test h5 testdata 0 1 2 3 4 5 6 0 123 444 111 321 NaN NaN NaN 1 12 2
带括号的上下文管理器

我试图了解新的新内容带括号的上下文管理器Python 3 10 中的功能新功能中的顶部项目here https docs python org 3 10 whatsnew 3 10 html 我的测试示例是尝试编写 with open f
帮助需要在可选条件下编写正则表达式[关闭]

我有一个日志文件包含如下内容 log Using data from yyyy mm dd 2011 8 3 0 files queued for scanning Warning E test H ndler pdf File not F
通过鼻子测试检查某个函数是否发出警告

我正在使用编写单元测试nose http somethingaboutorange com mrl projects nose 0 11 2 我想检查函数是否引发警告该函数使用warnings warn 这是很容易就能做到的事情吗 def
在加载“cv2”二进制扩展期间检测到递归

我有一个小程序在 pyinstaller 编译后返回 opencv 错误但无需编译即可工作我在 Windows 10 上使用 Python 3 8 10 Program 导入 pyautogui将 numpy 导入为 np导入CV2
在ansible中合并字典

我目前正在构建一个使用 ansible 安装 PHP 的角色并且在合并字典时遇到一些困难我尝试了多种方法来做到这一点但我无法让它像我想要的那样工作 A vars file my default values key value my
Floyd-Warshall 算法：获取最短路径

假设一个图由一个表示n x n维数邻接矩阵我知道如何获得所有对的最短路径矩阵但我想知道有没有办法追踪所有最短路径 Blow是python代码实现 v len graph for k in range 0 v for i in range
如何在 Python 中仅列出 zip 存档中的文件夹？

如何仅列出 zip 存档中的文件夹这将列出存档中的每个文件夹和文件 import zipfile file zipfile ZipFile samples sample zip r for name in file namelist pr
PyQt - 如何检查 QDialog 是否可见？

我有个问题我有这个代码 balls Ball for i in range 1 10 因此当我说 Ball 时这将在 QDialog 上绘制一个球然后当这完成后我正在移动球QDialog无限循环中我想说类似的话while QDi
请求response.iter_content()获取不完整的文件（1024MB而不是1.5GB）？

您好我一直在使用此代码片段从网站下载文件到目前为止小于 1GB 的文件都很好但我注意到 1 5GB 文件不完整 s is requests session object r s get fileUrl headers headers
如何将 pytest 装置与 django TestCase 一起使用

我如何在TestCase方法类似问题的几个答案似乎暗示我的例子应该有效 import pytest from django test import TestCase from myapp models import Category py
使用 foreach 循环和 XmlNodeList C# 将新节点附加到节点列表

目前我处理的是这样的XML类型 XML FILE http 20drive google com open id 0By5BxgNi9eGcRldxcEZNU0FDTzQ 参考XML文件我想检查一个节点如果找不到该节点我必须将该节点附
从 Python 中编译的正则表达式中提取命名组正则表达式模式

我有一个 Python 正则表达式其中包含多个命名组但是如果先前的组已匹配则可能会错过与一组匹配的模式因为似乎不允许重叠举个例子 import re myText sgasgAAAaoasgosaegnsBBBausgisego
django 组合对两个不同基本模型的查询

我有两个不同的查询集我想将两个查询集合并 q1 tbl nt 123 objects values list id value geometry filter restriction height exclude condition id
在 Tensorflow 2.0 中的简单 LSTM 层之上添加 Attention

我有一个由一个 LSTM 和两个 Dense 层组成的简单网络如下所示 model tf keras Sequential model add layers LSTM 20 input shape train X shape 1 trai
如何让你的精灵在pygame中跳跃

目前我已经制作了一个平台游戏可以左右移动我的角色他从地上开始关于如何让他跳的任何想法因为我不明白目前如果我按住向上键我的玩家精灵将连续向上移动或者如果我按下它我的玩家精灵将向上移动并保持向上我想找个办法远离他让我重新跌
不明确的 XML 模式

我正在尝试为 XML 生成一个非常简单的 XML 架构类似于以下内容
Shap - 颜色条不显示在摘要图中

显示summary plot时不显示颜色条 shap summary plot shap values X train 我尝试过改变plot size 当绘图较高时会出现颜色条但它非常小看起来不应该 shap summary plo

随机推荐

新手：“rake -T”时出现错误消息

我在用红宝石企业版对于我的项目当我检查我所有的耙任务通过运行命令rake T 我收到以下错误消息 You have already activated rake 0 9 2 2 but your Gemfile requires rake
Spring Security 访问因缺少角色而被拒绝记录

对于 Spring Security 中的访问被拒绝登录是否有开箱即用的解决方案我想要的基本上是显示用户在收到访问被拒绝异常时缺少哪个角色如果没有我必须走上拥有自己的 accessDeniedHandler 的道路如何访问在该控制
RESTful 资源和正交资源问题

如果我使用的 3 层应用程序具有通过 HTTP 访问的中间层中的面向 RESTful 资源的服务那么向 UI 层提供正交资源的最佳方式是什么一个例子是用户资源它具有一个国家地区的字段属性现在在 UI 层中编辑用户时我希望能
WordPress，使用 cookie 进行类别重定向

我想要实现的目标当用户访问该网站并选择特定类别时他们下次访问该网站回访用户时该页面将在该类别部分打开我认为通过在访问者单击类别链接或加载类别页面时时设置 cookie 这将相当容易做到当它们返回以下时间时将读取 coo
在 Django/mod_wsgi 虚拟环境中配置 WSGIPythonHome 的问题

我在 Windows 10 上运行 Python 3 7 1 和 Apache 2 4 38 我设置了一个虚拟环境其中包含通过 pip 安装的 Django 2 2 5 和 mod wsgi 4 6 5 在 httpd conf 内部我
如何获取字符串中所有匹配的位置？

我有一个专栏flag acumu在 PostgreSQL 的表中其值如下 SSNSSNNNNNNNNNNNNNNNNNNNNNNNNNNNNSNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 我需要用 S 显
“user-images.githubusercontent.com”上的图像可以删除吗？

我不小心在 GitHub 上上传了一张我不想放的图片我原以为出于示例目的我已经从上传的图像中删除了私人信息但私人信息仍然存在它包含诸如主机名之类的内容我希望这些内容不是公开的有没有办法从 github 的图像注册表中删除该图像
到本地主机的 New-PSSession 失败

我有一个打开本地主机远程会话的脚本我需要这个来从登录脚本中在某些设备上安装 NuGet Username Admin Password ConvertTo SecureString adminPW AsPlainText Force ad
getElementsByClassName onclick 问题[重复]

这个问题在这里已经有答案了我在用着罗伯特尼曼的 http robertnyman com 2008 05 27 the ultimate getelementsbyclassname anno 2008 脚本来获取文档中具有相同类的所有
使用非 root 且无需 CPAN 安装 Perl 模块和依赖项

我一直在为我的工作编写 Perl 脚本而我工作的机器使安装 Perl 模块变得困难我们不能有gcc出于安全原因在我的机器上所以对于大多数模块我无法使用 CPAN 来安装模块我无权访问 root 帐户通常当我想安装模块时我会
朱莉娅：当我有情节时如何找到最佳拟合曲线/方程？

朱莉娅当我有情节时如何找到最佳拟合曲线方程我有一个用地图绘制的图但我需要找到一个适合这个的二次方程正如评论中所说情节在这里并不重要只有数据本身是您可以使用诸如GLM构建数据的广义线性模型并可能绘制它们或使用它们来预测新
请求的运行时 (python-) 不适用于此堆栈 (heroku-20)

我在尝试通过 Heroku 部署这个 Flask 应用程序时遇到了困难我研究了多种方法来解决这个问题但似乎找不到一种可行的方法这就是当我推动时我得到的git push heroku master remote gt Building
Dev-C++ 输入已跳过

include
.NET 4.0 解决方案中的 NHibernate 1.2

我有一些基于 NHibernate 1 2 的项目我想将它们添加到 NET 4 0 解决方案中但我收到 AmbigeousMatchException 无论这些项目是针对2 0还是4 0框架如果我将它们添加到 NET 3 5 解决方案
将刻度转换为时间格式 (hh:mm:ss)

我从网络服务器获取视频长度值作为刻度我想以 hh mm ss 格式显示它我怎样才能在 JavaScript 中做到这一点假设刻度以秒为单位如果不是您可以先将其转换为秒您可以通过查找时间跨度中的整分钟数和小时数然后获取剩余的秒数
我什么时候应该使用解析器？

我在正则表达式中遇到了将代码划分为功能组件的问题它们可能会破裂也可能需要很长时间才能完成这段经历提出了一个问题我什么时候应该使用解析器当您对以下内容感兴趣时应该使用解析器文本的词汇或语义意义当模式可以变化时当您只是想了解时
Java正则表达式正向预测但仅匹配唯一字符？

我正在尝试将字符串输入与以下条件进行匹配第一个字符是unique小写英文字母接下来的字符代表从 1500 到 2020 的当前年份接下来的字符只能是 10 或 100 或 1000 最后一个字符是 0 到 9 之间的数字我创建的正则
在多个数据库上使用 ActiveRecord

我正在编写一个工资系统它将与现有系统集成原始系统有一个主数据库用于处理用户管理和一些全局配置下面有多个结构相同的数据库基本上每个数据库都是一个公司的工资数据库所有这些都与主数据库绑定因为它属于父数据库公司拥有多家子公司每个子
在 matplotlib 底图投影上绘制椭圆

我正在尝试在底图投影上绘制椭圆要画一个像多边形一样的圆有tissot用于绘图的函数天梭的指标 http en wikipedia org wiki Tissot 27s indicatrix如下例所示 from mpl toolkits
BeautifulSoup XML 仅打印第一行

我正在使用 BeautifulSoup4 和 lxml 来解析 XML 文件由于某种原因当我打印 soup prettify 时它只打印第一行 from bs4 import BeautifulSoup f open xmlDoc x

BeautifulSoup XML 仅打印第一行

BeautifulSoup XML 仅打印第一行 的相关文章

随机推荐

热门标签

BeautifulSoup XML 仅打印第一行的相关文章