python sax错误“文档元素后有垃圾”

2024-03-15

我使用 python sax 来解析 xml 文件。 xml文件实际上是多个xml文件的组合。看起来如下：

<row name="abc" age="40" body="blalalala..." creationdate="03/10/10" />
<row name="bcd" age="50" body="blalalala..." creationdate="03/10/09" />

我的Python代码如下。它显示“文档元素后的垃圾”错误。有什么好主意可以解决这个问题。谢谢。

from xml.sax.handler import ContentHandler
from xml.sax import make_parser,SAXException
import sys

class PostHandler (ContentHandler):
    def __init__(self):
        self.find = 0
        self.buffer = ''
        self.mapping={}
    def startElement(self,name,attrs):
        if name == 'row':
             self.find = 1
             self.body = attrs["body"]
             print attrs["body"]
    def character(self,data):
        if self.find==1:
             self.buffer+=data
    def endElement(self,name):
        if self.find == 1:
             self.mapping[self.body] = self.buffer
             print self.mapping
parser = make_parser()
handler = PostHandler()
parser.setContentHandler(handler)
try:
    parser.parse(open("2.xml"))
except SAXException:

xmldata = '''
<row name="abc" age="40" body="blalalala..." creationdate="03/10/10" />
<row name="bcd" age="50" body="blalalala..." creationdate="03/10/09" />
'''

在数据周围添加包装标签。我使用了 ElementTree，因为它更简单，但您可以在任何解析器上执行相同的操作：

from xml.etree import ElementTree as etree

# wrap the data
xmldata = '<rows>' +data + '</rows>'

rows = etree.fromstring(xmldata)
for row in rows:
    print row.attrib

结果是

{'age': '40',
 'body': 'blalalala...',
 'creationdate': '03/10/10',
 'name': 'abc'}
{'age': '50',
 'body': 'blalalala...',
 'creationdate': '03/10/09',
 'name': 'bcd'}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

SAX

python sax错误“文档元素后有垃圾” 的相关文章

Lighttpd 和 cgi python

我正在尝试通过 lighttpd 执行一些 python 脚本但是当我尝试运行它时我只得到一个要求我下载的空白文件 lighttpd conf server modules mod access mod alias mod access
保存为 HDF5 的图像未着色

我目前正在开发一个将文本文件和 jpg 图像转换为 HDF5 格式的程序用HDFView 3 0打开似乎图像仅以灰度保存 hdf h5py File Sample h5 img Image open Image jpg data np
如何使用 opencv.omnidir 模块对鱼眼图像进行去扭曲

我正在尝试使用全向模块 http docs opencv org trunk db dd2 namespacecv 1 1omnidir html用于对鱼眼图像进行扭曲处理Python 我正在尝试适应这一点C 教程 http docs op
将 python2.7 与 Emacs 24.3 和 python-mode.el 一起使用

我是 Emacs 新手我正在尝试设置我的 python 环境到目前为止我已经了解到在 python 缓冲区中使用 python mode el C c C c将当前缓冲区的内容加载到交互式 python shell 中显然使用了什么
独立滚动矩阵的行

我有一个矩阵准确地说是 2d numpy ndarray A np array 4 0 0 1 2 3 0 0 5 我想滚动每一行A根据另一个数组中的滚动值独立地 r np array 2 0 1 也就是说我想这样做 print np
在Python中连接反斜杠

我是 python 新手所以如果这听起来很简单请原谅我我想加入一些变量来生成一条路径像这样 AAAABBBBCCCC 2 2014 04 2014 04 01 csv Id TypeOfMachine year month year
如何在 Python 中解析和比较 ISO 8601 持续时间？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一个 Python v2 库它允许我解析和比较 ISO 8601 持续时间may处于不同单
如何在不丢失注释和格式的情况下更新 YAML 文件 / Python 中的 YAML 自动重构

我想在 Python 中更新 YAML 文件值而不丢失 Python 中的格式和注释例如我想改造 YAML 文件 value 456 nice value to value 6 nice value 界面类似于 y yaml load
在 Sphinx 文档中*仅*显示文档字符串？

Sphinx有一个功能叫做automethod从方法的文档字符串中提取文档并将其嵌入到文档中但它不仅嵌入了文档字符串还嵌入了方法签名名称参数我如何嵌入only文档字符串不包括方法签名 ref http www sphinx do
如何通过索引列表从 dask 数据框中选择数据？

我想根据索引列表从 dask 数据框中选择行我怎样才能做到这一点 Example 假设我有以下 dask 数据框 dict A 1 2 3 4 5 6 7 B 2 3 4 5 6 7 8 index x1 a2 x3 c4 x5 y6 x
Cython 和类的构造函数

我对 Cython 使用默认构造函数有疑问我的 C 类 Node 如下 Node h class Node public Node std cerr lt lt calling no arg constructor lt lt std e
Jupyter Notebook 找不到 Python 模块

不知道发生了什么但每当我使用 ipython 氢原子或 jupyter 笔记本时都找不到任何已安装的模块我知道我安装了 pandas 但笔记本说找不到我应该补充一点当我正常运行脚本时 python script py 它确实导入
如何使用原始 SQL 查询实现搜索功能

我正在创建一个由 CS50 的网络系列指导的应用程序这要求我仅使用原始 SQL 查询而不是 ORM 我正在尝试创建一个搜索功能用户可以在其中查找存储在数据库中的书籍列表我希望他们能够查询书籍表中的 ISBN 标题作者列目前它
如何在 Windows 命令行中使用参数运行 Python 脚本

这是我的蟒蛇hello py script def hello a b print hello and that s your sum sum a b print sum import sys if name main hello sys
Pandas 将多行列数据帧转换为单行多列数据帧

我的数据框如下 code df Car measurements Before After amb temp 30 268212 26 627491 engine temp 41 812730 39 254255 engine eff 15
如何在 pygtk 中创建新信号

我创建了一个 python 对象但我想在它上面发送信号我让它继承自 gobject GObject 但似乎没有任何方法可以在我的对象上创建新信号您还可以在类定义中定义信号 class MyGObjectClass gobject GO
模拟pytest中的异常终止

我的多线程应用程序遇到了一个错误主线程的任何异常终止例如未捕获的异常或某些信号都会导致其他线程之一死锁并阻止进程干净退出我解决了这个问题但我想添加一个测试来防止回归但是我不知道如何在 pytest 中模拟异常终止如果我只
Pandas 每周计算重复值

我有一个Dataframe包含按周分组的日期和 ID df date id 2022 02 07 1 3 5 4 2022 02 14 2 1 3 2022 02 21 9 10 1 2022 05 16 我想计算每周有多少 id 与上周重
在 JavaScript 函数的 Django 模板中转义字符串参数

我有一个 JavaScript 函数它返回一组对象 return Func id name 例如我在传递包含引号的字符串时遇到问题 Dr Seuss ABC BOOk 是无效语法 I tried name safe 但无济于事有什么解
更改 Tk 标签小部件中单个单词的颜色

我想更改 Tkinter 标签小部件中单个单词的字体颜色我知道可以使用文本小部件来实现与我想要完成的类似的事情例如使单词 YELLOW 显示为黄色 self text tag config tag yel fg clr yellow s

随机推荐

C# 中类型转换的最佳实践是什么？ [复制]

这个问题在这里已经有答案了哪种方法是类型转换和检查的最佳实践 Employee e o as Employee if e null DO stuff OR if o is Employee Employee e Employee o DO
CS50 凯撒计划正在运行，但 check50 表示没有运行

我创建了这个程序但在 CS50 上出现错误表明我没有正确执行任何操作要求如下在名为 caesar 的目录中名为 caesar c 的文件中实现您的程序您的程序必须接受单个命令行参数即非负整数为了便于讨论我们将其称为 k 如果
如何本地化 GWT 客户端代码中的枚举值？

我在 GWT 客户端代码中使用枚举类来定义一组类型 public enum MyType FIRST TYPE first SECOND TYPE second THIRD TYPE third private String title p
尝试从 SSIS 包保存大于 ~1.5 MiB 的文件时，EPPlus 2.9.0.1 会抛出 System.IO.IsolatedStorage.IsolatedStorageException

问题当我尝试使用 EPPlus 保存超过 1 5 MiB 的文件时ExcelPackage Save 抛出一个System IO IsolatedStorage IsolatedStorageException 说明我正在创建一个 SS
如何检查 symfony2 中的用户角色，以获取不属于 security.yml 定义的模式的 url？

我有一个管理面板并为其定义了一个角色ROLE ADMIN 在我的 security yml 文件中我使用了一种模式 admin 所以 admin 下的所有内容都需要ROLE ADMIN 现在在我的应用程序的前端我需要检查用户角色以及角
使用情节提要在 CollectionView 中仅显示两列和多行

I want to display only two cells in a row no matter what the iPhone screen size is Like 我的故事板包含一个UICollectionView 通过约束连接
什么是合并冲突？

什么是合并冲突大多数问题都解决了resolving merge conflict like this https stackoverflow com questions 161813 how to resolve merge confli
html.dropdownlist 的 onchange 事件

我正在尝试触发 dropdownlist 的 onchange 事件的操作方法如何在不使用 jquery onchange 的情况下执行此操作 Html DropDownList Sortby new SelectListItem new
无法读取未定义的属性“执行”

我有一个脚本如果命令正确它将运行另一个脚本但它会返回that https i stack imgur com TO4xH png 这是代码获取文件的代码 const fs require fs const settings requ
O(n!) 与 O((n+1)!) 相同吗？

Because O n2 is same as O n k 2 where k is any constant Hence can the above statement be true with the same logic For eg
无法在“DOMWindow”上执行“postMessage”：提供的目标源与收件人窗口的源不匹配（“null”）

我在 Heroku 中有一个游戏现在我试图让它在 Facebook 画布上运行但是虽然它在 Firefox 中运行但在 Chrome 和 IE 中却不行 IE显示一个带有按钮的警告当点击该按钮时它会显示内容在 Chrome 中
Windows shell 命令获取当前目录的完整路径？

是否有 Windows 命令行命令可用于获取当前工作目录的完整路径另外如何将此路径存储在批处理文件中使用的变量中 Use cd如果您直接使用 shell 则不带任何参数或者 cd 如果您想在批处理文件中使用它它的行为类似于环境变量
即使其中一项承诺被拒绝，也不要让整个任务失败

在 redux saga 中如果我们想处理多个 Promise 我们可以使用all 这相当于Promise all yield all users map user gt call signUser user function signU
使用 ProtoBuf-Net 反序列化嵌套动态类型时出现的问题

我正在尝试使用 ProtoBuf Net r668 反序列化一个包含在 DynamicType true 的多层中的对象使用旧版本的 ProtoBuf Net v1 它可以毫无问题地反序列化但是使用最新版本时它会失败 ProtoBu
Android 启动画面图像尺寸适合所有设备

我有一个全屏 PNG 我想在启动时显示只有一个错误我不知道每个可绘制文件夹中放置的大小是多少 ldpi mdpi hdpi and xhdpi 我的应用程序应该在所有手机和平板电脑上运行良好且美观我应该创建什么尺寸以像素为单位才
从任务栏隐藏窗口

我正在尝试开发自己的应用程序用于在桌面上放置笔记类似于 Windows 操作系统下的粘滞便笺一切工作正常但我仍然面临一个问题因为我希望应用程序尽可能最小所以我希望它不要出现在任务栏中这样就不会打扰用户最终我希望它出现在系
SQL XML 导入：XQuery [value()]：预期为“)”

我正在尝试将数据从 XML 数据插入到 SQL 中的表中 XML 文件是从 Microsoft Excel 创建的它具有以下标题
用 C 语言制作一个没有框架的 GUI

我正在学习 C 编程语言的 C 我刚刚完成第 2 章或第 2 单元我浏览到最后发现没有任何关于如何创建 GUI 的内容并且从我查找的内容来看看来我必须使用一个框架但我讨厌这个想法在没有框架的情况下如何创建 GUI 这些框架到底是如
随机图像显示[关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 输出多个图像时最简单的代码或方法是什
python sax错误“文档元素后有垃圾”

我使用 python sax 来解析 xml 文件 xml文件实际上是多个xml文件的组合看起来如下

python sax错误“文档元素后有垃圾”

python sax错误“文档元素后有垃圾” 的相关文章

随机推荐

热门标签