Python 中 minidom 的内存错误

2024-01-12

我在 Python 中遇到了带有 minidom 解析器的 MemoryError 。 我正在读取 8000 个小文件(大部分小于 50 Kb),在读取 2500 个后出现此错误...`

Traceback (most recent call last): 

 File "C:\eclipse\plugins\org.python.pydev.debug_2.4.0.2012020116\pysrc\pydevd.py", line 1307, in <module>
    debugger.run(setup['file'], None, None)
  File "C:\eclipse\plugins\org.python.pydev.debug_2.4.0.2012020116\pysrc\pydevd.py", line 1060, in run
    pydev_imports.execfile(file, globals, locals) #execute the script
  File "C:\Users\calculator_2012.py", line 81, in <module>
    file_content, economicFlow, elementaryFlow = XML_reader(spoldFile)
  File "C:\Users\XML_reader.py", line 10, in XML_reader
    xmltree = parse(spold_filename)
  File "C:\Python27\lib\xml\dom\minidom.py", line 1914, in parse
    return expatbuilder.parse(file)
  File "C:\Python27\lib\xml\dom\expatbuilder.py", line 924, in parse
    result = builder.parseFile(fp)
  File "C:\Python27\lib\xml\dom\expatbuilder.py", line 207, in parseFile
    parser.Parse(buffer, 0)
  File "C:\Python27\lib\xml\dom\expatbuilder.py", line 294, in character_data_handler_cdata
    _append_child(self.curNode, node)
  File "C:\Python27\lib\xml\dom\minidom.py", line 274, in _append_child
    def _append_child(self, node):
  File "C:\eclipse\plugins\org.python.pydev.debug_2.4.0.2012020116\pysrc\pydevd.py", line 942, in trace_dispatch
    traceback.print_exc()
  File "C:\Python27\lib\traceback.py", line 232, in print_exc
    print_exception(etype, value, tb, limit, file)
MemoryError

有没有人可以建议一个“无内存泄漏”解析器?


我还建议使用内置的 cElementTree。 Minidom 有很多问题:/

除此之外,lxml 也相当不错,并且具有更多功能。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Python 中 minidom 的内存错误 的相关文章

  • 如何将base64字符串直接解码为二进制音频格式

    音频文件通过 API 发送给我们 该文件是 Base64 编码的 PCM 格式 我需要将其转换为 PCM 然后再转换为 WAV 进行处理 我能够使用以下代码解码 gt 保存到 pcm gt 从 pcm 读取 gt 保存为 wav decod
  • 切片稀疏(scipy)矩阵

    我将不胜感激任何帮助 以理解从 scipy sparse 包中切片 lil matrix A 时的以下行为 实际上 我想根据行和列的任意索引列表提取子矩阵 当我使用这两行代码时 x1 A list 1 x2 x1 list 2 一切都很好
  • JavaScript 相当于 Python 的参数化 string.format() 函数

    这是 Python 示例 gt gt gt Coordinates latitude longitude format latitude 37 24N longitude 115 81W Coordinates 37 24N 115 81W
  • boto3 资源(例如 DynamoDB.Table)的类型注释

    The boto3库提供了几种返回资源的工厂方法 例如 dynamo boto3 resource dynamodb Table os environ DYNAMODB TABLE 我想注释这些资源 以便我可以获得更好的类型检查和完成 但我
  • for 循环如何评估其参数

    我的问题很简单 Does a for循环评估它每次使用的参数 Such as for i in range 300 python 是否会为此循环的每次迭代创建一个包含 300 个项目的列表 如果是的话 这是避免这种情况的方法吗 lst ra
  • 为什么我的代码不能根据字典解码加密字符串?

    我有一本字典 其中包含代表字母的键和值 例如一个简单的 DICT CODE b g n a p o x d t y 我收到了一个加密代码 并将该字符串转换为一个列表 其中每个项目都是一个单词 我需要根据字典中的项目来解决它 代码示例是 wo
  • TF map_fn 或 while_loop 用于不同形状的张量列表

    我想处理不同形状的张量序列 列表 并输出另一个张量列表 考虑每个时间戳上具有不同隐藏状态大小的 RNN 就像是 输入 tf ones 1 2 2 tf ones 2 2 3 tf ones 3 2 1 输出 tf zeros 1 2 4 t
  • 查找模块中显式定义的函数 (python)

    好的 我知道您可以使用 dir 方法列出模块中的所有内容 但是有什么方法可以仅查看该模块中定义的函数吗 例如 假设我的模块如下所示 from datetime import date datetime def test return Thi
  • 如何将 self 传递给装饰器?

    我该如何通过self key下面进入装饰器 class CacheMix object def init self args kwargs super CacheMix self init args kwargs key func Cons
  • Apache Spark 中的高效字符串匹配

    我使用 OCR 工具从屏幕截图中提取文本 每个大约 1 5 句话 然而 当手动验证提取的文本时 我注意到时不时会出现一些错误 鉴于文本 你好 我真的很喜欢 Spark 我注意到 1 像 I 和 l 这样的字母被 替换 2 表情符号未被正确提
  • 与 while 循环一样,如何跳过 for 循环中的步骤?

    我尝试像 while 循环一样跳过 for 循环中的几个步骤 在 while 循环中 步骤根据特定条件进行调整 如下面的代码所示 i 0 while i lt 10 if i 3 i 5 else print i i i 1 result
  • 在Python中计算内存碎片

    我有一个长时间运行的进程 不断分配和释放对象 尽管正在释放对象 但 RSS 内存使用量会随着时间的推移而增加 如何计算发生了多少碎片 一种可能性是计算 RSS sum of allocations 并将其作为指标 即便如此 我该如何计算分母
  • 具有屏蔽无效值的 pcolormesh

    我试图将一维数组绘制为 pcolormesh 因此颜色沿 x 轴变化 但每个 x 的 y 轴保持不变 但我的数据有一些错误值 因此我使用屏蔽数组和自定义颜色图 其中屏蔽值设置为蓝色 import numpy as np import mat
  • 由于 json 字符串化 dict 键导致数据丢失

    考虑下面的例子 gt gt gt import json gt gt gt d 0 potato 0 spud gt gt gt json dumps d 0 potato 0 spud gt gt gt json loads json d
  • Python]将两个文本文件合并为一个(逐行)[关闭]

    Closed 这个问题需要多问focused help closed questions 目前不接受答案 我是蟒蛇新手 我想做的是将文件 a 和文件 b 逐行合并到一个文件中 例如 text file a a n b n c text fi
  • 为什么 smtplib.SMTP().sendmail 不发送 DKIM 签名邮件

    我已经在服务器上设置了 postfix 以及 openDKIM 当我跑步时 echo Testing setup mail s Postfix test my email address 我收到电子邮件 邮件标题中有一个DKIM Signa
  • 如何在单元测试中使用 JSON 发送请求

    我的 Flask 应用程序中有在请求中使用 JSON 的代码 我可以像这样获取 JSON 对象 Request request get json 这一直工作得很好 但是我正在尝试使用 Python 的 unittest 模块创建单元测试 但
  • 如何循环遍历字典列表并打印特定键的值?

    我是 Python 新手 有一个问题 我知道这是一个非常简单的问题 运行Python 3 4 我有一个需要迭代并提取特定信息的列表 以下是列表 称为部分 的示例 已截断 数千个项目 state DEAD id phwl type name
  • 使用 urllib 编码时保持 url 参数有序

    我正在尝试用 python 模拟 get 请求 我有一个参数字典 并使用 urllib urlencode 对它们进行 urlencode 我注意到虽然字典的形式是 k1 v1 k2 v2 k3 v3 urlencoding 后参数的顺序切
  • 缓存 Flask-登录 user_loader

    我有这个 login manager user loader def load user id None return User query get id 在我引入 Flask Principal 之前它运行得很好 identity loa

随机推荐

  • 编译时浮动打包/双关

    我正在为 PIC32MX 编写 C 语言 使用 Microchip 的 PIC32 C 编译器 基于 GCC 3 4 进行编译 Added我遵循的标准是 GNU99 带有 GNU 扩展的 C99 编译器标志 std gnu99 我的问题是
  • Rails 助手无法在测试环境中工作

    我已按照以下网址提供的教程进行操作http railscasts com episodes 221 subdomains in rails 3 http railscasts com episodes 221 subdomains in r
  • 配置文件 WPF 控件实例化性能

    有没有一种好方法来测试实例化控件的性能 特别是在以下方面DataBinding and Templates表现 我想知道需要多少时间应用模板 and 初始化数据绑定 takes 我正在使用 WPF Performance Suite 和 A
  • 将 UIView 绕其中心旋转几次

    我正在尝试旋转一些UIView围绕它的中心 所以简单的代码是这样的 伪代码 UIView beginAnimations crazyRotate context nil UIView setAnimationDuration 1 0 som
  • 如何在 Python 中让用户选择要更新的键,然后选择新值来更新字典值?

    我正在尝试编写一个程序 我和我的兄弟可以输入和编辑足球比赛名单中的信息 以比较球队和管理球员等 这是我尝试过的第一个 大 项目 我在字典中有一个嵌套字典 我可以让用户创建字典等 但是当我尝试让 用户 通过 raw input 返回编辑它们时
  • Kubernetes:minikube 持久卷本地文件系统存储位置

    我已经阅读了所有文档和一些 SO 帖子 但找不到这个问题的答案 minikube 将其持久卷保存在我的本地 Mac 文件系统中的什么位置 Thanks 首先请记住 Kubernetes 运行在Minikube https minikube
  • NodeJS Express req.session 未定义

    就是想不通这个 我发现的关于快速会话的所有内容都表明它确实有效 但对我来说并非如此 我的整个应用程序配置 app configure gt app set port process env PORT 3000 app set views p
  • 通过同级子视图传播触摸事件?

    我有一堆子视图 它们都有用户交互部分 子级 并且全屏 问题是 如果我触及堆栈顶部的非交互式部分 它不会将该触摸传播到堆栈的其余部分 我的设置 视图A view B 全屏容器 本身不是交互式的 但具有交互式子视图 视图B1 互动 查看B2 互
  • 以编程方式向 Woocommerce 3.2+ 中的订单添加折扣

    在 woocommerce 中 我们可以使用优惠券功能为任何订单添加折扣 固定金额 百分比金额 是否可以以编程方式向任何订单添加折扣金额 其中折扣金额可以是任意金额 任何帮助将不胜感激 以编程方式为订单提供折扣的唯一可用功能 正在欺骗Fee
  • 控制器未收到英国格式的 MVC3 日期

    给定这个虚拟机 public class ApplicationDTO BaseDTO public DateTime Date get set public int JobId get set public int Status get
  • WPF 动画/UI 功能性能和基准测试

    我正在为某些业务线的一些奇特的 WPF UI 工作做一个相对较小的概念验证 即使没有太疯狂 我在使用许多功能时已经看到一些非常糟糕的性能 我认为这些功能是首先考虑使用 WPF 进行 UI 构建的主要原因 我在这里问了一个问题 为什么我的动画
  • Spring WS WebServicesTemplate/Jaxb2Marshaller 客户端查看原始 xml?

    是否可以使用 WebServicesTemplate 和 Jxb2Marshaller 作为编组引擎来查看 Spring WS 客户端的请求和响应 我只是想记录 xml 而不是对原始 xml 执行任何操作 See the spring ws
  • 核心数据:在实体 中未找到键路径错误

    谁能告诉我这段代码有什么问题吗 它会引发以下错误并导致应用程序崩溃 reason keypath Studies patients PatientName not found in entity
  • 如何让 babelify 10 定位浏览器

    我想要的是 使用最新版本的库 让它在 IE 11 中运行 我正在构建一个 React 应用程序 为了运行测试 我需要 testing library react 为了在浏览器中运行测试 我需要 browserify 为了在我支持的每个浏览器
  • main.js:2 Uncaught Referenceerror: firebase 未定义 [重复]

    这个问题在这里已经有答案了 我正在尝试将我的 html 联系表单与 firebase 链接 但遇到错误 未捕获的引用错误 firebase 未定义 在我的 main js 文件中 我在 html 文件中很好地定义了 CDN 但在 main
  • 什么是 Swift 中的部分应用闭包#1

    我试图理解此崩溃报告 但无法理解 因为函数 applySettings 不是从 init 调用的 如崩溃报告中所示 Swift 中的 部分申请closure 1 是什么 这是 init 函数所需的代码 public override ini
  • 位置:修复Chrome Mobile中的滑动bug

    如果您查看我的网站 http alexander pastor de在手机上的 Chrome Mobile 中 向任何方向滚动时 页脚都不会保持原样 对原因或解决方法有什么想法吗 页脚的 CSS 代码如下所示 footer width 10
  • 我可以对 GroupTemplate 或 ItemTemplate 进行编号吗?

    我想使用 GroupTemplate 将项目列表分成组 但是 我需要按顺序对每个组进行编号 以便我可以链接到它们并实现一些 JS 分页 我正在绑定到 IEnumerable 这是一些伪代码 我希望输出看起来像这样 a href group1
  • 如何 grep 查找所有少于 4 个字符的单词?

    我有一本字典 单词之间用换行符分隔 你可以这样做 egrep x 1 3 myfile 这也会跳过空白行 从技术上讲 空白行不是单词 不幸的是 上面的正则表达式会将缩写中的撇号计为字母 并将连字符复合词中的连字符计为字母 在字母数如此少的情
  • Python 中 minidom 的内存错误

    我在 Python 中遇到了带有 minidom 解析器的 MemoryError 我正在读取 8000 个小文件 大部分小于 50 Kb 在读取 2500 个后出现此错误 Traceback most recent call last F