在perl中串行处理XML数据

2024-04-18

我想知道在我的情况下，哪种 XML 解析器最适合 Perl。我读了很多书并尝试过XML::LibXML and XML::SAX。第一个使用了太多内存，第二个对我来说似乎没有那么快（即使在关闭纯 Perl 解析器之后）。

我的需求相当具体。我通过以下方式收到了高达 50MB 的较大响应Net::SSH图书馆。我想在收到这些数据时将其传递到 XML 库，以便在内存中保留最少量的数据。然后，我需要在某些标签中查找数据并对其执行任何操作，在某些情况下对一堆值求和，在其他情况下只需提取值并将它们写入文件或其他内容。所以我需要一个可以串行工作、快速工作并且使用最少内存的 XML 解析器。我得到的数据最多为 1024 字节，所以我希望能够执行类似的操作$myparser->sendData($mynewData)然后在打开或关闭新标签时调用函数，类似于XML::SAX does.

我不一定需要 XPath 或 XSLT。

我建议使用XML::Twig http://search.cpan.org/perldoc?XML::Twig.

该模块使用起来非常方便，并且可以串行读取数据，不占用太多内存。

可能是最显着的特征之一XML::Twig是它允许在所谓的混合模型中解析 XML：您可以解析整个文档（需要整个文档和大量内存），您可以使用回调来解析小块（允许流式传输，内存消耗小），或者您可以使用这些的任意组合。

这种组合模型被证明是最方便的功能 - 从流中加载小叶子，并且您可以免费有效地访问其所有小分支。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在perl中串行处理XML数据的相关文章

即使没有任何内容，也会出现 Notepad++ XML 解析错误“文档末尾有额外内容”

当我尝试在 Notepad 中验证 55 mb XML 文件时收到上述错误消息第一个遇到的错误在这里第 1441520 行共 22258651 行 Notepad 的屏幕截图 https i stack imgur com 9Atc
如果在SAX中设置setNamespaceAware(true)，如何获取“xmlns:XXX”属性？

这是我的代码 path wsdlPath SAXParserFactory saxfac SAXParserFactory newInstance saxfac setNamespaceAware true saxfac setXInclu
将 XML 反序列化为类

我有正在反序列化的 XML 这是我的 XML
DHCP 服务器将任何 url 重定向到登陆页面

我有一个 Linux DHCP 服务器我需要将所有网络流量重定向到一个登陆页面该页面将包含有关如何在网络上注册计算机的说明无论用户输入什么 URL 都需要将用户重定向到网页在 DHCP 服务器上即用户输入 google com
获取 XML 节点下 xml 元素的数量

我希望获取 XML 文件中特定节点下的元素计数该文件将如下所示
如何删除 XML::Simple 输出中的标记？

我正在使用 Perl 创建一个 XML 文件 XML 简单 http search cpan org dist XML Simple模块我成功创建了 XML 文件但问题是我遇到了
Perl：名称“main::IN”仅使用一次，但实际上已使用

我编写了一个读取文件的简短 Perl 脚本看tmp txt 1 gene id XLOC 000001 gene name DDX11L1 oId 1 gene id XLOC 000001 gene name DDX11L1 oId 1
Yocto for Nvidia Jetson 由于 GCC 7 而失败 - 无法计算目标文件的后缀

我正在尝试将 Yocto 与 meta tegra 一起使用 https github com madisongh meta tegra https github com madisongh meta tegra 为 Nvidia Jets
如何将我的包导入分组到单个自定义包中？

通常当我编写 perl 程序时我曾经包含以下包 use strict use warnings use Data Dumper 现在我想像这样我不会为每个程序都包含所有这个包为了那个原因我会将这些全部打包在我自己的包中喜欢跟随 m
使用 T-SQL FOR XML PATH 删除空 XML 节点

我在用着FOR XML PATH从 SQL Server 2008R2 中的表构造 XML XML 必须按如下方式构建
编辑 CMakeLists.txt 以使用 -fPIC 进行编译

我正在尝试为名为 libnifalcon 的 NOVINT Falcon 安装驱动程序我使用 cmake 创建 make 文件但是当我运行 make 时出现错误 Linking CXX shared library lib libnif
在Android应用程序中导入Java项目？

即使 Java 项目中的某些类在普通 Android 项目中无法识别我是否可以在 Android 项目中使用 Java 项目例如javax xml包我认为有两种可能性使用该 java 项目创建一个 jar 并将其导入到 androi
Python 套接字库认为套接字未打开时已打开

我正在使用一些Python 如下所示 HOST 127 0 0 1 PORT 43434 single socket socket socket AF INET socket SOCK STREAM try single bind HOST
如何在 Perl 中序列化数组引用数组？

Perl 有很多用于序列化数据的模块我不知道该选择哪一个我需要将以下数据序列化为字符串以便将其放入数据库中 my categories Education Higher Education Colleges Schooling Col
lxml.etree 和 xml.etree.ElementTree 添加没有前缀的命名空间（ns0、ns1 等）

有没有任何解决方案可以添加不带前缀的命名空间我的意思是这些 ns0 ns1 它适用于所有 etree 实现或者每个都有可行的解决方案目前我有以下解决方案 lxml 元素的 nsmap 参数 c 元素树 python 2 6 以空字符串
NativeScript中有本地存储吗？

如何保持 NativeScript 应用程序中的数据持久化谁能告诉一下localStorage in NativeScript 编辑正在寻找localStorage当时您的问题可以通过多种方式来解读这使得给您一个好的答案有点困难但
在 Kali (Debian) 中安装 mono-devel 时，软件包具有未满足的依赖关系

我尝试安装 mono devel 并输入sudo apt get mono devel在终端中但失败了得到以下结果 apt get install mono devel Reading package lists Done Buildi
Linux 上的最大子进程数

下面的代码将产生尽可能多的子级自己不会进一步fork 一旦父进程退出就会变成僵尸父进程将产生多少个子进程 int main int argc char arg while fork gt 0 子进程的数量可以通过以下方式限制设置限制 2
窗口放置：适用于 Linux (KDE) 的类似 WinSplit Revolution 的应用程序？ [关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案适用于 Linux KDE 的类似 WinSplit Revolution 的应用程序是什么或者也许 KDE 中有一个我缺少的功能平铺通常是窗口管
如何在没有 root 访问权限的情况下在 Ubuntu 上安装 Google Test？

我正在尝试根据以下方式安装 Google Test这个答案 https stackoverflow com a 21314020 6560773在没有 root 访问权限的 Ubuntu 上因为我需要在工作中学习和使用它设法在我自己的用

随机推荐

Xcode 不断展开项目导航器中的所有组

从几天前开始 Xcode 不断扩展项目导航器中的所有组和子组我反复折叠它们这样我就可以专注于我正在做的事情然后我回去它们都再次展开还有其他人经历过吗我折叠一个组移至 Xcode 中的另一个选项卡然后返回所有组都再次展开这
Lambda 属性值选择器作为参数

我需要修改一个方法以便它有一个额外的参数该参数将采用 lambda 表达式该表达式将用于内部对象以返回给定属性的值请原谅我可能错误地使用了术语因为这是我第一次尝试 LINQ 表达式我尝试寻找答案但正如我所提到的我的术语似乎不
使用 paramiko 检查远程主机上是否存在路径

帕拉米科的SFTP客户端 http www metasnark com paramiko docs paramiko SFTP class html显然没有exists方法这是我当前的实现 def rexists sftp path os
JavaFX - 在 DirectoryChooser 中显示文件

是否可以使 DirectoryChooser 显示文件而不仅仅是目录与此处描述的问题相同JFileChooser 选择目录但显示文件 https stackoverflow com questions 2883447 jfilechoo
在reactjs中添加内联样式而不使用JSX

我正在尝试使用reactjs向元素添加内联样式我发现 var divStyle color white backgroundImage url imgUrl ReactDOM render div Hello World div moun
twitter bootstrap 下拉菜单在应该关闭时没有切换

天哪我一直在为这件事抓狂 4个小时的下拉菜单我正在使用 Twitter Bootstrap 顶部的固定导航有一个下拉菜单非常标准的东西只是下拉菜单没有像平常那样关闭仅当按下切换按钮本身时它才会打开和关闭而不是按下菜单中的项目或
在 Outlook 2007 C# 中获取安全发件人列表

我已经在 C NET 4 0 中创建了 Outlook 2007 加载项我想读取 C 代码中的安全发件人列表 if oBoxItem is Outlook MailItem Outlook MailItem miEmail Outlook
如何防止c#中对象的实例化

我需要的是检查传递给构造函数的参数并防止特定对象的实例化以防它们被视为无效我发现可以抛出异常因此对象引用将按预期以 null 结束例如仅当传递给构造函数的整数为非负数时才会实例化此类 class MyClass public
Bootstrap 3 并排容器

我正在尝试制作一个网页其中内容的左半部分尊重引导程序 container最大宽度大小而我的右侧可以一直到页面的末尾作为 container fluid会工作像这样的图片到目前为止我已经尝试了几种方法目前我正在使用以下代码 di
如何从 for 循环构建和填充 pandas 数据框？ [复制]

这个问题在这里已经有答案了这是我正在运行的代码的一个简单示例我希望将结果放入 pandas 数据帧中除非有更好的选择 for p in game players passing print p p team p passing att
AAD 团体声称某些用户的 JWT 令牌缺失

我在 AAD 上遇到一些奇怪的行为用户成功登录后我们的 API 调用中某些用户收到未经授权的消息结果发现 JWT 中的声明丢失了一些用户获得 groups 声明他所属的所有 groupId 的数组一些用户获得 hasgroups
如何在命令行中查看 git 存储库中的所有标签[重复]

这个问题在这里已经有答案了有类似 git show标签之类的东西吗 git tag列出存储库中使用的标签 git tag l如果你使用 l您可以通过选项传递搜索模式来过滤掉标签
在 django 中通过变量模型名称访问模型

我有两个相同的模型比如说 django 中的 X 和 Y 如下所示 class X models Model con models CharField max length 100 a models ForeignField FOO cl
Node/Busboy：获取文件大小

我使用 Busboy 模块通过下面的 CoffeeScript 代码来解析多部分请求有时问题出在数据处理程序上该处理程序针对包含一个文件的请求多次调用这意味着我需要对每个尺寸进行求和才能得出整个尺寸此外文件处理程序中的文件
如何在 Haskell 中创建通道列表（或数组），如 Go

我试图将 Haskell 与 Go 进行比较以获得一些并发示例以下代码是 Go 中使用 Goroutines 和通道的简单映射缩减示例以下 Go 代码计算平方和 1 2 2 2 3 2 1024 2 为了测试Go和Haskell的性能
网络适配器无法在 SQL Developer 中建立连接

我使用包含 1000 个条目的 SQL 开发人员列表创建了一个数据库并且创建成功连接也成功了但今天当我尝试连接时出现错误 IO Error The Network Adapter could not establish the con
通过python3计算uniswap 3.0池（对）地址

我遇到了一个关于如何计算的问题新的 uniswap 版本 3 池早期版本称为pair 地址基于1 https github com Uniswap v3 sdk blob aeb1b09 src utils computePoolAdd
如何跨 NodeJs 应用程序和模块正确重用与 Mongodb 的连接

我一直在阅读和阅读但仍然对跨整个 NodeJs 应用程序共享相同数据库 MongoDb 连接的最佳方式感到困惑据我了解连接应该在应用程序启动时打开并在模块之间重用我目前认为最好的方法是server js 一切开始的主文件连接到数据
当我执行 npm install [重复] 时，Node js 添加不需要的模块

这个问题在这里已经有答案了我正在尝试在我的 Mac 上启动节点服务当我在节点服务所在的文件夹中运行 npm install 时它正在安装 package json 中未提及的模块有一些我不期望的额外模块以及一些我期望的模块丢失了
在perl中串行处理XML数据

我想知道在我的情况下哪种 XML 解析器最适合 Perl 我读了很多书并尝试过XML LibXML and XML SAX 第一个使用了太多内存第二个对我来说似乎没有那么快即使在关闭纯 Perl 解析器之后我的需求相当具体我通过以

在perl中串行处理XML数据

在perl中串行处理XML数据 的相关文章

随机推荐

热门标签

在perl中串行处理XML数据的相关文章