如何根据标签将单个 XML 文件拆分为多个

2024-06-18

我有一个带有标签的 XML 文件。我想像这样分割文件。

<?xml version="1.0" encoding="UTF-8"?>
<EMPRMART CREATION_DATE="08/20/2018 18:06:44" REPOSITORY_VERSION="187.96">
<REPOSITORY NAME="REP_DEV" VERSION="187" CODEPAGE="UTF-8" DATABASETYPE="Sybase">
<FOLDER NAME="MC_DEV" 
    <CONFIG DESCRIPTION ="Default ORDER configuration object" ISDEFAULT ="YES" NAME ="default_ORDER_config" VERSIONNUMBER ="1">
        <ATTRIBUTE NAME ="Advanced" VALUE =""/>
        <ATTRIBUTE NAME ="Order type" VALUE ="NO"/>
    </CONFIG>
    <ORDER DESCRIPTION ="" ISVALID ="YES" 
        <ATTRIBUTE NAME ="Normal" VALUE =""/>
        <ATTRIBUTE NAME ="Order type" VALUE ="NO"/>
    </ORDER>
    <ORDER DESCRIPTION ="" ISVALID ="YES" 
        <ATTRIBUTE NAME ="Medium" VALUE =""/>
        <ATTRIBUTE NAME ="Order type" VALUE ="NO"/>
    </ORDER>
    <ORDER DESCRIPTION ="" ISVALID ="YES" 
        <ATTRIBUTE NAME ="Advanced" VALUE =""/>
        <ATTRIBUTE NAME ="Order type" VALUE ="NO"/>
    </ORDER>
    <LOCATION DESCRIPTION ="" ISENABLED ="YES" 
    </LOCATION>
</FOLDER>
</REPOSITORY>
</EMPRMART>

下面是尝试过的代码。但它正在将每一行生成一个新文件

awk  '
    BEGIN { RS = "</ORDER>" } 
    $0 ~ /[^[:blank:]\n]/ { 
        printf "%s\n", $0 RS >> FILENAME "_" ++i ".xml" 
    }
' test.xml

我想仅根据 ORDER 标签拆分此文件，如下所述

File1.xml
    <ORDER DESCRIPTION ="" ISVALID ="YES" 
        <ATTRIBUTE NAME ="Normal" VALUE =""/>
        <ATTRIBUTE NAME ="Order type" VALUE ="NO"/>
    </ORDER>        
File2.xml
    <ORDER DESCRIPTION ="" ISVALID ="YES" 
        <ATTRIBUTE NAME ="Medium" VALUE =""/>
        <ATTRIBUTE NAME ="Order type" VALUE ="NO"/>
    </ORDER>
File3.xml
<ORDER DESCRIPTION ="" ISVALID ="YES" 
        <ATTRIBUTE NAME ="Advanced" VALUE =""/>
        <ATTRIBUTE NAME ="Order type" VALUE ="NO"/>
    </ORDER>

为了实现您的要求，我不会使用 awk，而是使用一个好的 XML 解析器，例如 xmlstarlet 或 xmlint。这里有一个未知数，那就是具有该名称的节点总数ORDER。我们可以为选择写下一个高级 XPath，但我们会保持简单：

xmlstarlet sel -t -v 'count(//ORDER)' file.xml

现在您已经有了计数，您可以循环所有案例并将它们写入文件：

#!/usr/bin/env bash
xmlfile=file.xml

n=$(xmlstarlet sel -t -v 'count(//ORDER)' file.xml)
for i in $(seq 1 $n); do
   xmlstarlet sel -t -m "//ORDER[${i}]" -c . $xmlfile > "File${i}.xml"
done

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Linux

shell

unix

awk

如何根据标签将单个 XML 文件拆分为多个的相关文章

Capistrano RVM 和 Ubuntu RVM 不是一个函数，使用“rvm use ...”选择 rubies 将不起作用

我第一次尝试在 ubuntu 服务器上部署我的应用程序我一直遇到这个错误 2013 03 24 15 13 36 executing deploy run migrations executing rvm gemset use vapin
Linux 在崩溃时自动重新启动应用程序 - 守护进程

我有一个运行嵌入式 Linux 的系统它的持续运行至关重要基本上它是一个与传感器通信并将数据中继到数据库和 Web 客户端的过程如果发生崩溃如何自动重启应用程序此外还有多个线程进行轮询例如套接字和 uart 通信如何确保没
尽管 EXPORT_SYMBOL 模块插入时出现“模块中的未知符号”

我正在尝试编译并插入 r8169 realtek 以太网驱动程序我的内核版本是 ebin sony uname r 4 2 0 rc3 custom 我的本地磁盘中有相同的完整源代码用于安装当前的内核当我运行时该模块编译成功make
posix 和 linux 特定函数的 C++ 包装器 [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案您知道有什么好的库将 posix 和 linux 函数和结构例如套接字或文件描述符包装到 C 类中
字符串常量之前的预期标识符

有一个这样的程序 include
如何使用Python distutils？

我用 python 编写了一个快速程序将 gtk GUI 添加到 cli 程序中我想知道如何使用 distutils 创建安装程序因为它只是命令行应用程序的 GUI 前端所以它只能在 nix 中工作所以我不担心它是跨平台的我的主
很好的 C 库集合？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一个很好的 ANSI C 库集合用于处理向量哈希映射二进制树字符串处理等 Try g
将条目添加到 Linux 内核 .config 文件

如何手动将 CONFIG XILINX FIXED DEVTREE ADDR y 行添加到 Linux 配置文件中当我构建内核时它不断被覆盖您可以通过以下方式构建make CONFIG XILINX FIXED DEVTREE ADDR
Cmake 错误未定义对“pthread_create”的引用

我对 cmake FindThreads 进行了测试这是我的源代码test cpp和CMakeLists txt include
在詹金斯管道作业中将变量传递给bash脚本

我有一个 Jenkins 管道作业其中我使用名为 setup sh 的 bash 脚本配置我的环境如下所示 bin bash export ARCH 1 echo architecture ARCH 在 Jenkins 管道脚本中我使
参数无效”设置键“net.core.somaxconn”

我尝试设置Linux内核编辑后 etc sysctl conf并执行sysctl p它显示错误 Invalid argument setting key net core somaxconn Linux 发行版 Ubuntu 12 04
sed：用匹配的模式替换第 n 个单词？

我有一个具有以下特征的文本文件每行至少有三个由空格分隔的单词单词可以是任何字符或字符串我在一些行中附加了一些注释并提出了对原始单词进行更改的初步建议现在想使用 sed 为我进行这些更改因此为了提供更清晰的图片我的文件如下
Emacs shell：保存提交消息

我几天前开始使用 emacs 在 emacs shell M x shell 中使用 git 时遇到问题当我 git commit 或 git commit amend 时它会打开 vim 来编辑并保存提交消息我对此表示同意但我找不
将匹配的值传递给函数，并替换为返回值

我如何让 Bash 匹配正则表达式而不是用常量字符串替换值而是将匹配的值传递给函数然后从函数的返回值中获取要替换的值像下面的伪代码一样它替换了每一个匹配项 a d 具有相同的字符但大写 function uppercase ec
使用 Bash 显示进度指示器（旋转器）[重复]

这个问题在这里已经有答案了使用仅 bash 的脚本如何提供 bash 进度指示器例如当我从 bash 运行命令时当该命令正在执行时让用户知道某些事情仍在发生在这个使用 SCP 的示例中我演示了如何获取进程 ID pid 然后
sed：用下划线替换引号内的空格

我有输入例如来自ifconfig run0 scan在 OpenBSD 上它有一些用空格分隔的字段但某些字段本身包含空格幸运的是包含空格的此类字段总是用引号引起来我需要区分引号内的空格和分隔符空格这个想法是用下划线替换引号内
Zip 实用程序在 Linux 中每次都给我不同的 md5sum

当我在 Linux 中压缩 Zip 2 31 同一个文件时每次都会得到不同的校验和如何保持上次的 md5sum 相同我正在使用 yum 提供的最新 zip 更新生成的存档不仅包含压缩文件数据还包含额外的文件属性如参考zip 文
强制 shell 在 SunGrid 引擎中使用 conda 变量中的 python [重复]

这个问题在这里已经有答案了我正在尝试在 SunGrid 引擎中执行 python 文件并且从 anaconda3 环境变量中执行它我的代码很简单 from future import print function import url
top命令的CPU使用率计算

我正在尝试使用 GNU coreutil top 的公式来计算 CPU 使用率的百分比但 top 正在使用一些 half total 来计算百分比即在百分比上添加 0 5 在top的utils c中以下行在 3 8 beta1 中
如何在 shell 中解码 URL 编码的字符串？

我有一个文件其中包含已编码的用户代理列表例如 Mozilla 2F5 0 20 28Macintosh 3B 20U 3B 20Intel 20Mac 20OS 20X 2010 6 3B 20en 我想要一个 shell 脚本它可以

随机推荐

Video.js / Contrib-HLS 在大多数浏览器中无法播放 HLS（代码：4 MEDIA_ERR_SRC_NOT_SUPPORTED）

我正在构建一个视频播放器需要播放 HLS 直播和点播流似乎仅在 Safari 中运行良好减去我需要更新的自定义样式忽略它在所有其他浏览器中我收到此错误 VIDEOJS ERROR CODE 4 MEDIA ERR SRC NOT
将 LPTSTR 转换为要写入文件的字符串或 char *

我想将 LPTSTR 转换为字符串或 char 以便能够使用 ofstream 将其写入文件有任何想法吗 Use T2A http msdn microsoft com en us library 87zae4a3 VS 80 aspx宏
如何在 Express (NodeJS) 中验证和处理表单

Express 是否有首选的表单处理和验证库我真的在寻找与 Django 表单中类似的抽象级别即模板中的验证和错误报告如果可以在客户端使用相同的验证那就太好了有人用过或者写过什么好东西吗看起来有一个模块位于https githu
(thread_id_key != 0x7777)，函数 find_thread_id_key，文件 ../src/coroutine.cc，第 134 行

我正在开发一个vue程序我尝试过npm run serve 然后我得到了这个 66 building 670 715 modules 45 active Users bytedance go src code byted org ad o
寻找自定义 SynchronizationContext 的示例（单元测试所需）

我需要定制同步上下文 http msdn microsoft com en us library system threading synchronizationcontext aspx that 拥有一个运行 Posts 和 Sends
如何从管道作业访问 git 分支名称？

我有一个 Jenkins Pipeline 作业配置为签出 git 存储库和特定的本地分支如何在 Jenkinsfile 中获取本地分支的名称我尝试加载git詹金斯插件 https wiki jenkins ci org displa
XML 渲染错误 Android 预览 N

更新后我已将 android SDK 更新为 android Preview N 但收到此 xml 渲染错误单击详细信息后它显示以下堆栈跟踪如何避免这种情况 org jetbrains android uipreview Renderi
文件系统文件名转义？ C＃

我允许用户选择他想要的任何用户名它可以是任何用户名例如 AC Man 现在我需要为他创建一个目录我使用什么函数来转义文本这样我就不会出现 FS 问题异常无论您替换无效字符还是删除它们总是存在发生冲突的可能性如果我是你我会为
Valgrind 输出中的错误摘要？

我看过一些关于 valgrind 的帖子但没有一篇帖子帮助我理解 valgrind 输出的解释我用 valgrind 运行了两个程序都有内存泄漏测试 1 的示例输出 20422 LEAK SUMMARY 20422 definite
我们还需要迭代器设计模式吗？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
使用 Github Actions 进行部署

我在用Github作为我的源代码控制并使用Github 操作作为我的 CI CD 解决方案我在某处有一个专用的 Windows Server 它接受发表我的仓库的版本我有一个 Github Action 它可以构建测试发布和部署
黑屏只是闪烁一会儿

在我的 Windows Phone 8 应用程序中我有一个搜索页面其中有一个文本框供用户输入搜索关键字输入默认SIP键盘的 Enter 键时将调用搜索搜索结果显示在另一个页面中为了在导航到结果页面之前隐藏键盘我使用 this F
Android：使用 ObjectAnimator 平移具有视图尺寸小数值的视图

看来旧的视图动画 translate scale等不再被接受AnimationInflater 至少截至 ICS 而言我在 4 0 4 中阅读了它的代码它明确只需要 XML 元素set objectAnimator animator
使用 Spring @Configuration 和 MethodInterceptor 拦截带注释的方法

我需要使用 spring aop 拦截带注释的方法我已经有了拦截器它实现了 AOP 联盟的 MethodInterceptor 这是代码 Configuration public class MyConfiguration Bean p
如何在屏幕上拖动图像

谁能帮助我如何为可以在屏幕上拖动的图像编写程序你能给我一个示例代码吗多谢我怎样才能为它制作游戏得分我将感谢您的回复 imageView setOnLongClickListener new OnLongClickListener p
Angular CDK Overlay，更改默认覆盖容器

有没有办法改变OverlayContainer 我创建了一个工具提示组件但有时我想将叠加层附加到特定元素默认情况下叠加层附加到文档正文以下是我创建叠加层的方法 private initOverlay void const posit
HighCharts - 两个 Y 轴，一个具有最大值

我在使用 Highcharts 时遇到问题我已将右 Y 轴设置为 min 0 和 max 100 它是但它不起作用并生成 125 百分比怎么了 http jsfiddle net SdTcU http jsfiddle net SdT
如何在 Windows 10 上将 ipynb 文件与 Jupyter Lab（来自 Anaconda）关联

我使用 Windows 10 Jupiter Lab 是从 Anaconda 安装的我想交往ipynb使用 Jupyter Lab 保存文件这样当我双击ipynb文件应使用 Jupyter Lab 打开我该怎么做 Install n
android中使用xml的新自定义字体方法

随着 android 发布 O 预览版添加了一个新功能称为xml 中的字体它很容易实现但我没有什么疑问让我首先添加最好的方法1 右键单击资源文件夹并前往新建 gt Android 资源目录新的出现资源目录窗口 2 在资源类型列表
如何根据标签将单个 XML 文件拆分为多个

我有一个带有标签的 XML 文件我想像这样分割文件

如何根据标签将单个 XML 文件拆分为多个

如何根据标签将单个 XML 文件拆分为多个 的相关文章

随机推荐

热门标签

如何根据标签将单个 XML 文件拆分为多个的相关文章