如何使用 sed/awk 提取两个模式之间的文本

2024-02-18

我知道这个问题已经被问了 1000 次了，但是我读了很多类似的问题，但仍然没有找到正确的方法来做到这一点。我需要从如下所示的行中提取一个数字：

{"version":"4.9.123M","info":{"version":[2034.2],"description":""},"status":"OK"}

预期输出：

2034.2

该版本号并不总是相同，但该行的其余部分应该相同。

我尝试过使用 sed 但我对此很陌生并且失败了：

 sed -e 's/version":[\(.*\),"description/\1/'

output:

sed: -e expression #1, char 35: unterminated `s' command

我认为问题在于该行中涉及太多特殊字符，并且我没有写好命令。

由于它是 JSON，因此应使用 JSON 感知工具来处理它。例如，如果您更喜欢 awk，可以使用 GNU awk 的 JSON 扩展。这是一个小操作方法。

首先下载并编译适当版本的 GNU awk、Gawkextlib 和gawk-json http://gawkextlib.sourceforge.net/json/json.html。其实这很简单，只需./configure and make。然后，编写一些代码：

awk '
@load "json"                                 # enable json extension
{
   lines=lines $0                            # read json file records and buffer to var lines
   if(json_fromJSON(lines,data)==1) {        # once the json is complete
       for(i in data["info"]["version"])     # that seems to be an array so all elements
           print data["info"]["version"][i]  # are outputed
       lines=""                              # once done with the first json object
   }                                         # reset the var for more lines
}' file

这次输出：

2034.2

多解释一下：

JSON 文件结构可以从一行到多行不等，例如：

{"version":"4.9.123M","info":{"version":[2034.2],"description":""},"status":"OK"}

or:

{
  "version": "4.9.123M",
  "info": {
    "version": [
      2034.2
    ],
    "description": ""
  },
  "status": "OK"
}

所以我们需要缓冲 JSON 行lines=lines $0直到变量中有一个完整的有效对象lines。我们使用扩展函数json_fromJSON()以确定有效性if(json_fromJSON(lines,data)==1)。验证时，对象被解开并存储到数组中data。对于这个特定对象，数组的结构是：

data["version"]="4.9.123M"
data["info"]["version"][1]="2034.2"
data["info"]["description"]=""
data["status"]="OK"

我们可以使用这个递归数组扫描函数检查对象并产生它的一些输出：

awk '
@load "json"
function scan(a,p,    q) {           # a is array, p path to it, q is qnd *
    if(isarray(a))
        for(i in a) {
            q=p (p==""?"":"->") i
            scan(a[i],q)
        }
    else
        print p ":" a
}
{
   lines=lines $0
   if(json_fromJSON(lines,data)==1)
       scan(data)                    #
}' file.json

Output:

status:OK
version:4.9.123M
info->version->1:2034.2
info->description:

*）又快又脏

以下是如何从数组输出 JSON 的简短示例：https://stackoverflow.com/a/58109715/4162356 https://stackoverflow.com/a/58109715/4162356

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何使用 sed/awk 提取两个模式之间的文本的相关文章

查找并删除超过 x 天的文件或文件夹

我想删除超过 7 天的文件和文件夹所以我尝试了 17 07 14 email protected cdn cgi l email protection find tmp mindepth 1 maxdepth 1 ctime 7 exec
sed - 删除行尾的句点

我正在尝试删除文本文件中行尾的句点有些行末尾有句点有些则没有 cat textfile sometexthere 123 22 no period moretext with period lt remove this period n
在 Shell 中提取匹配模式后的字符串

如何提取 Shell 脚本中匹配模式后面的任何字符串我知道 Perl 脚本中的此功能但不知道 Shell 脚本中的功能以下是示例 subject 01 这是一个示例主题可能会有所不同我必须提取 Subject 01 后面的任何字符
将变量插入 sh 脚本命令[重复]

这个问题在这里已经有答案了 bin sh f set proj dir OutputDir for projname in lib proj1 proj2 do mv scripts projname BYTECODE proj dir s
Bash 的源命令无法处理从互联网上卷曲的文件

我正在尝试使用curl从互联网获取脚本文件如下所示 source lt curl url echo done 我看到的是完成得到了回响before卷曲甚至开始下载文件这是实际的命令和输出 bash 3 2 source lt cur
在 Django shell 会话期间获取 SQL 查询计数

有没有办法打印 Django ORM 在 Django shell 会话期间执行的原始 SQL 查询的数量 Django 调试工具栏已经提供了此类信息例如 5 QUERIES in 5 83MS但如何从 shell 中获取它并不明显您可
tcsh 脚本 if 语句

我需要循环遍历一堆不同的场景变量场景但无法弄清楚如何在 tcsh shell 脚本中使用 if 语句收到错误 if 表达式语法有人可以告诉我我有什么问题吗简化代码如下谢谢 bin tcsh f set val 0 foreach
打印文件的每第 n 列

我有一个相当大的文件有 255 个逗号分隔的列我只需要打印出每第三列我正在尝试这样的事情 awk for i 0 i lt NF i 3 print i file 但这似乎不是解决方案因为它只打印到一长列有人可以帮忙吗谢谢这是
使用 sed 将反斜杠替换为斜杠[重复]

这个问题在这里已经有答案了我需要更换 with 我有一个文件其中包含 test test2 test3 test4 I tried VRS Ruta cat ruta lst sed s g sed s g output test te
如何将命令输出作为多个参数传递给另一个命令

我想将命令的每个输出作为多个参数传递给第二个命令例如 grep pattern input returns file1 file2 file3 我想复制这些输出例如 cp file1 file1 bac cp file2 file2 b
如何将输出重定向到文件，如果文件不存在则不创建它？

我需要将输出重定向到一个文件 gt 在 shell 中但如果该文件尚不存在则不应创建该文件如何实现这一目标我尝试创建文件的符号链接并重定向到符号链接但不幸的是如果文件尚不存在无论如何都会创建文件也许我需要重定向到一个单独的程
如何在不使用 MacPorts 或 Fink 的情况下在 OS X Leopard 上安装 lxml？

我过去曾多次尝试过此操作并遇到问题有没有人有在没有 MacPorts 或 Fink 的情况下在 OS X 上安装 lxml 的方法并且绝对有效最好有完整的 1 2 3 步骤来下载和构建每个依赖项感谢 Twitter 上的 jesse
“./somescript.sh”和“. ./somescript.sh”有什么区别

今天我按照一些说明在 Linux 中安装软件有一个需要首先运行的脚本它设置一些环境变量指令告诉我执行 setup sh 但是我执行时犯了一个错误 setup sh 所以环境没有设置最后我注意到了这一点并继续进行我想知道这两种调用脚
awk 每个文件后换行

使用此脚本每个字段都会根据当前文件的最长单词打印出来但需要每个文件都有一个换行符如何才能实现这一目标 awk BEGIN ORS n FNR NR a i 0 if length 0 gt length max max 0 l len
bash - 检查特定列中的单词，检查该行其他列中的值，将该行剪切并粘贴到新文本文件中

我的文本文件包含约 20k 行如下所示 file A ATOM 624 SC1 SER 288 54 730 23 870 56 950 1 00 0 00 ATOM 3199 NC3 POP 487 50 780 27 750 27 5
如何迭代 Bash 中变量定义的数字范围？

当范围由变量给出时如何在 Bash 中迭代数字范围我知道我可以做到这一点在 Bash 中称为序列表达式文档 http www gnu org software bash manual bashref html Brace Expa
使用 BASH 和 AWK 创建 HTML 表

我在创建 html 表来显示文本文件中的统计信息时遇到问题我确信有 100 种方法可以做得更好但这里是以下脚本中的注释显示了输出 bin bash function getapistats curl s http api exampl
排除正则表达式匹配中的字符串，以进行 sed 处理

我需要将其匹配为替代命令 whatever MATCH THIS whateverwhatever AND THIS whateverwhatever 我正在尝试 sed e s 1 g myfile 但这是急切的匹配 MATCH THIS
在 shell 脚本中将脚本目录更改为用户的 homedir

在我的 bash 脚本中我需要将当前目录更改为用户的主目录如果我想更改为用户的foo主目录从命令行我可以执行以下操作 cd foo 效果很好但是当我从script它告诉我 bar sh line 4 cd foo No such f
AWK 或 sed 方式粘贴非相邻行

cat file aaa bbb ccc ddd eee jjj kkk lll mmm nnn ooo ppp 以下 AWK 命令会将 mmm 行粘贴到 ddd eee 行的末尾有没有更简单的方法使用 AWK 或 sed 来做到这一点

随机推荐

在 Python 字符串中的括号前转义（插入反斜杠）

我需要格式化许多包含类似结构的字符串 u LastName FirstName Department Subdepartment 我的愿望是让字符串看起来像这样 u LastName FirstName Department Subdepa
如何为graphicsmagick 配置 JPEG 委托？

我想将图像裁剪到指定的像素区域我想使用gm模块来自https github com aeckmann gm https github com aheckmann gm 我正在运行 Linux Mint 13 和 node js v0 9
如何检测 Perl 正则表达式中有多少个捕获组？

我有一堆perl questions tagged perl regexp questions tagged regexps 在脚本中我想知道其中有多少个捕获组更准确地说我想知道在真正的匹配操作中实际使用它们之前如果和数组匹配
如何配置 Xcode 将“{”放在生成的文件中我想要的位置

我知道这在程序员中是一个相当有争议的问题但在开发时我喜欢我的 IDE 将左大括号放置在方法接口控件声明下方以用于说明目的这就是 Xcode 自动生成带有结尾的骨架方法的方式 void isTrue BOOL input if
使用 Git，子树合并具有子模块的外部项目的最佳方法是什么？

我正在使用 Git 存储库来存储与我正在开发的网站相关的所有内容该存储库保存与该站点相关的所有文件包括文档模型原始分层图像等以及我放入的 Web 根目录内容www子目录我现在想要开始将我选择使用的 CMS 与项目的其余部分集成
如何开始编写合成 WM？

我想编写一个基本的硬件加速窗口管理器所以我一直在寻找一些有关如何开始的文档但我只找到了本教程 http wingolog org archives 2008 07 26 so you want to build a compositor
在 Maybe 类型上应用函数？

Haskell 新手我不知道如何将函数 a gt b 应用于列表也许 a 并获取也许 b maybeX a gt b gt Maybe a gt Maybe b 该函数应该做与 map 完全相同的事情将函数 f 应用于 Maybe
为什么我的生成器在迭代后变空了？

我有一个生成器通过我正在使用的库的函数调用返回给我然后我将此生成器传递给一个函数该函数迭代它并对每个项目执行一系列逻辑然后我想在调用该函数后引用同一个生成器然而生成器似乎不再拥有生成任何物品代码是这样的 let myGene
Twitter API：如何获取用户 ID、谁喜欢特定推文？

我正在尝试获取有关将特定推文添加到收藏夹的用户的信息但我在文档中找不到它 Twitter 可以做到这一点但没有将此方法作为 API 提供这是不公平的显然做到这一点的唯一方法是scrape http web archive org
PySpark 在终端中执行时出现“非法反射访问操作”

我已经在本地安装了 Spark 和组件并且能够在 Jupyter iPython 中以及通过 Spark submit 执行 PySpark 代码但是收到以下警告 WARNING An illegal reflective access
我可以在 Eclipse 中运行 Spark 单元测试吗

最近我们从使用烫洗改为使用火花我使用eclipse和eclipse的scala IDE来编写代码和测试测试在 twitter 的 JobTest 类上运行良好任何使用 JobTest 的类都可以自动作为 Eclipse 中的 scal
如何在R中根据样本id标记PCA点

我有一个使用对象选项卡制作的 PCA 图 gt tab sample id EV1 EV2 1 G495 0 0074331465 3 837111e 02 2 G1 0 0141980856 6 964191e 02 3 G10 0
如何从 gem 资产中覆盖单个文件来进行资产：预编译？

情况我使用带有自己的 JavaScript 和样式表资源的 gem 这个 gem 使用标准的 application js 和 application css 清单来要求其所有资产 gem app assets javascripts g
System.setErr() 干扰 Logger

在较大的程序中我使用静态java util logging Logger实例但重定向System err连续到几个不同的文件这Logger第二次尝试重定向时无法记录System err 这是一个显示问题的测试程序 import jav
更改收件人短信的“发件人”字段

我希望短信的收件人看到我的公司名称而不是电话号码这怎么可能我目前正在使用 Twilio 但我愿意接受涉及其他服务的建议对于那些看过 philnash 的答案但仍然遇到问题的人请阅读本文我正在使用 twilio ruby gem
预加载的图像再次加载

我正在预加载我的图像componentDidMount像这样 photos forEach picture gt const img new Image img src picture url 但是当我尝试像这样插入图像时在另一个组件中
如何在 C# 中迭代 Collection 时添加或删除对象

我试图在迭代集合时删除对象但我遇到了例外我怎样才能实现这个目标这是我的代码 foreach var gem in gems gem Value Update gameTime if gem Value BoundingCircle I
出现未捕获类型错误：将 Browserify 与 Nutritionix NodeJS 客户端库一起使用时，fs.readdirSync 不是一个函数

我正在尝试使用 Node 构建一个演示应用程序但我不断收到未捕获的类型错误 fs readdirSync 不是函数尝试使用 Nutrionix NodeJS 客户端库时出错 https github com nutritionix nod
SAP 通过 VBA 提取到 EXCEL 内存不足

我正在尝试通过我记录的 SAP 脚本将 SAP 事务提取到 txt 文档中最后将其提取到我的 Excel 工作表中当我在 SAP 中运行脚本时它会通过将值复制到我的 txt 文档中来工作所以看来我的问题是 excel 中的宏没有激活
如何使用 sed/awk 提取两个模式之间的文本

我知道这个问题已经被问了 1000 次了但是我读了很多类似的问题但仍然没有找到正确的方法来做到这一点我需要从如下所示的行中提取一个数字 version 4 9 123M info version 2034 2 description

如何使用 sed/awk 提取两个模式之间的文本

如何使用 sed/awk 提取两个模式之间的文本 的相关文章

随机推荐

热门标签

如何使用 sed/awk 提取两个模式之间的文本的相关文章