合并除关键字段之外的所有相同行，并使关键字段成为一个范围[关闭]

2024-03-30

我看了很多帖子，但还没有找到我要找的东西。我不确定如何获取以下示例数据：

host1   input   nic1    ip1 ip2 PROT    30000   10
host1   input   nic1    ip1 ip2 PROT    40000   10
host1   input   nic1    ip1 ip2 PROT    50000   10
host1   input   nic1    ip1 ip2 PROT    60000   10
host1   input   nic1    ip3 ip2 PROT    10      30000
host1   input   nic1    ip3 ip2 PROT    10      40000
host1   input   nic1    ip3 ip2 PROT    10      50000
host1   input   nic1    ip3 ip2 PROT    10      60000
host1   output  nic1    ip2 ip1 PROT    10      30000
host1   output  nic1    ip2 ip1 PROT    10      40000
host1   output  nic1    ip2 ip1 PROT    10      50000
host1   output  nic1    ip2 ip1 PROT    10      60000
host1   output  nic1    ip2 ip3 PROT    30000   10
host1   output  nic1    ip2 ip3 PROT    40000   10
host1   output  nic1    ip2 ip3 PROT    50000   10
host1   output  nic1    ip2 ip3 PROT    60000   10
host1   output  loc     ip2 ip2 PROT    10      30000
host1   output  loc     ip2 ip2 PROT    10      50000

并将其合并为：

host1   input   nic1    ip1 ip2 PROT    30000:60000 10
host1   input   nic1    ip3 ip2 PROT    10          30000:60000
host1   output  nic1    ip2 ip1 PROT    10          30000:60000
host1   output  nic1    ip2 ip3 PROT    30000:60000 10
host1   output  loc     ip2 ip2 PROT    10          30000:50000

我有大量像这样的数据，需要为给定行的多个字段创建范围，但我认为如果有人可以向我展示如何像上面那样对一个字段执行此操作，我应该能够计算出其余部分出去。如果没有，我会跟进:)。预先感谢您的任何帮助。

Update

我重构了下面答案中的代码，以使其更具可读性。主体应该阅读几乎英文散文。

#!/usr/bin/awk -f
# main body
NR == 1 {
  copyRecordTo(veryold)
  next
}
{
  if (inSameGroup()) {
    copyRecordTo(old)
  } else {
    makeRangeForField(NF - 1)
    makeRangeForField(NF)
    nicePrint()
    copyRecordTo(veryold)
  }
}
END {
  makeRangeForField(NF - 1)
  makeRangeForField(NF)
  nicePrint()
}

# functions
function copyRecordTo(line) {
  for (i = 1; i <= NF; ++i) line[i] = $i
}
function nicePrint() {
  for (i = 1; i <= NF; ++i) {
    i == NF - 1 ? fmt = "%s\t\t" : fmt = "%s\t"
    printf(fmt, old[i])
  }
  printf("\n")
}
function makeRangeForField(f) {
  if (old[f] != veryold[f])
    old[f] = veryold[f]":"old[f]
}
function inSameGroup() {
  b = 1
  for (i = 1; i <= NF - 2; ++i)
    b *= $i == veryold[i]
  return b == 1
}

原答案

下列awk脚本几乎生成您正在寻找的内容。

本质上，该脚本执行以下操作：

商店在veryold仅第 7 个和/或第 8 个字段不同的每组行的第一行
商店在old最后读取的行
“布尔”b用于检查何时超过最后一行
当这种情况发生时，最后两个字段veryold与那些加入old with a :如果它们不同，则介于两者之间，并且old被打印
多一个选项卡\t用于最后两个字段之间以提高可读性

另外两点：

NR == 1是一种必须初始化的特殊情况veryold only
读取最后一行后END处理存储在中的最后一行的特殊情况old

#!/usr/bin/awk -f
NR == 1 {
  for (i = 2; i <= NF; ++i) {
    veryold[i] = $i
  }
  next
}
{
  b = 1
  for (i = 2; i <= NF - 2; ++i) {
    b *= $i == veryold[i]
  }
  if (b == 1) {
    for (i = 1; i <= NF; ++i) {
      old[i] = $i
    }
  } else {
    if (old[NF - 1] != veryold[NF - 1]) {
      old[NF - 1] = veryold[NF - 1]":"old[NF - 1]
    }
    if (old[NF] != veryold[NF]) {
      old[NF] = veryold[NF]":"old[NF]
    }
    for (i = 1; i <= NF; ++i) {
      if (i == NF - 1) {
        fmt = "%s\t\t"
      } else {
        fmt = "%s\t"
      }
      printf(fmt, old[i])
    }
    printf("\n")
    for (i = 2; i <= NF; ++i) {
      veryold[i] = $i
    }
  }
}
END {
  if (old[NF - 1] != veryold[NF - 1]) {
    old[NF - 1] = veryold[NF - 1]":"old[NF - 1]
  }
  if (old[NF] != veryold[NF]) {
    old[NF] = veryold[NF]":"old[NF]
  }
  for (i = 1; i <= NF; ++i) {
    if (i == NF - 1) {
      fmt = "%s\t\t"
    } else {
      fmt = "%s\t"
    }
    printf(fmt, old[i])
  }
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

bash

MERGE

scripting

combine

合并除关键字段之外的所有相同行，并使关键字段成为一个范围[关闭] 的相关文章

如何在bash中列出所有后台pid

要么我无法正确表达我的搜索要么答案不容易找到但我正在尝试找出如何列出我的所有后台任务 PID 例如到目前为止我发现要列出我们使用的最后一个 PID 但现在我想列出之前任务的 PID 如果存在但我找不到如何做到这一点最终我想列出我
Mac OS X 中 Bash 脚本中的 SFTP 命令

我需要使用 SFTP 和 SSH 从 Mac 主机将文本文件传输到远程 PC freeSSH 这两个连接在本地网络中那么有没有办法从 Bash 脚本内部运行 SFTP 命令使用提供的用户名和密码我已经尝试过一些脚本expect 但我没
将数组传递给函数名称冲突

Specs GNU bash 版本 3 1 17 无法升级 Premise 我一直在摆弄数组我想知道是否有任何方法可以让函数的本地变量与所述函数外部的数组同名 Example 在下面的示例中我将尝试显示该问题 Working bin b
如何使用AWK脚本检查表的所有列数据类型？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案在这里我正在检查表中第一列的数据类型但我想知道AWK中表的所有列数据类型我尝试过但只能获得一列数据类型例如 Column 1
如何将命令作为参数传递给 ssh [重复]

这个问题在这里已经有答案了我的需要是让这个命令起作用 sshpass p XXXX ssh oStrictHostKeyChecking no email protected cdn cgi l email protection sudo
设置 Pyenv 的路径

我正在尝试在我的服务器中设置 Pyenv 的加载路径 bashrc file 我正在关注这个tutorial https realpython com intro to pyenv 它要求我们在哪里设置pyenv到加载路径然而在我的 b
此 bash 命令在 Makefile 中未正确运行

在 Makefile 里面我有这样的 release version poetry version cut f2 d echo release version 如果我运行我的终端中的语句将毫无问题地运行 gt version poetry
根据不平凡的标准有效合并两个数据帧

正在接听这个问题 https stackoverflow com questions 18821862 data selection error 18823432 18823432昨晚我花了一个小时试图找到一个没有增长的解决方案data
apt-get install tzdata 非交互式

当我尝试 apt get install y tzdata 将显示用于选择时区的命令行选项我试图在脚本中使用它来进行一些设置如何在没有用户输入的情况下使 apt get 运行我知道重新配置 tzdata 我可以做 echo Ameri
当我从本地计算机更改为虚拟主机时，从 python 脚本调用 pdftotext 不起作用

我编写了一个小的 python 脚本来解析提取 PDF 中的信息我在本地机器上测试了它我有 python 2 6 2 和 pdftotext 版本 0 12 4 我正在尝试在我的虚拟主机服务器 dreamhost 上运行它它有 py
如何将参数传递给java bash脚本？ [复制]

这个问题在这里已经有答案了我有一个简单的 bash 脚本来运行我的 java 程序就这个 run sh bin sh java jar target my jar arch jar 我想将参数传递给这个脚本该脚本必须将它们传递给jav
在 Fish Shell 中设置导出

我安装了多个版本的 PHP 对于我的正常开发我总是使用通过自制程序安装的 PHP 5 5 x 在鱼壳里 which php php version gt usr local bin php gt PHP 5 5 8 cli built J
如何使用 bash 显示具有两个子文件夹的文件夹？

我通过 Cygwin 使用 bash 我有一个大文件夹 a 有很多子文件夹 b 这些子文件夹各有一个或两个子文件夹 c 我想找到所有有两个子文件夹 c 的子文件夹 b 并输出它们结构如下 a b1 c1 b2 c1 c2 b3 c1 c2
bash 支持字边界正则表达式吗？

我试图在再次添加该单词之前匹配列表中是否存在该单词以避免重复我正在使用 bash 4 2 24 并尝试以下操作 foo bmyword b also foo
仅当重复行与模式匹配时才删除它们

这个问题 https stackoverflow com questions 1444406 how can i delete duplicate lines in a file in unix有一个很好的答案说你可以使用awk seen
语法错误：for 循环变量不正确

我正在尝试编写一个可以在后台调高收音机音量的脚本 bin sh for i 80 i lt 101 i do amixer cset numid 1 i sleep 60 done 但我有问题 alarmclock vol sh 3 ala
关于加拿大短信网关提供商的建议[关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案我很好奇如果我能够接受传入的短信到某个号码然后将其传递给 PHP 中的服务器端应用程序会带来多少麻烦金钱我最终会通过电子邮件地址发回短信有
如何使用 bash 锁定文件

我有一个任务从远程服务器同步目录 rsync av email protected cdn cgi l email protection srv data srv data 为了使其定期运行并避免脚本 reEnter 问题我使用 rsyn
如何在bash中使用jq从变量中包含的json中提取值

我正在编写一个 bash 脚本其中存储了一个 json 值现在我想使用 Jq 提取该 json 中的值使用的代码是 json val code lyz1To6ZTWClDHSiaeXyxg redirect to http examp
Pure Bash 替换捕获组

我有这个示例字符串 test string 13A6 该字符数字可以是从 0 到 9 以及从 A 到 F 我想要这个输出 1 3 A 6 我有这个工作 result echo test string sed s g 我想在没有 sed 的

随机推荐

在 sbt 中添加仅编译时的子项目依赖项

我有一个多项目包含一个私有宏子项目其用途仅限于实现其他子项目的方法体它既不应该出现在其他子项目的运行时类路径上也不应该以任何形式在其他子项目已发布的 POM 中可见这样其他 sbt 项目就可以在不知道宏子项目的情况下使用该项目中的库
Keycloak 缺少表单参数：grant_type

我的本地计算机上有独立运行的 keycloak 我创建了名为 spring test 的新领域然后创建了名为 login app 的新客户端根据其余文档 POST http localhost 8080 auth realms spri
如何对前 5 个有值的单元格求平均值

我有一个类似这样的电子表格我只想对前 5 个包含数据的单元格进行平均我怎样才能做到这一点随着列表获取更多数据如下所示我希望能够定位一个单元格如 A10 并从该单元格返回 5 同样只有当它里面有数据时所以图像的公式应该是这样的
邮政编码 + 国家/地区到地理坐标

获取给定国家地区的给定邮政编码邮政编码的坐标纬度经度的最完整精确和可靠的方法是什么我需要发出大量请求因此高 API 限制率甚至可能不存在会很有用 GeoNames http www geonames org postal
使用 movsd 让编译器复制字符

我想在时间关键的函数中复制相对较短的内存序列小于 1 KB 通常为 2 200 字节 CPU 端的最佳代码似乎是rep movsd 但是我不知何故无法让我的编译器生成此代码我希望我隐约记得看到过使用 memcpy 可以使用编译器内置
使用“严格引用”时不能使用字符串（“1”）作为子例程引用

在对我尝试使用的各种事件做出反应的 Perl 守护进程中空对象模式 http en wikipedia org wiki Null Object pattern在 2 种情况下通过创建匿名子例程它应该只返回值 1 又名 true 请滚动
SQLAlchemy 与辅助表连接行为的关系在延迟加载和急切加载之间发生变化

我已经使用 SQL Alchemy 几个月了到目前为止它给我留下了深刻的印象我现在遇到了一个问题这似乎是一个错误但我不确定我是否在做正确的事情我们在这里使用 MS SQL 通过表反射来定义表类但是我可以使用内存 SQLite
maven部署到本地仓库

有人可以告诉我如何将工件部署到本地存储库中以测试部署场景吗问题是我们使用 nexus 作为远程存储库我想知道是否可以使用自定义名称而不是 nexus 为我们提供的名称来部署我的工件提前致谢使用以下命令 mvn install ins
使用正则表达式来匹配 IP 地址

我正在尝试进行测试以检查 sys argv 输入是否与 IP 地址的正则表达式匹配作为一个简单的测试我有以下 import re pat re compile d 1 3 d 1 3 d 1 3 d 1 3 test pat match
SQL Server 围绕数字和下划线进行全文搜索

使用 SQL Server 2012 通常使用 SQL Server 2008 R2 到 SQL Server 2016 这个问题是更具体的重新措辞SQL Server 全文索引意外结果 https stackoverflow com qu
使用cache-control: no-store有什么缺点？

我们希望防止无意中释放或保留敏感信息例如在备份磁带上并计划使用 HTTP 标头 Cache control no store 这样做有什么缺点从规范来看缓存似乎将继续运行它只是不能使用非易失性存储为了选择指定不存储的响应我
字符串到 xmlNode delphi（或如何将 xml 片段添加到 TXMLDocument）

我有一些包含格式良好的 XML 的文本字符串我希望能够 1 将这些字符串变成IXMLNodes然后 2 将它们附加到现有的XMLDocument 最好不声明新的XMLDocument第一的这似乎不可能有没有什么简单的方法可以完成等效的
无法跟踪 sudo；报告有效 uid 不为零

command bigxu bigxu ThinkPad T410 work lean sudo ls content shell pak leanote libgcrypt so 11 libnotify so 4 MACOSX reso
Newtonsoft 对象 → 获取 JSON 字符串

我有一个由 Newtonsoft 的 JSON 序列化器创建的对象我需要获取用于创建对象的 JSON 字符串如何将对象序列化为简单的 JSON 字符串尝试这个 public string jsonOut Returns JSON st
由于 #ifdef，ctags 在带有不平衡大括号的源文件中被阻塞

我在用ctags生成一个tags我正在处理的 C 项目的文件但文件中缺少许多函数这似乎是由于使用源文件中的大括号不平衡造成的 ifdef 一个简化的例子 include
如何旋转 3D 散点图

下面的代码使用 scatterplot3d 函数来运行高度重量和体积的 3D 散点图其中点是 1 6 之间的类值角度目前为 45 度我知道我可以通过改变角度来倾斜绘图我应该使用什么代码将绘图向左或向右旋转以便我可以提供绘图的多个
Android模拟器加载但不加载程序？

我很确定我已经安装了所有必要的东西我创建了 AVD 并尝试运行 SDK 中包含的示例应用程序之一 Jetboy 当我点击运行时程序模拟器启动并最终加载 android 但没有应用程序启动这是输出 2011 12 14 16 16 24
标记为“已弃用”的 API 方法什么时候才会真正消失？

我正在代码审查我的一位同事刚刚所做的更改他添加了一堆调用Date toMonth Date toYear 和其他已弃用的Date方法所有这些方法在 JDK 1 1 中均已弃用但他坚持认为使用它们是可以的因为它们还没有消失我们正在使
C++ Console Application1.exe 已触发断点

当我尝试设置时 cub SetArray cube 我收到一个错误 Console Application1 exe has triggered a breakpoint 我做错了什么当我尝试调试时cub gt cubesarray我得到
合并除关键字段之外的所有相同行，并使关键字段成为一个范围[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我看了很多帖子但还没有找到我要找的东西我不确定如何获取以下示例数据 host1 input nic1 ip1 ip2 PROT 3

合并除关键字段之外的所有相同行，并使关键字段成为一个范围[关闭]

Update

原答案

合并除关键字段之外的所有相同行，并使关键字段成为一个范围[关闭] 的相关文章

随机推荐

热门标签