Linux命令查找两个可比较的行

2024-03-30

我的数据按以下排序顺序排列（这里数据按照第一个 v1，然后是 v2，然后是 v3，然后是 v4 排序）：

v1=1    v2=8513481      v3=119330184    v4=0
 v1=1    v2=8521383      v3=119330182    v4=0
 v1=1    v2=10630231     v3=60529116     v4=18
 v1=1    v2=60528877     v3=60529221     v4=17
 v1=1    v2=90351079     v3=90351078     v4=20
 v1=1    v2=271669588    v3=271669683    v4=101
 v1=2    v2=8513481      v3=10583646     v4=0
 v1=2    v2=10175437     v3=10175436     v4=0
 v1=2    v2=10630231     v3=60528947     v4=17
 v1=2    v2=10630231     v3=60529119     v4=18
 v1=2    v2=10630232     v3=605291191     v4=18

现在我想找出 2 行中 v1 和 v2 相等的行。即在上面给出的数据中我想找到以下形式的行：

 v1=2    v2=10630231     v3=60528947     v4=17
 v1=2    v2=10630231     v3=60529119     v4=18

我知道如何在 python 中通过比较连续的行以及每当有匹配的输出行时执行此操作。有没有一种简单的方法可以使用 sed 等 Linux 命令来执行相同的操作。我知道如何使用 sed 在给定两个值时查找单词，但我不知道如何在这种情况下使用 sed。非常感谢一些解释。

会更容易一些awk:

awk '{
    lines[$1,$2]=(lines[$1,$2]?lines[$1,$2] RS $0:$0)
    dups[$1,$2]++
}
END {
    for(line in lines) 
        if(dups[line]>1) print lines[line]
}' file
v1=2    v2=10630231     v3=60528947     v4=17
v1=2    v2=10630231     v3=60529119     v4=18

我们创建两个数组。lines and dups.
当第一列和第二列出现多次时，我们会增加计数。我们用dups为此数组。
In our lines数组，我们检查是否存储了具有相同第一列和第二列的行。如果有，我们将重复的行附加到它上面。
In the END我们迭代的块lines大批。如果第一个和列在我们的dups数组，我们打印行。

或者，如果您不想将整个文件保留在内存中，您可以执行以下操作（因为您声明数据已排序）：

awk '($1==c1 && $2==c2){print line RS $0}{line=$0;c1=$1;c2=$2}' file

我们分配变量line作为您当前的整个行，c1作为第 1 列和c2如第 2 栏。
如果当前行的第 1 列和第 2 列与前一列和第二列相同，则打印上一行和当前行。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Linux

sed

Linux命令查找两个可比较的行的相关文章

从 csv 文件中删除特定列，保持输出上的相同结构[重复]

这个问题在这里已经有答案了我想删除第 3 列并在输出文件中保留相同的结构输入文件 12 10 10 10 10 1 12 23 1 45 6 7 11 2 33 45 1 2 1 2 34 5 6 I tried awk F 3 fil
如何在 Linux 中编写文本模式 GUI？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案当我编写脚本程序时我经常想弹出一个简单的文本 gui 来提示输入我该怎么做例如来自 Shel
Linux TUN/TAP：无法从 TAP 设备读回数据

问题是关于如何正确配置想要使用 Tun Tap 模块的 Linux 主机 My Goal 利用现有的路由软件以下为APP1和APP2 但拦截并修改其发送和接收的所有消息由Mediator完成我的场景 Ubuntu 10 04 Mach
如何在 shell 脚本中并行运行多个实例以提高时间效率[重复]

这个问题在这里已经有答案了我正在使用 shell 脚本它读取 16000 行的输入文件运行该脚本需要8个多小时我需要减少它所以我将其划分为 8 个实例并读取数据其中我使用 for 循环迭代 8 个文件并在其中使用 while
如何查明CONFIG_FANOTIFY_ACCESS_PERMISSIONS是否启用？

我想利用fanotify 7 http man7 org linux man pages man7 fanotify 7 html我遇到的问题是在某些内核上CONFIG FANOTIFY ACCESS PERMISSIONS不起作用虽然C
sendfile64 只复制约2GB

我需要使用 sendfile64 复制大约 16GB 的文件到目前为止我所取得的成就是 include
在哪里可以找到并安装 pygame 的依赖项？

我对 Linux 比较陌生正在尝试安装 python 的 pygame 开发环境当我运行 setup py 时它说我需要安装以下依赖项我找到并安装了其中之一 SDL 然而其他人则更加难以捉摸 Hunting dependencie
Linux 中的动态环境变量？

Linux 中是否可以通过某种方式拥有动态环境变量我有一个网络服务器网站遵循以下布局 site qa production 我想要一个环境变量例如 APPLICATION ENV 当我在 qa 目录中时设置为 qa 当我在生产目录中时
域套接字“sendto”遇到“errno 111，连接被拒绝”

我正在使用域套接字从另一个进程获取值就像 A 从 B 获取值一样它可以运行几个月但最近 A 向 B 发送消息时偶尔会失败出现 errno 111 连接被拒绝我检查了B域套接字绑定文件它是存在的我也在另一台机器上做了一些测试效
vector 超出范围后不清除内存

我遇到了以下问题我不确定我是否错了或者它是一个非常奇怪的错误我填充了一个巨大的字符串数组并希望在某个点将其清除这是一个最小的例子 include
无法使用 wget 在 CentOS 机器上安装 oracle jdk

我想在CentOS上安装oracle java jdk 8 我无法安装 java jdk 因为当我尝试使用命令安装 java jdk 时 root ADARSH PROD1 wget no cookies no check certific
如何将目录及其子目录中的所有 PDF 文件复制到一个位置？

如何全部复制PDF文件从目录及其子目录到单个目录实际上还有更多的文件并且深度有些任意假设四个目录的最大深度是公平的我想这些文件需要重命名如果a pdf例如位于多个目录中因为我会adding https ebooks stack
如何在apache 2.4.6上安装apxs模块

我刚刚用过apt get update我的 apache 已更新为2 4 6 我想安装 apxs 来编译模块但收到此错误 The following packages have unmet dependencies apache2 pre
如何在shell中输出返回码？

我正在尝试通过调用自定义 shell 脚本sh bin sh c myscript sh gt log txt 2 gt 1 echo 该命令的输出是创建的后台进程的 PID 我想指导 bin sh保存返回码myscript sh到某个文件
Linux 中什么处理 ping？

我想覆盖更改 linux 处理 ping icmp echo 请求数据包的方式这意味着我想运行自己的服务器来回复传入的 icmp 回显请求或其他数据包但为了使其正常工作我想我需要禁用 Linux 的默认 ping icmp 数据包
如何授予 apache 使用 NTFS 分区上的目录的权限？

我在一台带有 20GB 硬盘的旧机器上运行 Linux Lubutu 12 10 我有一个 1 TB 外部硬盘上面有一个 NTFS 分区在该分区上有一个 www 目录用于保存我的网页内容它在启动时自动安装为 media t515
我的线程图像生成应用程序如何将其数据传输到 GUI？

Mandelbrot 生成器的缓慢多精度实现线程化使用 POSIX 线程 Gtk 图形用户界面我有点失落了这是我第一次尝试编写线程程序我实际上并没有尝试转换它的单线程版本只是尝试实现基本框架到目前为止它是如何工作的简要描述 M
在脚本内使用不带密码的 sudo

由于某种原因我需要作为用户在没有 sudo 的情况下运行脚本 script sh 该脚本需要 root 权限才能工作我认为将 sudo 放入 script sh 中是唯一的解决方案让我们举个例子 script sh bin sh su
Linux 上有关 getBounds() 和 setBounds() 的 bug_id=4806603 的解决方法？

在 Linux 平台上 Frame getBounds 和 Frame setBounds 的工作方式不一致这在 2003 年就已经有报道了请参见此处 http bugs java com bugdatabase view bug do
如何更改 Apache 服务器的根目录？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案如何更改 Apache 服务器的文档根目录我基本上想要localhost从来 users spencer projects目录而不是

随机推荐

Visual Studio 2010 在加载解决方案时崩溃

我见过很多类似的问题但我不认为我在重复这是我的情况我正在使用三种解决方案 A 工作正常但是当我尝试加载 B 或 C 时 VS 2010 在加载解决方案后不久就会崩溃特别是在我尝试从解决方案资源管理器中打开文件之后我尝试过的禁用
python 将字符串转换为日期时间

我有一个循环我尝试处理一组数据其中一个操作是将普通字符串转换为日期时间一切正常除了有时会发生奇怪的事情这就是我所知道的总是有完全相同的参数进入函数这些参数始终是相同的类型我第一次运行它时它总是能通过当它到达 appx 8
从 OpenDDS 发布者传递复杂结构

我有以下 idl 结构我想使用 opendds 发布它 pragma DCPS DATA TYPE B CData pragma DCPS DATA KEY B CData id module B struct Quote string
将带有撇号的 json 值发送到 web 服务时出现无效对象错误

我正在尝试将 json 对象发送到 Web 服务以将其反序列化为自定义 LineItemWithDetails 对象当传递给 Web 服务的 json 中的任何位置有撇号时我会收到以下错误在本例中它是 BudgetJustific
PostgreSQL - 查询 HSTORE 值的 GIN 索引

我有以下构造函数作为测试 CREATE TABLE product id BIGSERIAL PRIMARY KEY ext hstore CREATE INDEX ix product ext ON product USING GIN
批处理脚本：%0 和 %~f0 有什么区别？

我有一个批处理脚本我想在其中获取脚本的完整路径我很好奇这之间有什么区别吗 set scriptpath 0 和这个 set scriptpath f0 谢谢你的帮助 0引用参数 0 批处理文件的名称始终与命令行或另一个批处理文件中指
PostgreSQL - GROUP BY 子句

我想按标签搜索然后列出带有该标签的所有文章以及它们匹配的给定标签的数量例如我可能有 Page1 2 has css and php tag Page2 1 has only css tag Query SELECT COUNT t t
ValueError - 注释“状态”与模型 django 上的字段冲突

我正在尝试在其余 api 视图中执行一些复杂的查询以便我可以按正确的顺序对联系人进行排序现在为e4c5 https stackoverflow com a 43781018 4107823在我之前的问题中建议我可以这样做Case htt
jQuery 函数在按钮单击和 Enter/Return（键）时执行

我正在尝试创建一个小搜索框允许您根据在输入字段中输入的关键字搜索 Twitter 虽然它可以工作但只有当您按下提交按钮时它才有效我还希望能够按 Enter 或 Return 键来启动搜索我尝试使用 sumbit 函数并将输入包装
动态设置 ApiExplorerSettingsAttributes 值

由于很多属性都是由避免未密封的属性我正在寻找一种设置属性值的解决方案我的第一个想法是继承该类并设置一个检查网络配置的构造函数对于密封类来说这是不可能的有的是ApiExplorerSettingsAttribute在命名空间中Syste
如何从 Java 代码调用 PHP 脚本？

正如标题所说当用户单击 Java Swing 应用程序中的按钮时我尝试使用以下代码执行 PHP 脚本 URL url new URL http www mywebsite com my script php HttpURLConnect
将子视图添加到相对布局

尽管我遇到了许多有关相对布局和以编程方式添加子视图的问题但我无法解决这个问题 for int i 0 i
C++ 中空 std::shared_ptr 和 null std::shared_ptr 有什么区别？

The cplusplus comshared ptr page http www cplusplus com reference memory shared ptr 指出了之间的区别empty std shared ptr and a n
数据表| .SD lapply '...'-参数中的多列

我如何使用固定的特定列的论证lapply SD FUN Example DT lt data table id column rnorm 10 x1 rnorm 10 x2 rnorm 10 x3 rnorm 10 measure col
DBMS 上下文中的 BLOB 到底是什么

什么是 BLOB 我该如何使用它 DBMS 的 BLOB 之间有什么区别我想使用 BLOB 将数据保存到任何 DBMS 中然后使用库读取该 BLOB BLOB BLOB 二进制大对象是数据库系统中的大对象数据类型 BLOB可以存储大量
Appengine - 可以仅使用不带模型名称的键字符串来获取实体吗？

我希望能够有一个可以作用于许多不同类型的对象的视图所有视图将得到的只是键字符串例如 agpwb2xsdGhyZWFkchULEg9wb2xsY29yZV9hbnN3ZXIYAww 在不知道模型类型的情况下是否可以仅从该键字符串中检索实
如何调整 Bootstrap DatePicker 的大小？

我的代码是这样的 HTML div class input append date datepicker no padding div
为什么 libc++ 的 std::string 实现比 libstdc++ 占用 3 倍内存？

考虑以下测试程序 include
使用drive api搜索文件夹内的文件

驱动API https developers google com drive v2 reference files list https developers google com drive v2 reference files lis
Linux命令查找两个可比较的行

我的数据按以下排序顺序排列这里数据按照第一个 v1 然后是 v2 然后是 v3 然后是 v4 排序 v1 1 v2 8513481 v3 119330184 v4 0 v1 1 v2 8521383 v3 119330182 v4 0 v

Linux命令查找两个可比较的行

Linux命令查找两个可比较的行 的相关文章

随机推荐

热门标签

Linux命令查找两个可比较的行的相关文章