如果行（特定字段）匹配，则 awk 列的平均部分

2024-01-22

这是我的输入文件的示例：

$cat NDVI-bm  
P01 031.RAW 0.516 0 0  
P01 021.RAW 0.449 0 0  
P02 045.RAW 0.418 0 0  
P03 062.RAW 0.570 0 0  
P03 064.RAW 0.469 0 0  
P04 083.RAW 0.636 0 0  
P04 081.RAW 0.592 0 0  
P04 082.RAW 0.605 0 0  
P04 084.RAW 0.648 0 0  
P05 093.RAW 0.748 0 0

如果第一个字段匹配，我需要对第 3 列进行平均。很简单，但我很挣扎，因为我的 awk 知识非常基础……这是我到目前为止所掌握的：

awk '{array[$1]+=$3(need to divide here by number of matches...)} END { for (i in array) {print i"," array[i]}}' NDVI-bm

通过搜索网络，我真的不确定我是否走在正确的道路上...除非有一种简单的方法来计算匹配的数量，但我似乎找不到...有什么想法吗？

谢谢你的帮助！

例如，计算以“P01”开头的行的平均值：

/^P01/{
    num+=1
    cnt+=$3
}
END {print "avg = " cnt/num}

Output:

$ awk -f avg.awk input
avg = 0.4825

...或者，作为单行：

$ awk '/^P01/{cnt+=$3; num+=1} END{print "avg="cnt/num}' input

或者同时计算第一列的所有值：

{
    sum[$1]+=$3
    cnt[$1]++
}


END {
    print "Name" "\t" "sum" "\t" "cnt" "\t" "avg"
    for (i in sum)
        print i "\t" sum[i] "\t" cnt[i] "\t" sum[i]/cnt[i]

}

Outputs:

$ awk -f avg.awk input
Name    sum     cnt     avg
P01     0.965   2       0.4825
P02     0.418   1       0.418
P03     1.039   2       0.5195
P04     2.481   4       0.62025
P05     0.748   1       0.748

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

awk

如果行（特定字段）匹配，则 awk 列的平均部分的相关文章

awk 排序多维数组[重复]

这个问题在这里已经有答案了 GNU awk 支持多维数组 gnu org software gawk manual gawk Arrays of Arrays q 1 1 dog q 1 2 999 q 2 1 mouse q 2 2 77
如何在正则表达式之后打印单词但不打印相似的单词？

我想要一个 awk 或 sed 命令来打印正则表达式之后的单词我想找到一个单词后面的单词但不是看起来相似的单词该文件如下所示 somethingsomething X Windows Icon xournal somethingsom
Bash：循环遍历字符串数组后无法读出带空格的字符串

我正在使用循环读取数组的内容该数组包含名为 music 的目录层次结构中的所有目录和文件内容是 find 命令先前输出的字符串这个想法是根据流派艺术家和标题将 directory contents 中每个数组元素的完整目录路径分成子
如何让“grep -zoP”单独显示每个匹配项？

我有一个此表格的文件 X this is the first match blabla X this is the second match and here we have some fluff 我想提取 X 之后和相同标记之间出现的所有
文本处理问题：删除其中一列不包含特定值的行

我有一个制表符分隔的文件如下所示 input sequence match sequence score receptor group epitope antigen organism ASRPPGGVNEQF ASRPPGGVNEQF
使用正确的头打印文件名

我想获取当前目录中的文件名使得文件的第一行等于myWord 我想结合find type f命令与 exec选项与head 1 filename但无济于事有没有一些聪明的单行的解决方案来解决这个问题您可以使用find with awk
awk: hping: 打印 icmp 发起/接收之间的差异

我有以下输出hping http ports su net hping在 OpenBSD 上 hping icmp ts www openbsd org HPING www openbsd org re0 129 128 5 194 icm
从 csv 文件中删除特定列，保持输出上的相同结构[重复]

这个问题在这里已经有答案了我想删除第 3 列并在输出文件中保留相同的结构输入文件 12 10 10 10 10 1 12 23 1 45 6 7 11 2 33 45 1 2 1 2 34 5 6 I tried awk F 3 fil
匹配模式后添加行[重复]

这个问题在这里已经有答案了我有一个文件说test具有以下值 Linux Solaris Fedora Ubuntu AIX HPUX 如何在匹配 AIX 的行后面添加一行系统主机名如果我做 echo hostname gt gt tes
sed/awk/bash 用外部文件内容替换两个字符串之间的文本

我正在编写一个脚本命令它将采用 inputFile1 在其中查找特定的开始和结束字符串并替换它们之间的所有文本包含 inputFile2 的完整内容理想情况下但不是强制性的这应该不需要转义特殊字符即可工作因此我可以将字符串放
如何添加百分比列

我想计算每行中所有行中的值的百分比并将其添加为另一列输入分隔符为 t 1 10 2 10 3 20 4 40 添加第三列的所需输出显示基于第二列中的值计算的百分比 1 10 12 50 2 10 12 50 3 20 25 00 4 4
使用 awk 解析日志文件

我尝试使用以下代码解析日志文件 if line match then awk 2 vFiler echo vFiler 解释有一些行以这样的模式开头或 vol 后跟名称我想找到所有以或 vol 并将后面的字符串设置为等于变量但我真
使用 awk 如何组合两个文件中的数据并将第二个文件中的值替换到第一个文件中？

有什么想法如何使用 awk 进行以下操作吗两个输入文件 data txt和keys txt data txt 包含一些数据 A 1 B 2 A 3 keys txt 包含键值对本例中的 C 不是 data txt 的一部分但 a
带变量的 AWK 负正则表达式

我在 bash 脚本中使用 awk 来比较两个文件以获取不匹配的行我需要将第二个文件的所有三个字段作为一个模式与第一个文件的所有行进行比较第一个文件 chr1 9997 10330 HumanGM18558 peak 1 150 1
使用 sed 替换复杂模式

我想使用 sed 命令替换模式要删除的图案如下所示带有一个空格 var 0xaae8 x6A x6F x69 x6E x72 x65 x76 x65 x72 x73 x65 x73 x70 x6C x69 x74 x3E x74 x70
使用 awk 从文件中提取特定行

我有两个文件一个文件是我的数据另一个文件是我想从数据文件中提取的行号列表我可以使用 awk 读取行文件然后提取与行号匹配的行吗例子数据文件 This is the first line of my data This is th
使用 BASH 和 AWK 创建 HTML 表

我在创建 html 表来显示文本文件中的统计信息时遇到问题我确信有 100 种方法可以做得更好但这里是以下脚本中的注释显示了输出 bin bash function getapistats curl s http api exampl
awk 数组输出行数和平均值

感谢以下 karakfaawk输出结果为数组我正在尝试添加 2到数组并输出它 2基本上是唯一条目出现的次数正如我正在学习的awk数组我不知道我的尝试是否接近 Input chr1 955542 955763 AGRN exon 1 1
linux + ksh + 向下舍入或向上舍入 - 浮点数

在我的 ksh 脚本中我只需要计算整数有时我会得到浮点数例如 3 49 或 4 8 等所以我需要根据以下规则将浮点数转换为整数示例 3 49 will be 3 2 9 will be 3 4 1 will be 4 23 51
如何从 Unix 文件中删除空行

我需要从输入文件中删除所有空白行并写入输出文件这是我的数据如下 11216 33 1032747 64310 1 0 0 1 878 0 0 0 1 1 1 087 5 1 1 18 JAN 13 000603221321 11216 3

随机推荐

Python ValueError：形状为 (124,1) 的不可广播输出操作数与广播形状 (124,13) 不匹配

我想使用标准化训练和测试数据集MinMaxScaler in sklearn preprocessing 但是该包似乎不接受我的测试数据集 import pandas as pd import numpy as np Read in da
从android中的运动事件获取所有x和y坐标

我目前正在开发自己的基本绘图应用程序到目前为止我的应用程序运行良好但我注意到我的运动事件似乎没有获取所有被触摸的 X 和 Y 轴点当我在屏幕上移动手指时圆圈之间有明显的空格只有当我慢慢移动手指时它才会捕捉到所有的点有没有办法
使用 Visual Studio 2008 在 Windows 上编译我自己的 PHP 扩展

我写了一个PHP扩展在linux下可以成功编译运行但在Windows上我遇到了一些问题我根据windows进行了编译http blog slickedit com p 128 http blog slickedit com p 12
在顶部添加元素时保持滚动位置在 Firefox 中有效，但在 Chrome 中无效

我有一个流星应用程序 https wikimedia meteorapp com 源代码 https github com mitar mediawiki stream 它有一个条目流并且新条目不断添加到顶部我试图做到这一点以便如果用
如果另一个目录中不存在同名但扩展名不同的文件，则删除文件

我有3个目录我想删除其中的文件raw and xml which 不在 clean raw sample clean raw 1 jpg 2 jpg 5 jpg raw 1 jpg 2 jpg 3 jpg 4 jpg 5 jpg xml
在 vim 中通过 grep 选择结果文件

当我使用 grep 在 vi m 中运行 grep 搜索后我得到了一个文件列表有没有办法选择其中一个文件并在该特定行的新选项卡中打开它只是为了完整性以及 copen命令还有 cw 如果有条目它只会打开 quickfix 窗口因
Vue v-for 和 v-if

我发现其中有些不一致之处Vue文档如果有人澄清这一点请看着v for with v if https v2 vuejs org v2 guide list html v for with v if它说这样做可能会有用就我而言我正处
如何使用 cypress 存根对 graphql 的调用？

我正在编写一个使用 vue apollo 与 graphql 交互的 Vue 应用程序我想知道是否可以存根 graphql 请求我认为这应该有效 it should access a story function cy server c
T-SQL 修剪（和其他非字母数字字符）

我们有一些输入数据有时会在末尾出现 nbsp 字符数据以 varchar 形式从源系统传入我们尝试将这些字符转换为十进制失败 Ltrim 和 Rtrim 不会删除字符因此我们被迫执行以下操作 UPDATE myTable SET my
使用 CsvHelper 编写异步的正确方法

有人可以告诉我如何使用CSVWriter不阻塞地写入对象列表这对我来说并不明显我需要先打电话吗写记录在此之后FlushAsync 或者我应该使用一个一个地编写每个对象NextRecordAsync 实际上我希望使用专用方法但它不存
Visual Studio 关于具有不同内容的文件副本的警告

当我在 Visual Studio 中调试 C 项目时会弹出一个小警告对话框告诉我 A copy of datum h was found in c users brad desktop source binary datum h bu
Google Geochart - 相同的国家，不同的值

我在显示一个国家的价值观时遇到了一些问题问题是我想显示某个球队的足球运动员来自哪里由于其中许多人具有相同的国籍因此当将鼠标悬停在该国家地区时地理图表仅显示数组中的姓氏但我希望它显示所有名称这是代码 var chart fun
隐式对象创建是否适用于常量表达式？

include
服务器标记格式不正确错误

我写了这段代码该代码包含预期的 runat server 属性但它给了我以下错误消息 error on hiddenfield part
如何一起使用 Expression Web 2 和 Visual Studio asp.net mvc？

只是想知道将其合并到 ASP NET MVC 项目中以便可以使用表达式 Web 完成设计的最佳方法是什么微软已经公开表示他们计划在未来将ASP NET MVC合并到Expression Web中
Tomcat 内存使用量在 IDLE 状态下增长

I have problem with growing memory consuming on Tomcat Just after start nothing happens but if some user login after thi
如何在 CentOS 上安装 PySide？

我想在 CentOS 上安装 ReText 有一个问题 root localhost scripts 2 6 python retext py Traceback most recent call last File retext py l
posix线程阻塞信号和解除阻塞

有没有办法阻止同一组中的某些信号并取消阻止其他信号我似乎就是不明白这个问题一个例子 sigset t set sigemptyset set sigaddset set SIGUSR1 Block signal SIGUSR1 in t
@DataJpaTest 忽略 `spring.datasource.url` 配置。怎么修？

我遇到了问题 DataJpaTest 因为由于缺少架构而无法创建表 1 所以我想我可以通过在连接字符串中创建模式来欺骗 spring 如下所示应用程序属性 spring datasource url jdbc h2 mem SCH MO
如果行（特定字段）匹配，则 awk 列的平均部分

这是我的输入文件的示例 cat NDVI bm P01 031 RAW 0 516 0 0 P01 021 RAW 0 449 0 0 P02 045 RAW 0 418 0 0 P03 062 RAW 0 570 0 0 P03 064

如果行（特定字段）匹配，则 awk 列的平均部分

如果行（特定字段）匹配，则 awk 列的平均部分 的相关文章

随机推荐

热门标签

如果行（特定字段）匹配，则 awk 列的平均部分的相关文章