awk：多个CSV文件中多列数据的数学运算

2024-04-08

我正在开发 bash 脚本，该脚本循环多列数据填充并执行集成的 AWK 代码来操作多列数据。

#!/bin/bash
home="$PWD"
# folder with the outputs
rescore="${home}"/rescore 
# folder with the folders to analyse
storage="${home}"/results
    

while read -r d; do
awk -F ", *" '                  # set field separator to comma, followed by 0 or more whitespaces
FNR==1 {
   if (n) {                     # calculate the results of previous file
     f=                   # apply this equation to rescore data using values of $3 and $2
      f[suffix] = f          # store the results in the array
      n=$1 # take ID of the column
   }
   prefix=suffix=FILENAME
   sub(/_.*/, "", prefix)
   sub(/\/[^\/]+$/, "", suffix)
   sub(/^.*_/, "", suffix)
   n = 1                        # count of samples
   min = 0                      # lowest value of $3 (assuming all $3 < 0)
}
FNR > 1 {
   s += $3
   s2 += $3 * $3
   ++n
   if ($3 < min) min = $3       # update the lowest value
}
   print "ID" prefix, rescoring
   for (i in n)
      printf "%s %.2f\n", i, f[i]
}'  "${d}_"*/input.csv > "${rescore}/"${d%%_*}".csv"
done < <(find . -maxdepth 1 -type d -name '*_*_*' | awk -F '[_/]' '!seen[$2]++ {print $2}')

简而言之，工作流程应处理位于 ${d} 文件夹内的 input.csv 的每一行，该文件夹已被我的 bash 脚本正确识别：

# input.csv located in the folder 10V1_cne_lig12
ID, POP, dG
1, 142, -5.6500 # this is dG(min)
2, 10, -5.5000
3, 2, -4.9500
4, 150, -4.1200

我的 AWK 脚本预计会处理每个 CSV 文件的每一行，以便将它们减少为两列，并保留在输出中： i) input.csv 第一列中的数字（包含已处理行的 ID）+包含 CSV 文件的文件夹名称 ($d) 以及 ii) 对 input.csv 的 POP 和 dG 列中的数字应用数学运算 (f) 的结果：

f(ID)= sqrt(((dG(ID)+10)/10)^2+((POP(ID)-240)/240))^2)

其中 dG(ID) 是 input.csv 的“重新评分”行的 dG 值 ($3)，POP(ID) 是其 POP 值 ($2)。最终，output.csv 包含有关 1 input.csv 的信息应为采用以下格式：

# output.csv
ID,             rescore value
1 10V1_cne_lig12,  f(ID1)
2 10V1_cne_lig12,  f(ID2)
3 10V1_cne_lig12,  f(ID3)
4 10V1_cne_lig12,  f(ID4)

虽然我的代码的 bash 部分（处理不同目录中的 CSV 循环）工作正常，但我仍然使用 AWK 代码，它没有正确分配行 ID，以便我可以使用 $2 和 $3 应用演示的数学运算具有精确 ID 的行的列。

给定输入文件：文件夹/文件

ID, POP, dG
1, 142, -5.6500 
2, 10, -5.5000
3, 2, -4.9500
4, 150, -4.1200

这个脚本

$ awk -F', *' -v OFS=', ' '
        FNR==1 {path=FILENAME; sub(/\/[^/]+$/,"",path); print $1,"rescore value"; next} 
               {print $1" "path, sqrt((($3+10)/10)^2+(($2-240)/240)^2)}' folder/file

将产生

ID, rescore value
1 folder, 0.596625
2 folder, 1.05873
3 folder, 1.11285
4 folder, 0.697402

不确定你的其余代码的作用，但我想你可以将其集成进来。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

awk：多个CSV文件中多列数据的数学运算的相关文章

将数组传递给函数名称冲突

Specs GNU bash 版本 3 1 17 无法升级 Premise 我一直在摆弄数组我想知道是否有任何方法可以让函数的本地变量与所述函数外部的数组同名 Example 在下面的示例中我将尝试显示该问题 Working bin b
我的 unix 脚本出了什么问题

bin bash while echo n Player s name read name name ZZZ do searchresult grep name playername if searchresult 0 then echo
如何将命令作为参数传递给 ssh [重复]

这个问题在这里已经有答案了我的需要是让这个命令起作用 sshpass p XXXX ssh oStrictHostKeyChecking no email protected cdn cgi l email protection sudo
POSIX SH 构建循环变量，其元素包含空格

这是我需要的代码 bin sh x1 a1 a2 x2 b1 b2 list SOMETHING for x in list do echo x done 以及我想要的输出 a1 a2 b1 b2 问题是应该做什么SOMETHING是我
bash 中的“declare -r”和“readonly”有什么区别？

在 bash 中有什么区别declare r and readonly declare r a a1 readonly b b1 我不知道该选择哪个 tl dr readonly使用默认范围global甚至在函数内部 declare使用范
规范化 solaris 上的路径名

在 GNU 系统上我只会使用readlink f SOME PATH 但 Solaris 没有 readlink 我更喜欢在 bash 中运行良好的程序但如果需要的话其他程序也可以 Edit 到目前为止我想到的最好的方法是使用 cd 和
未找到命令“ember”

看来我搞砸了 ember cli 安装我已经使用 sudo 安装了 npm 但是在阅读了 npm 上 ember cli 和 sudo 的一些问题后我按照此处的说明卸载并重新安装https gist github com isaacs
从 TypeScript 运行任何 Linux 终端命令？

有没有办法直接从 TypeScript 类中执行 Linux 终端命令这个想法是做类似的事情 let myTerminal new LinuxTerminal let terminalResult myTerminal run sudo
如何将 bash 脚本的整个输出保存到文件

我正在尝试将 bash 脚本的整个输出保存到文件中我目前在代码开头有一个参数 ip 地址如下所示 bin bash USAGE Usage 0
Bash 脚本大小限制？

我有一个 bash 脚本在 RHEL 或 OS X 上运行时出现以下错误第 62484 行意外标记换行符附近出现语法错误第 62484 行 o gz 这是一个自动生成的脚本用于解决我公司使用的 Grid Engine 计算集群
单位安全平方根

我只是想知道如何以与 F 正确交互的方式编写用户定义的平方根函数 sqrt 单位制 http blogs msdn com andrewkennedy archive 2008 09 04 units of measure in f par
使用 sed 删除非字母数字字符

我正在尝试验证一些输入以删除一组字符只允许使用字母数字字符加句点下划线连字符我测试了正则表达式 w here http gskinner com RegExr http gskinner com RegExr 它与我想要删除的内容
如何删除最后一次出现模式后的所有行？

我想删除最后一次出现模式之后的所有行除了模式本身 file txt honor apple redmi nokia apple samsung lg htc file txt 我想要什么 honor apple redmi nokia a
Godaddy 托管上的 CakePHP 控制台

我一直在努力让我的 CakePHP 网站在 Godaddy 网格托管帐户上运行我的蛋糕应用程序设置是从帐户的子目录托管的并且可以通过子域访问我必须调整我的 htaccess 文件才能使其正常工作现在我需要让 CakePHP 控制台
awk: hping: 打印 icmp 发起/接收之间的差异

我有以下输出hping http ports su net hping在 OpenBSD 上 hping icmp ts www openbsd org HPING www openbsd org re0 129 128 5 194 icm
计算两点之间的最短路线

过去几周我一直在开发一款多人 HTML5 游戏使用nodejs and websockets 我已经被这个问题困扰了一段时间想象一下我用数组实现了这个平铺地图如下所示 1 or 棕色瓷砖路上有障碍物玩家无法通过 0 or 绿色瓷
从 PL/SQL 调用 shell 脚本，但 shell 以 grid 用户而非 oracle 身份执行

我正在尝试使用 Runtime getRuntime exec 从 Oracle 数据库内部执行 shell 脚本在 Red Hat 5 5 上运行的 Oracle 11 2 0 4 EE CREATE OR REPLACE proced
从 bash 从新的 Google Chrome 浏览器会话获取“用户代理”字符串

我想要得到用户代理 HTTP 请求标头 https developer mozilla org en US docs Web HTTP Headers User Agent来自 bash 的新 Google Chrome 浏览器会话刚刚打
仅打印“docker-container ls -la”输出中的“Names”列

发出时docker container ls la命令输出如下所示 CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES a67f0c2b1769 busybox tail f dev
.profile 无法从 Mac 终端运行

我有一个 profile 文件我正在终端中读取并使用别名但在某些时候别名由于没有明确的原因而停止工作其他命令仍在工作为了快速修复我删除了 rm 并在用户目录中重新创建了 profile 文件我可以看到至少在该目录中没有 ba

随机推荐

通过 javascript API 保存和恢复 Tableau 图形的当前视图状态

问题如何通过 javascript API 存储并随后检索 Tableau 视图的自定义状态描述我正在开发一个网站目前允许任何用户将一组 Tableau 视图协作为类似 PowerPoint 的在线演示文稿以供以后使用在我们当前的
如何从当前文件路径向上导航一个文件夹？

我需要从文件的当前路径向上导航一个文件夹并在那里保存相同的文件如何从目录路径中剥离一级谢谢你 C Users stacy zim AppData Local Temp ICLocal e53486af 7e5e 4c54 b9dc d
在 C# 中制作公式将美元金额转换为面额

我正在编写一个程序将任何输入金额转换为二十十五和个的面额这是我遇到的问题 int twenties dollar 20 int tens twenties 2 int fives tens 2 int ones fives 5 美元
第三方 Oracle .NET 提供商的比较

我正在清理 Oracle 数据库应用程序在此应用程序中性能和易于访问是最重要的考虑因素它必须不妨碍您让您以自由且不受限制的方式获取数据这样做的同时必须very快速地当它不能很快时它必须是多线程的这样才不会冻结系统所有这些
如何使用 vi 编辑器在 KornShell 命令行中自动完成

在 KornShell ksh 上AIX UNIX 版本 5 3将编辑器模式设置为 vi 使用 set o vi 在 shell 命令行中按什么键可以自动完成文件或目录名 ESC 至少在 AIX4 2 上工作得很好我注意到的一件事是它只自
如何找到 OpenGL es 2.0 顶点着色器专业版中所有制服的列表

我正在尝试学习如何对顶点着色器进行编程在苹果的示例项目中他们有一行来设置 glUniform1f uniforms UNIFORM TRANSLATE Glfloat transY 然后这个值被用在 value passt in f g
Zend_Framework- 在哪里放置 $_GET 和 $_POST （HTTP 请求）处理？

我最近读过这个帖子 http blog astrumfutura com archives 373 The M in MVC Why Models are Misunderstood and Unappreciated html这导致了一系
如何获取 DataGridView 控件上滚动条的大小？

如何获取控件例如 DataGridView 上显示的水平滚动条的高度和或垂直滚动条的宽度 Use SystemInformation HorizontalScrollBarHeight SystemInformation Vertic
Ruby on Rails 警告“ruby 正在以不安全的方式加载 libcrypto”

当我在终端上运行 Rails 命令例如创建模型时这是我收到的错误 WARNING Users my mac username rvm rubies ruby 2 5 3 bin ruby is loading libcrypto in
PowerShell：在 cmdlet 之后连接字符串与变量

我经常发现自己必须在 cmdlet 之后连接字符串和变量例如 New Item archive path logfile txt type file 如果我尝试运行此命令 PowerShell 会抛出以下错误 New Item 找不到接受
使用 XSD 进行 XML 验证时出现无效子元素错误，我不知道为什么？

使用以下内容我总是收到无效子元素错误我是 XML 的新手我一直在网上寻找并尝试解决这个问题但没有运气我有另一个 XSD 正在验证提交到我的应用程序的 XML 它工作得很好但它使用的是属性而不是元素无法使用 XSD 中的元素来验证
带有字符类的 fscanf

假设我有一个文件dog txt The quick brown fox jumps over the lazy dog 我可以像这样从文件中读取 include
在Google Spanner中，是否有可能在已经观察到之后再次出现完全相同的提交时间戳

在 Google Spanner 中提交时间戳由服务器生成并基于 TrueTime 如中所述https cloud google com spanner docs commit timestamp https cloud google c
查找用户定义类型的 SQL 基本类型

我正在使用具有大量用户定义的 SQL 类型的旧数据库我正在 NET 中编写一个方法其中在 SqlParameter 对象中定义参数我需要用户定义类型的基础 SQL 类型以便在运行时动态创建参数时正确定义参数为此我创建了这个过程
正则表达式匹配 LaTeX 方程

我正在尝试配置 TeXWorks 编辑器以使用与 TeXMaker 相同的语法着色然而 TexWorks 使用正则表达式来指定应该着色的内容不幸的是它没有数学的默认设置我想匹配之间的所有内容 and 之间的一切 and 之间的一切 a
剧作家单击下拉菜单中的按钮

这是该对象的 html div class filter component filter component 1 p class usa accordion heading p div
时间轴上刻度子集的日期格式

Problem 我想格式化我的 X 轴时间以便周末清晰可见我想显示日期以及星期几现在的情况我用下面的完整代码来做到这一点 scale x date breaks myData timestamp labels paste su
Google Cloud Datastore runQuery 返回 412“未找到匹配的索引”

更新感谢 Alfred Fuller 指出我需要为此查询创建手动索引不幸的是从 NET 应用程序使用 JSON API 似乎没有官方支持的方法事实上官方似乎根本没有一种方法可以从 App Engine 之外的应用程序执行此操作这
哪个更快：4 行或矩形 SWT Java

在 SWT 中绘图时 4 条线或矩形之间是否存在性能差异即使差异很小我也很感兴趣我正在创建的系统每帧可以进行大量此类调用在我工作的一个系统上在对其进行分析后我们从绘制一个矩形两条线改为绘制多段线并且我们在绘制方面得到了很大的
awk：多个CSV文件中多列数据的数学运算

我正在开发 bash 脚本该脚本循环多列数据填充并执行集成的 AWK 代码来操作多列数据 bin bash home PWD folder with the outputs rescore home rescore folder with

awk：多个CSV文件中多列数据的数学运算

awk：多个CSV文件中多列数据的数学运算 的相关文章

随机推荐

热门标签

awk：多个CSV文件中多列数据的数学运算的相关文章