使用从 bash 中的文件读取的数组并行化 while 循环

2024-03-10

我在 Bash 中有一个 while 循环，处理如下：

while IFS=$'\t' read -r -a line;
do
    myprogram ${line[0]} ${line[1]} ${line[0]}_vs_${line[1]}.result;
done < fileinput

它从具有以下结构的文件中读取，以供参考：

foo   bar
baz   foobar

等等（制表符分隔）。

我想使用 GNU 并行并行化这个循环（因为条目很多并且处理可能很慢），但是这些示例不清楚如何将每一行分配给数组，就像我在这里所做的那样。

可能的解决方案是什么（GNU 并行工作的替代方案）？

我想要@chepner hack。通过限制并行执行的数量来完成类似的行为似乎并不那么棘手：

while IFS=$'\t' read -r f1 f2;
do
    myprogram "$f1" "$f2" "${f1}_vs_${f2}.result" &

    # At most as number of CPU cores
    [ $( jobs | wc -l ) -ge $( nproc ) ] && wait
done < fileinput

wait

它限制系统上存在的最大 CPU 核心数的执行。您可以通过替换轻松地改变它$( nproc )按所需数量。

同时你应该明白什么是不诚实的分配。因此，它不会在一个线程完成后立即启动新线程。相反，它只是在启动最大数量后等待完成所有操作。因此，汇总吞吐量可能略低于并行吞吐量。特别是如果程序的运行时间可能变化很大。如果每次调用所花费的时间几乎相同，则汇总时间也应该大致相等。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

bash

parallelprocessing

gnuparallel

使用从 bash 中的文件读取的数组并行化 while 循环的相关文章

如何查找所有以句号结尾的单词？

我有一个包含许多以 a 结尾的单词的文件其中大部分是缩写例如 etc p s 如何输出一个仅显示一次所有这些单词的列表所有单词前面都有一个空格因此可以使用该空格来查找单词的开头没有一个单词出现在该行的开头文件中没有句子因此句点
如何从 bash 数组中删除元素而不展平数组

我想创建一个采用 bash 数组的函数如下所示 a element zero element one element two 并删除一个元素如元素一并留下一个数组如下所示 a element zero element two 这样
在bash脚本中分割字符串[重复]

这个问题在这里已经有答案了我想分割一个字符串并需要其中的一些参数 USER dn uid dfl3030 cn users cn accounts dc tenant dc ycs dc io cn Reb Lena Schmidt kr
分叉/多线程进程|重击

我想让我的代码的一部分更加高效我正在考虑让它分叉成多个进程并让它们一次执行 50 100 次而不是只执行一次例如伪 for line in file do foo foo2 foo3 done 我希望这个 for 循环运行多次我
查找哪个程序运行另一个程序

我有一个 NAS 运行在 Redhat Linux 的有限版本上我按照指示破解了它这样我就可以访问 shell 这很有帮助我还做了一些修改其他人也做过修改除了一个问题之外它们似乎都工作得很好不知何故每隔 22 天系统就会关
BASH：将数据从平面文件导入模板

我有一个平面记录文件每行有 33 行我需要将此文件格式化为模板中的规格模板为 DOS 格式源文件为 NIX 格式该模板具有必须遵守的特定缩进和间距我想到了几个选择 BASH 与经典的 nix 工具 sed awk grep 等
Volatile.Read 和 Volatile.Write 背后的逻辑是什么？

来自 MSDN Volatile Read 读取字段的值在需要它的系统上插入一个阻止处理器重新排序内存的内存屏障操作如下如果在该方法之后出现读或写代码处理器无法移动它before这个方法 and Volatile Write
在两次之间每分钟执行一次 Cronjob

我需要在 crontab 中每分钟运行一个 bash 脚本8 45am and 9 50am每天的 Code 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 8 home pull sh gt ho
sh / Bash shell 脚本中 !# (bang-pound) 的含义是什么？

我想了解这个 Scala 脚本是如何工作的 usr bin env bash exec scala 0 object HelloWorld def main args Array String println Hello world arg
用于计算数据文件中数字列表的平均值的脚本

文件data txt包含以下内容 1 00 1 23 54 4 213 2 3 4 脚本的输出应该是 ave 54 646 一些简单的脚本是首选这是一种方法 awk s 1 END print ave s NR RS file ave 5
通过shell脚本进行串口控制

我正在开发一个方向控制器我有一个开发板它通过 I2C 与传感器指南针通信由于主板非常有限没有操作系统我开发了一个简单的程序来接收以下内容 1 get 0 读取传感器的寄存器 0 2 set 0 10 将传感器的寄存器 0 设置
与 GridSearchCV 的并行错误，与其他方法一起工作正常

我使用 GridSearchCV 时遇到以下问题它在使用时给我一个并行错误n jobs gt 1 同时n jobs gt 1与 RadonmForestClassifier 等单一模型配合良好下面是一个显示错误的简单工作示例 train
使用 python 更改目录

我碰巧发现我无法从 python 代码中更改实际目录我的测试程序如下 from os import system def sh script system bash c s script sh cd home sh pwd 的输出pwd
如何在不同目录中启动多个窗口的 tmux？

我想使用脚本打开一个有 6 个窗口的 tmux 会话每个窗口位于不同的目录中我开始于我找到的一个脚本 http blog hawkhost com 2010 07 02 tmux E2 80 93 the terminal multip
从 systemd bash 内联脚本创建 filename_$(date %Y-%m-%d)

我正在尝试执行systemd计时器并希望将执行脚本的输出保存在每个日期的文件中这是我的ExecStart脚本中的 service file ExecStart bin bash c echo date Y m d gt gt home u
awk 的 printf 插入多个变量的正确语法是什么？

我复制了一些使用 printf 输出字符串在文件中出现的频率的代码 awk BEGIN print The number of times a appears in the file a a counter 1 END printf s n
并行 dask for 循环比常规循环慢？

如果我尝试使用 dask 并行化 for 循环它最终会比常规版本执行得慢基本上我只是按照 dask 教程中的介绍性示例进行操作但由于某种原因它在我这边失败了我究竟做错了什么 In 1 import numpy as np from
数组上的 Bash 子字符串扩展

我有一组带有给定后缀的文件例如我有一组带有后缀的pdf文件 pdf 我想使用子字符串扩展来获取不带后缀的文件名对于单个文件我可以使用 file test pdf echo file 0 4 要对所有文件执行此操作我现在尝试 file
无法在 Windows 10 上运行 Python 3.7“权限被拒绝”

当尝试使用 Git Bash 在 Windows 10 上运行 Python 3 7 时出现以下错误 python version bash c Users Name AppData Local Microsoft WindowsApps
MPI 从文本文件中读取

我正在学习 MPI 编程我遇到了这个问题假设我有一个包含 100 000 行行的 txt 文件如何将它们分块以供 4 个处理器处理即我想让处理器 0 负责第 0 25000 行的处理让处理器 1 负责第 25001 50000

随机推荐

在 Windows 中获取另一个进程命令行

我正在尝试获取另一个进程的命令行参数在 WinXP 32 位上我执行以下操作 hProcess OpenProcess PROCESS QUERY INFORMATION PROCESS VM READ PROCESS TERMINAT
处理大位图

我只想从我的应用程序打开本机相机应用程序来捕获照片并将其设置为屏幕的背景图像然后单击按钮旋转它如果使用 3MP 相机拍摄照片会旋转 n 次如果我将相机分辨率设置为 5MP 或更高应用程序将在第五次单击按钮时强制关闭照片旋转 4
C# 中两个数组的关联

有两个双精度值数组我想计算相关系数单个双精度值就像 MS Excel 中的 CORREL 函数 C 中有一些简单的单行解决方案吗我已经发现了名为 Meta Numerics 的数学库根据这个问题 https stackoverfl
Python 调用函数的字符串格式

有没有办法使用新的格式语法格式化函数调用中的字符串例如 my request url was 0 get full path format request 所以它调用了该函数get full path 功能inside字符串而不是作为格式
是否有一个很好的 emacs 模式来显示和编辑巨大的分隔符分隔的文件？

我一直在寻找一段时间但没有找到一种可以轻松编辑大型制表符逗号冒号分隔文件的模式我一直想要一种确保列始终对齐的模式就像组织模式表一样我知道我可以轻松地将整个文件转换为组织模式表然后在完成后将其返回但是对于大文件来说这会变得非
如何在java中创建方法的监听器

我在实现方法的侦听器时遇到了非常糟糕的时间在我当前的工作中我必须每 5 秒请求一个方法以便验证新信息因此我想实现一种方法每次有新信息到来时通知我每 5 秒丢弃请求方法我已经阅读过有关观察者模式的内容但没有成功实施此致更多
正则表达式从电子邮件地址中提取顶级域名

来自电子邮件地址例如 email protected cdn cgi l email protection email protected cdn cgi l email protection email protected cdn cg
将 os.system() 的输出存储在变量中

我正在为我的 Hangman 游戏生成一个随机单词因此想要生成一个随机单词我正在使用 usr share dict words文件并执行以下操作 def word select import os word os system head
即使登录成功，Yii::app()->user->isGuest 也始终返回 true

我开始对已通过身份验证的用户和未通过身份验证的用户进行一些区分为此我正在使用 Yii app gt user gt id 但是在确定的视图中我输入了以下代码无论我是否登录成功我总是收到
监控所有 JavaScript 对象属性（神奇的 getter 和 setter）

如何在 JavaScript 中模拟 PHP 风格的 get 和 set 魔术 getter setter 很多人说目前这是不可能的我几乎可以肯定这是可能的因为像 nowjs 这样的项目 http nowjs com http now
是否有 R 函数用于检查指定的 GeoJSON 对象（多边形或多多边形）是否包含指定点？

我有一系列点 Sheet1 CoM ID 1040614 Genus Washingtonia Year Planted 1998 Latitude 37 81387927 Longitude 144 9817733 CoM ID 1663
Javascript，跟踪 iframe 重定向顶部窗口

由于除了沙箱之外没有办法阻止 iframe 重定向顶部框架沙箱会阻止可见性跟踪所需的其他功能因此我想跟踪重定向由于一个站点可以有多个 iframe 因此它可以是其中任何一个有没有办法跟踪找出哪个特定的 iframe 导致顶部框
使用 PHP DOMDocument 区分 XHTML 和 HTML

我想使用 PHP DOM 实现来操作 HTML 和 XHTML 文档我使用 DOMDocument gt loadHTML 方法来加载内容想知道加载的内容是 XHTML 还是 HTML DOMDocument 有一个 doctype 对
从空手道 0.9.5 升级到空手道 1.1.0.RC3 后出现“org.graalvm.polyglot.PolyglotException：ReferenceError：”[重复]

这个问题在这里已经有答案了描述升级到空手道 1 1 0 RC3 后收到参考错误消息脚步执行test feature文件测试特征 Scenario Get custom request def testUtils call read
如何在组件内部调用组件 [OctoberCMS]

I want to call a component inside a component with a variable like this 这是default html gt 的代码 div class container div cl
如何注册一个类以在 Qt 中的 QWebChannel 信号中使用它

我使用 QT 5 和 WebChannel 与 HTML 页面进行通信我成功地能够传达文本和字符串不过我想传达一些点数据官方文档说不需要手动消息传递和数据序列化 http doc qt io qt 5 qwebchannel htm
MVVM 中的后台线程进度通知？

如何修改 MVVM 视图模型Progress在后台线程上完成的工作的属性我正在创建一个 MVVM 应用程序它在后台线程上执行任务使用Task Factory StartNew and Parallel ForEach 我在用本文 ht
AT+CUSD 无法在华为 e3131a 调制解调器上工作

我试图发送 at 命令以在 huawei e3131a 调制解调器上获得平衡但无论我使用什么配置 GSM IRA UCS2 我总是收到 Ok 作为答案我还尝试更改操作员代码 123 到许多格式如十六进制 PDU 简单字符串但无法获得
使 in 子句将所有项目与任何替代项相匹配？

我有一张桌子hotel hotelid hotelname etc 和另一张桌子facilities facilityid facilityname 这两个表通过 table 链接hotel to facilities map hoteli
使用从 bash 中的文件读取的数组并行化 while 循环

我在 Bash 中有一个 while 循环处理如下 while IFS t read r a line do myprogram line 0 line 1 line 0 vs line 1 result done lt fileinpu

使用从 bash 中的文件读取的数组并行化 while 循环

使用从 bash 中的文件读取的数组并行化 while 循环 的相关文章

随机推荐

热门标签

使用从 bash 中的文件读取的数组并行化 while 循环的相关文章