从文件中读取行，在第二个文件中 grep ，并为每个 $line 输出一个文件

2024-04-26

我有以下两个文件：

sequences.txt

158333741       Acaryochloris_marina_MBIC11017_uid58167 158333741       432     1       432     COG0001 0
158339504       Acaryochloris_marina_MBIC11017_uid58167 158339504       491     1       491     COG0002 0
379012832       Acetobacterium_woodii_DSM_1030_uid88073 379012832       430     1       430     COG0001 0
302391336       Acetohalobium_arabaticum_DSM_5501_uid51423      302391336       441     1       441     COG0003 0
311103820       Achromobacter_xylosoxidans_A8_uid59899  311103820       425     1       425     COG0004 0
332795879       Acidianus_hospitalis_W1_uid66875        332795879       369     1       369     COG0005 0
332796307       Acidianus_hospitalis_W1_uid66875        332796307       416     1       416     COG0005 0

allids.txt

COG0001
COG0002
COG0003
COG0004
COG0005

现在我想阅读其中的每一行allids.txt, 搜索所有行sequences.txt（特别是在第 7 列），并为每个写line in allids.txt具有文件名的文件$line.

我的方法是使用一个简单的 grep：

while read line; do
  grep "$line" sequences.txt
done <allids.txt

但是我应该在哪里合并输出命令呢？如果有更快的命令，请随时提出！

我的预期输出：

COG0001.txt

158333741       Acaryochloris_marina_MBIC11017_uid58167 158333741       432     1       432     COG0001 0
379012832       Acetobacterium_woodii_DSM_1030_uid88073 379012832       430     1       430     COG0001 0

COG0002.txt

158339504       Acaryochloris_marina_MBIC11017_uid58167 158339504       491     1       491     COG0002 0

[and so on]

使用它非常简单awk:

awk 'NR==FNR{ids[$1]; next} $7 in ids{print > ($7 ".txt")}' allids.txt sequences.txt

参考： 有效的 AWK 编程 https://www.gnu.org/s/gawk/manual/gawk.pdf

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

bash

awk

grep

从文件中读取行，在第二个文件中 grep ，并为每个 $line 输出一个文件的相关文章

查找-exec选项

比如说我想找到一些文件并执行 chmod 并使用另一个命令对其执行某些操作例如 find name txt exec chmod 666 cp dst it says find missing argument to exec 我该如何
将多个参数传递给 UNIX shell 脚本

我有以下 bash shell 脚本理想情况下我会用它来按名称杀死多个进程 bin bash kill ps A grep awk print 1 然而虽然此脚本有效但传递了一个参数端镀铬脚本名称为end 如果传递多个参数则它不
获取当前时间（以小时和分钟为单位）

我正在尝试从系统收集信息并且需要获取当前时间以小时和分钟为单位目前我有 date awk print 4 输出如下 16 18 54 怎样才能把秒数去掉呢提供格式字符串 date H M Running man date将给出所有格
我如何在 ruby 中执行范围正则表达式，例如 awk /start/,/stop/

我想做一个 AWK 风格的范围正则表达式如下所示 awk hoststatus file 在 AWK 中这将打印文件中两个模式之间的所有行 hoststatus host name myhost modified attributes
验证 BASH 脚本时出现问题 [已关闭]

Closed 这个问题是无法重现或由拼写错误引起 help closed questions 目前不接受答案我在尝试验证 bash 脚本时出现代码 lint 错误 bin bash if eq 0 then printf No argum
Bash 脚本重定向不起作用，为什么？ [复制]

这个问题在这里已经有答案了我最近在 bash 脚本中发现了意外行为我想在解决它之前先了解它这是一个简化的示例 bin sh SCRIPT tmp echoscript sh gt gt tmp log bin sh SCRIPT ec
使用 grep 查找两个字符之间的字符串

我发现了这一点answer https stackoverflow com a 1454936 2068595用于查找两个字符之间的字符串的正则表达式就我而言我想找到之间的每一个模式 and 这是正则表达式 lt 确实当我尝试它时它有
在 UNIX 时间戳 Shell/Bash 中将日期与时区转换

我需要将日期从格式为 yyyy mm dd hh mm ss TZ 的字符串转换为 UNIX 时间 TZ 时区到目前为止我所做的是将没有时区的 yyyy mm dd hh mm ss 格式的日期转换为时间戳 dateYMD 2019 2
Bash 脚本：语法错误：意外的文件结尾[重复]

这个问题在这里已经有答案了我有以下文件并且该文件上有 chmod a x 当我尝试运行它时出现第 75 行语法错误意外的文件结尾我的脚本有什么错误我需要做什么来修复它 bin sh log directory for ascp
想要运行命令列表，但能够在运行时编辑该列表

我有一个要运行的 bash 命令列表
如何查找出现在括号之间的所有单词？

我有一个文件其中包含括号中的一些单词我想编制一个出现在那里的所有独特单词的列表例如 This is some text This text has some words in parenthesis Sometimes there a
如何替换每行中出现的所有字符串？

我想在以下脚本中将所有出现的用户名替换为但它仅替换第一次出现的情况 ls al sed s username 这就是 sed 默认情况下的工作方式吗提前致谢你需要g 全局修饰符 sed s username g
如何摆脱每个新终端会话上运行的某些内容？

我正在使用狮子我在每个新的终端会话上都会输出一个错误 bash rvm add to path command not found 这是一个几乎全新的用户帐户 RVM 安装在计算机上的另一个帐户上 bashrc 和 bash profil
envsubst 不能进行就地替换吗？

我有一个配置文件其中包含一些 ENV VARIABLE 样式的变量 This is my file It might contain EXAMPLES of text 现在我希望将该变量替换为保存在实际环境变量中的值所以我正在尝试这个
-bash: gulp: 在 Mac 中找不到命令

我尝试在 mac 中安装 gulp 如下所示 Is iMac itop npm root Users itop node modules Is iMac itop npm config set prefix usr local Is iMa
当我通过 shell 脚本创建 .txt 文件时，为什么文件名末尾出现问号？ [复制]

这个问题在这里已经有答案了我正在编写一个 shell 脚本我应该在其中创建 1 个文本文件当我这样做时文件名末尾出现一个问号是什么原因我正在 bash 脚本中尝试以下方法 1 grep ERROR a1 gt text txt
如何在 Bash 中为数组赋值？

我正在尝试从文本文件中读取值列表你好 txt 并将它们存储在一个数组中 counter 0 cat hello txt while read line do Unix Array counter line let counter coun
Bash - 如何将参数传递给通过标准输入读取的脚本

我正在尝试从标准输入执行脚本并将参数传递给它有办法做到吗假设我有以下内容 cat script sh bash 我如何将参数传递给脚本我不想这样做 bash script sh arguments 也不是这个 script sh ar
xdotool 类型需要很长时间并导致整个桌面冻结

我一直在使用xdotool type过去只能在快捷方式上输入耸肩xdotool type 这可行但总是需要相当长的时间并导致整个桌面冻结完全冻结而不仅仅是输入几秒钟不过并没有太打扰我现在我需要一种方法来从文件中读取内容对其进
sed-删除不包含模式的行

我很惊讶我在 SO 上找不到与此类似的问题如何使用 sed 删除所有不包含特定模式的行例如我有这个文件 cat kitty dog giraffe panda lion tiger 我想要一个 sed 命令当调用该命令时它将删除所

随机推荐

Susy：根据屏幕尺寸改变列数

在 Compass Sass 插件中 Susy http susy oddbird net 您可以在 base scss 文件中设置列数对于桌面视图我喜欢有 12 列然而对于移动视图来说这列太多了有没有办法更改移动显示的列数我
奇怪的 if 语句

我发现这很奇怪if 别人代码中的语句 if variable 1 0 我不明白它应该有两个 right 有人可以解释一下吗条件式是一个按位运算符 https wiki python org moin BitwiseOperators比较
Rails 管理自定义：将 html 视图嵌入到仪表板中

我们已从 Rails 管理起始页面删除了仪表板和历史记录现在我们想嵌入一个谷歌分析页面供用户查看 GA 的仪表板该页面由一些简单的 HTML 组成问题如何在 Rails 管理仪表板中嵌入 html 页面答案很简单我需要创建以下
Windows 上 python 的长路径 - os.stat() 对于相对路径失败？

我想访问 Windows 上的一些长 UNC 路径我知道我需要使用 UNC 前缀即 UNC 如果你逃脱了斜线效果很好 os stat UNC server example com that has long path aaaaaaaa
静态方法和实例方法的方法参考

对于 Java 中的实例方法我无法理解方法引用的概念例如在下面的示例中编译器在列表行中给出错误我看过 String toUpperCase 的例子我对这一点感到困惑 1 String是类 toUpperCase是实例方法 Jav
当用户单击控制台窗口时代码停止执行

我有一个控制台应用程序无需用户交互即可执行我的代码如果用户有意或无意地在控制台窗口内单击所有执行都会停止这与从控制台窗口复制文本有关应用程序再次开始执行的唯一方法是用户选择文本然后右键单击控制台窗口将其复制到剪贴板要查看实际
新用户创建后使用 Dropzone.js 上传，发送标头

我正在使用一个很棒的插件 dropzone js dropzonejs com 来让我的网站在注册新用户时更加漂亮基本上用户填写一个表单将几个图像放入 dropzone 然后单击提交这会触发一个 ajax 调用将表单发布到 ph
Safari 扩展弹出窗口链接

是否可以在 Safari 弹出窗口中使用链接我已经做了我能想到的所有事情但似乎向弹出窗口添加链接只会改变外观并且不会导致任何可点击的内容无论是使用 href 还是 onclick 您可以在 href 或 div 上添加 onclic
asp.net mvc 树路径的复杂路由

我想知道如何定义这样的路由映射 TreePath Action Id TreeMap 是从数据库动态加载的如下所示 Gallery GalleryA SubGalleryA View 3 您可以创建自定义路由处理程序来执行此操作实际路线
当我从 Django 应用程序“打印”它们时，它们会去哪里？

我在 Linux 服务器上有一个 Django 应用程序在其中一种观点中某种形式print命令被执行并打印一些字符串我怎样才能知道打印的字符串是什么是否有一些日志保存这些东西输出应该在 django 启动的终端中如果你不直接启
Cassandra 中的强一致性

根据datastax文章可以保证强一致性如果 R W gt N 在哪里 R是读操作的一致性级别 W为写操作的一致性级别 N 是副本数这里的强一致性是什么意思呢这是否意味着每次从数据库给出查询响应时响应将始终是最后更新的值
跨 AVX 通道的最佳方式是什么？

有些问题具有类似的标题但我的问题涉及其他地方未涵盖的一个非常具体的用例我有 4 个 128d 寄存器 x0 x1 x2 x3 我想将它们的内容重新组合在 5 个 256d 寄存器 y0 y1 y2 y3 y4 中以准备其他计算 on
使用 C#/C++ 托管 VST/DX 仪器？ [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我试图了解用 C 或 C 构建准系统虚拟仪器主机所需的工作量但我无法获得任何硬信息有人知道有什么好的
Pandas DataFrame MultiIndex groupby 滚动操作缺少日期

我有一个数据框其中有一个 MultiIndex 其中索引的最后一列是日期我正在尝试以特定频率对列进行滚动操作据我了解如果我有 TimeIndex 通常的 pandas 方法是使用频率字符串调用滚动函数例如如果我希望窗口为两天则
VB6 和 .PFX 代码签名

我的老板已经从 Comodo 获得了证书而我一直在努力寻找获得证书问题的解决方案intoVB6 应用程序证书本身是 VB6 格式的我对这类事情几乎一无所知 Comodo 的人真是太乐于助人了我的老板说他可以在互联网上找到一些东西显
找出用于制作 JAR 的 Scala 版本

我试图弄清楚使用哪个 Scala 版本进行编译A jar 我有两个版本一个来自我的 ivy2 存储库另一个来自 Maven 运行后jar xf A jar 我苦苦寻找scala and version 但什么也没发现 grep ri s
Mechanize 出现 SSL 错误

我得到了这些命令irb require mechanize agent Mechanize new agent get https monabo lemonde fr customer account forgotpassword 我收到这
highcharts 弄错了我的时间

highcharts 弄错了我的时间我来自委内瑞拉以防万一我正在做一个实时系统我可以在数据库中获取时间秒和毫秒例如 10 39 09 2 我应用 strtotime time 然后通过 json 发送到图表在我的高图表中我进
Seaborn 线图使用中位数而不是均值

我在用着seaborn lineplot 创建像这样的线图代表平均值的线由代表标准差的带包围 sns lineplot x trial y rvalues hue subject err style band ci sd data df
从文件中读取行，在第二个文件中 grep ，并为每个 $line 输出一个文件

我有以下两个文件 sequences txt 158333741 Acaryochloris marina MBIC11017 uid58167 158333741 432 1 432 COG0001 0 158339504 Acaryoc

从文件中读取行，在第二个文件中 grep ，并为每个 $line 输出一个文件

从文件中读取行，在第二个文件中 grep ，并为每个 $line 输出一个文件 的相关文章

随机推荐

热门标签

从文件中读取行，在第二个文件中 grep ，并为每个 $line 输出一个文件的相关文章