合并具有不同计数值的多个文件

2023-12-08

我想通过从每个文件中取出第二列来合并 96 个文件，并保留所有文件之间相似的第一列。我尝试在 R 中执行此操作，但认为在终端中会更好。使用awk可以吗？

样本数据：

DMED7013:Rfam robinm$ head Rfam_Counts_combined_SplitRfam_Counts_combinedhtseq_Rfamoutput402R.sam
Seq_../trimmed/402R.tally.fasta __not_aligned
__too_low_aQual 3
mir-10 5
Y_RNA 4
__too_low_aQual 0
__too_low_aQual 0
__not_aligned 1
mir-8 2
mir-671 3
mir-671 16

文件：

DMED7013:Rfam robinm$ ls -l  
-rw-r--r--   1 robinm  staff  1711388 Sep 22 19:12 Rfam_Counts_combined_SplitRfam_Counts_combinedhtseq_Rfamoutput100G.sam
-rw-r--r--   1 robinm  staff  1712778 Sep 22 19:12 Rfam_Counts_combined_SplitRfam_Counts_combinedhtseq_Rfamoutput100R.sam
-rw-r--r--   1 robinm  staff  1709703 Sep 22 19:12 Rfam_Counts_combined_SplitRfam_Counts_combinedhtseq_Rfamoutput106G.sam
-rw-r--r--   1 robinm  staff  1707486 Sep 22 19:12 Rfam_Counts_combined_SplitRfam_Counts_combinedhtseq_Rfamoutput106R.sam
-rw-r--r--   1 robinm  staff  1704757 Sep 22 19:12 Rfam_Counts_combined_SplitRfam_Counts_combinedhtseq_Rfamoutput122G.sam
-rw-r--r--   1 robinm  staff  1705471 Sep 22 19:12 Rfam_Counts_combined_SplitRfam_Counts_combinedhtseq_Rfamoutput122R.sam
.....

你可以尝试（如果我理解正确的话）

awk '!($1 in d){d[$1]=$2; next}
     {d[$1]+=$2}
     END{for(key in d) print key, d[key]; }' *.sam

you get:



__too_low_aQual 3
mir-671 19
mir-8 2
__not_aligned 1
Y_RNA 4
mir-10 5

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

awk

合并具有不同计数值的多个文件的相关文章

如何使用 bash 显示具有两个子文件夹的文件夹？

我通过 Cygwin 使用 bash 我有一个大文件夹 a 有很多子文件夹 b 这些子文件夹各有一个或两个子文件夹 c 我想找到所有有两个子文件夹 c 的子文件夹 b 并输出它们结构如下 a b1 c1 b2 c1 c2 b3 c1 c2
通过特定分隔符删除字符串

我的文件中有几列其中第二列有分隔符我想删除第二列中的第一个第三个和第四个字符串并将第二个字符串留在该列中但我有正常的分隔符空间所以我不知道 input 22 16050075 A G 16050075 A G 22 16050
如何将查找和替换限制为 CSV 中的一列？

我有一个 4 列 CSV 文件例如 0001 fish animal eats worms I use sed对文件进行查找和替换但我需要将此查找和替换限制为仅在第 3 列中找到的文本如何让查找和替换仅发生在这一列上您确定要使用se
Bash + sed/awk/cut 删除第 n 个字符

我试图删除每行的第 6 7 和第 8 个字符下面是包含文本格式的文件实际输出 cat test 18 40 12 172 16 70 217 UP 18 42 15 172 16 70 218 DOWN 格式化后如下所示 cat tes
使用 awk 解析日志文件

我尝试使用以下代码解析日志文件 if line match then awk 2 vFiler echo vFiler 解释有一些行以这样的模式开头或 vol 后跟名称我想找到所有以或 vol 并将后面的字符串设置为等于变量但我真
仅替换引号之间的空格

我有日志文件中的一行 field 1234 text in quotes 1234 other text in quotes 我想替换引号之间的空格这样我就可以使用空格作为分隔符来提取列所以结果可能是这样的 field 1234 tex
打印文件的每第 n 列

我有一个相当大的文件有 255 个逗号分隔的列我只需要打印出每第三列我正在尝试这样的事情 awk for i 0 i lt NF i 3 print i file 但这似乎不是解决方案因为它只打印到一长列有人可以帮忙吗谢谢这是
AWK 错误：尝试在标量上下文中使用数组

我正在学习AWK 这是一个简单的代码片段我尝试将字符串拆分为数组并迭代它 BEGIN split a b c a for i 1 i lt length a i print a i 运行此代码时我收到以下错误 awk awk txt 4
AWK 或 sed 方式粘贴非相邻行

cat file aaa bbb ccc ddd eee jjj kkk lll mmm nnn ooo ppp 以下 AWK 命令会将 mmm 行粘贴到 ddd eee 行的末尾有没有更简单的方法使用 AWK 或 sed 来做到这一点
我应该使用 AWK 或 SED 删除 CSV 文件中引号之间的逗号吗？（重击）

我有一堆日常打印机登录CSV格式我正在编写一个脚本来跟踪使用了多少纸张并将信息保存到数据库中但我遇到了一个小问题本质上日志中的一些文档名称中包含逗号全部用双引号引起来并且由于它采用逗号分隔格式所以我的代码搞乱了并将所有内容推到
如何调用 awk 中的 split 函数来分割“\.”上的字符串？

我该如何使用split用分割的函数例如首先考虑分割 echo 03 26 12 awk split 0 a print a 3 a 2 a 1 产生以下输出 122603 但如果传入的字符串是 echo 03 26 12 awk sp
在linux中将包含word的行从一个文件复制到另一个文件

我想复制包含某些单词的行file1 to file2 Suppose file1 ram 100 ct 50 gopal 200 bc 40 ravi 50 ct 40 krishna 200 ct 100 file2应该只有包含 ct 的
如何使用管道字符分隔符分隔字段

我知道这个问题已经被问过但我发现没有一个解决方案对我有用我有一个程序其输出如下 COUNT 293 1 lps 我对第二个字段感兴趣但是这些尝试都没有成功 spawn 1 cut d f2 spawn 1 cut d f2 spaw
从 shell 查找不包含特定注释的 XML 文件

我想搜索 awk grep sed 几个 XML 文件 pom xml 文件跳过某些文件夹而且第一个条件是它们必须包含标签
awk 脚本中出现“BEGIN 块必须有操作部分”错误

这是我的代码 bin sh filename usr bin find name INSTANCE log echo filename is filename awk BEGIN print Processing file filename
awk 在循环中使用时不打印任何内容[重复]

这个问题在这里已经有答案了我有一堆使用 file 1 a 1 txt 格式的文件如下所示 A 1 B 2 C 3 D 4 并使用以下命令添加包含每个文件名称的新列 awk print FILENAME NF t 0 file 1 a 1
将 PHP 短开放标签替换为

我有大量多年来编写的 php 文件我需要将所有短开放标签正确替换为正确的显式开放标签 change

从实时 tcpdump 捕获中提取唯一的 IP

我使用以下命令从实时 tcpdump 捕获中输出 IP sudo tcpdump nn q ip l awk print 3 fflush stdout gt gt ips txt 我得到以下输出 192 168 0 100 50771 1
使用awk将列中的值替换为txt文件中的另一个值

我是 Linux 和 awk 脚本编写的新手我有 tab delim txt 文件如下所示 AAA 134 145 Sat 150 167 AAA 156 167 Sat 150 167 AAA 175 187 Sat 150 167
sed：替换文本块

我有一堆文件从一段代码开始我试图用另一个代码块替换 Replace

随机推荐

Spring依赖注入到其他实例

来自应用程序上下文 xml
控制可能到达非 void 函数错误 if 语句的末尾

我收到此代码上的错误 Control may get end of non void function NSInteger tableView UITableView tableView numberOfRowsInSection NSIn
如何使用 Rally REST .NET 获取工作区列表

我正在尝试获取给定 Rally 订阅的可用工作区列表但查询中似乎并未返回实际工作区这是我到目前为止所拥有的 RallyRestApi restApi new RallyRestApi username password List
在这种情况下，这个 AssertionError 永远不会被抛出吗？

首先是代码来自 JCIP 列表http jcip net listings StuffIntoPublic java and http jcip net listings Holder java public class SafePubl
在android中读取Json数组

我正在尝试读取 JSON 数组这是我的代码 JSONArray jArray new JSONArray jsonString System out println JARRAY jArray length for int i 0 i
DataGridView 不显示列/数据

我正在尝试将一些数据加载到 DataGridView 中但是 DataGridView 没有显示数据即使它在调试模式下显示其中包含项目 protected void PopulateGrid string dataSource test
AppBarLayout.ScrollingViewBehavior - 屏幕外视图底部

当使用AppBarLayout与标准ScrollingViewBehavior 默认情况下 AppBarLayout 的同级将是 CoordinatorLayout 的高度而同级的底部将超出屏幕 AppBarLayout 的高度在我的用
存储 8M+ sha256 哈希值的最有效内存方式

我一直在使用dict存储键值对其中键和值都是 sha256 哈希摘要我需要能够找出列表中是否存在某个键并且还能够检索该字典的值目前根据我的一些测试我估计需要大约 10Gb 的内存来存储 8 000 000 个哈希值而实际存储的
我有一个简单的 svg 元素它有元素的子元素 fiddle
如何根据日期删除多个间隔分区？

我有一个基于每日分区的表我可以使用以下查询删除分区 ALTER TABLE MY TABLE DROP PARTITION FOR TO DATE 19 DEC 2017 dd MON yyyy 如何在15天内删除所有分区多个分区您可
在 Tkinter.Tcl() 中使用 Python 函数

我有很多 Python 函数让我们称呼他们为foo bar and baz 它们接受可变数量的字符串参数并执行其他复杂的操作例如访问网络我希望用户假设他只熟悉 Tcl 使用这些函数在 Tcl 中编写脚本这是一个例子取自Macp
如何在以句点结尾的注释行后禁用 RubyMine 代码完成？

我正在使用 RubyMine 6 3 2 当我输入以下行并按回车键时 This is a comment 编辑器插入附加文本结果是 This is a comment after do end 我知道发生这种情况是因为 aft 是输入后
R 图中的文本无法正确显示

我的 R 安装在 Ubuntu 20 04 1 VM 上的 conda 环境中当我发现这个线程时我正在寻找这个问题我也在 Debian 10 0 buster 上使用 Anaconda 的 RStudio Try par family
如果 :target 不存在，如何为元素设置默认样式

我有一个带有 3 个链接的标题所有链接都链接到具有相应 id 的特定 div body font size 32px links display flex a padding 10px box not target display non
如何将编辑项添加到 TFS 工作项中的预定义列表

I am trying to follow this article to do the same for adding a new State to a particular project s Bug work item By defa
jQuery：如何包装（）动态加载的元素？

我正在为一个本身没有 HTML 的第 3 方应用程序进行换皮这一切都来自 onLoad 事件和一堆 ajax 调用我将 jQuery 添加到页面中我需要wrapp 一个动态加载的元素如果需要的话我可以添加一个插件我该怎么做呢谢谢
绑定 this 后 setState 不是一个函数

我有一个简单的表单允许用户创建纯文本帖子下面的代码生成一个成功的服务器端响应createPostRequest称呼但是在成功发布后我想更新状态以清空 postBody 字段并更新 UI 以反映此更改然后允许用户发出后续请求以发布
构建工具更新破坏了我的编译

我今天早上4点到5点更新了Android Studio 2 0 Preview 如果我继续构建 dependencies classpath com android tools build gradle 2 0 0 alpha3 这仍然会编
在java中，如何从jar文件中检索图像？

我在将 java 项目导出到 jar 从 Eclipse 时遇到问题我已将一个文件包含在名为的 jar 中images 它包含我的项目使用的所有图像文件问题是我对这些图像的引用仅在项目isn t罐子形式我不明白为什么我想知道是否需
合并具有不同计数值的多个文件

我想通过从每个文件中取出第二列来合并 96 个文件并保留所有文件之间相似的第一列我尝试在 R 中执行此操作但认为在终端中会更好使用awk可以吗样本数据 DMED7013 Rfam robinm head Rfam Counts c

合并具有不同计数值的多个文件

合并具有不同计数值的多个文件 的相关文章

随机推荐

热门标签

合并具有不同计数值的多个文件的相关文章