正则表达式用 SED/AWK 替换特定列

2024-04-22

我的数据如下所示（制表符分隔）：

Organ K     ClustNo Analysis
LN    K200  C12     Gene Ontology
LN    K200  C116    Gene Ontology
CN    K200  C2      Gene Ontology

我想做的是删除C对于每一行第三栏，标题行除外：

Organ K     ClustNo Analysis
LN    K200  12      Gene Ontology
LN    K200  116     Gene Ontology
CN    K200  2       Gene Ontology

这是不行的，因为它会影响其他列和标题行：

sed 's/C//'

正确的做法是什么？

使用 awk

awk是一个很好的工具：

$ awk -F'\t' -v OFS='\t' 'NR>=2{sub(/^C/, "", $3)} 1' file
Organ   K       ClustNo Analysis
LN      K200    12      Gene Ontology
LN      K200    116     Gene Ontology
CN      K200    2       Gene Ontology

怎么运行的

-F'\t'

使用制表符作为输入的字段分隔符。
-v OFS='\t'

使用制表符作为输出的字段分隔符
NR>=2 {sub(/^C/, "", $3)}

去掉初始的C来自字段 3 的仅适用于第一行之后的行。
1

这是 awk 对 print-the-line 的神秘简写。

使用 sed

$ sed -r '2,$ s/(([^\t]+\t+){2})C/\1/' file
Organ   K       ClustNo Analysis
LN      K200    12      Gene Ontology
LN      K200    116     Gene Ontology
CN      K200    2       Gene Ontology

-r

使用扩展正则表达式。（在 Mac OSX 或其他 BSD 平台上，使用-E反而。）
2,$ s/(([^\t]+\t){2})C/\1/

此替换仅适用于从 2 到文件末尾的行。

(([^\t]+\t){2})匹配前两个制表符分隔的列。这假设只有一个制表符分隔每一列。因为正则表达式包含在括号中，所以它匹配的内容稍后将可用\1.

C这场比赛C.

\1仅用前两列替换匹配的文本，而不是C..

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Linux

unix

awk

sed

正则表达式用 SED/AWK 替换特定列的相关文章

awk 比较多个文件

我有2个文件 file1 1 apple 2 mango 3 banana 44 orange file2 1 apple 22 31 xyz 2 man 3 banana 44 oran 44 orange 我需要使用第 1 列和检查第
获取当前时间（以小时和分钟为单位）

我正在尝试从系统收集信息并且需要获取当前时间以小时和分钟为单位目前我有 date awk print 4 输出如下 16 18 54 怎样才能把秒数去掉呢提供格式字符串 date H M Running man date将给出所有格
内核如何区分线程和进程

Linux 中的线程被称为轻量级进程无论是进程还是线程它们的实现都是通过task struct数据结构 1 gt 那么从这个意义上说内核如何区分线程和进程 2 gt 当发生上下文切换时线程如何在上下文切换中获得更少的开销因为在此
在 Ubuntu 上运行独立的 ASP.NET Core 应用程序

我已经发布了一个 ASP NET Core 应用程序作为针对 Ubuntu 的独立应用程序发布似乎工作正常我已将这些文件复制到一台漂亮的 Ubuntu 机器上现在我如何运行我的应用程序我的理解是因为它是一个独立的 NET Cor
bash 用变量值替换字符串中的变量名

这有点奇怪我有以下字符串我有一个名为 REDIRECT 的变量设置为 https working MYDOMAIN blah blah 我需要将 MYDOMAIN 替换为分配给 MYDOMAIN 的变量的实际值不确定 bash 还是
为什么 Solaris 汇编器生成的机器代码与 GNU 汇编器在这里不同？

我为 amd64 编写了这个小汇编文件对于这个问题来说代码的作用并不重要 globl fib fib mov edi ecx xor eax eax jrcxz 1f lea 1 rax ebx 0 add rbx rax xchg r
vm.dirty_ratio 和 vm.dirty_background_ratio 之间的区别？

我目前正在试验中找到的内核参数 proc sys vm 尤其dirty ratio and dirty background ratio 内核文档对两者都有以下解释脏背景比例包含以包含空闲页面的总可用内存的百分比表示和可回收页后台
在 nohup 中使用别名

为什么以下不起作用 alias sayHello bin echo Hello world sayHello Hello world nohup sayHello nohup appending output to nohup out no
Linux 中如何获取内存修改通知

在Linux的用户空间程序中我通过从堆中分配来获取一块内存然后将指针分发给在其他线程中运行的许多其他组件来使用当上述内存被修改时我想收到通知我当然可以开发一个自定义用户空间解决方案供其他组件在尝试修改内存时使用我的情况的问题是这
当模式在范围内时使用 sed 打印范围？

我有一个充满查询的日志文件我只想查看有错误的查询日志条目类似于 path to file executing query QUERY SIZE ROWS MSG DURATION 我想打印所有这些东西但只有当MSG 包含一些有趣的内容
如何使用 diff 排除多行模式？

我想对两个 xml 文件进行比较但忽略 2 3 行模式例如假设我想在比较下面的 xml 格式时忽略可用性和价格这是我到目前为止所拥有的 diff I
使用请求和多处理时的奇怪问题

请检查这个Python代码 usr bin env python import requests import multiprocessing from time import sleep time from requests import
使用正在运行的进程的共享内存收集核心转储

核心转储仅收集进程空间而不收集为进程间通信创建的共享内存如何使核心转储也包含正在运行的进程的共享内存设置核心文件过滤器 proc PID coredump filter per http man7 org linux man page
使用多线程的套接字服务器或文件服务器实现：概念不清楚

请帮我理清这个概念假设我们有一个使用线程实现的套接字端口服务器套接字服务器侦听套接字端口并在消息到达时创建一个线程来服务该请求客户端代码向服务器发送给定数量的消息该客户端代码也可以由多个用户在不同的计算机上运行我知道客户端代码作
每当调用 malloc/free 时输出到 stderr

使用 Linux GCC C 每当调用 malloc free new delete 时我想向 stderr 记录一些内容我试图了解库的内存分配因此我想在运行单元测试时生成此输出我使用 valgrind 进行内存泄漏检测但我找不到
如何重命名共享库以避免同名冲突？

我找到了一个图书馆 libjson http sourceforge net projects libjson 我正在尝试将其构建为共享库并在项目中使用建造很简单修复 Makefile 错误后 SHARED 1 make install
Linux 的 gcc __attribute__((selectany)) 替代方案？

我想知道是否有替代方案 attribute selectany 在Linux中我想定义这样的东西 char a qwe zxc 并将其包含在许多链接在一起的 c 文件中因此链接器将看到 a 的多个定义因此不会链接我读过这个属性 se
使用无效命令进行 fork 会导致 valgrind 中的内存泄漏

我有以下代码它在分叉内执行无效命令以下代码在 valgrind 中返回内存泄漏 include
如何在 UNIX / Linux 操作系统下使用 sed 替换带有换行符 (\n) 的模式？

我有一个 txt 文件其中包含 Some random text here This file has multiple lines Should be one line I use sed q N s n sl g t q file1
从命名管道读取

我必须实现一个打印服务器我有 1 个客户端文件和 1 个服务器文件 include

随机推荐

为什么 C 给我的答案与我的计算器不同？

我在这段代码中遇到了一个奇怪的问题 legibIndex 206 385 84 6 countSylb countWord 1 015 countWord countSent 这是给定文本文件的易读性指数的计算由于这是一项家庭作业我们被
如何将 html 添加到 aspx C# 代码隐藏页面？

我可以访问带有 aspx 页面的服务器我需要向页面添加标题段落等该页面目前只有以下行我无法访问 CS 文件只能访问 DLL 无论如何当我尝试向文档添加任何 html 时没有任何变化我可以更改CSS 如果我删除继承那么我所
Python 日志记录在 ini 文件中为处理程序添加过滤器？

我有一个像这样的 log ini handler info class StreamHandler level INFO formatter fmt filter infofilter args sys stdout handler err
仅在第一个实例上分割字符串 - java

我想用字符分割字符串但我希望它仅在第一次时分裂我怎样才能做到这一点这是字符的 JavaScript 示例但它对我不起作用仅在指定字符的第一个实例上分割字符串 https stackoverflow com questions 4
jq - bash 和 zsh 以及 zsh-subshell 之间换行处理的差异

我试图将字符串格式化为 JSON https gist github com jakub g b2ef123f8b754bc5c63bc854e7019987 using jq我注意到 bash 与 zsh 的行为不同特别是当 zsh 运
当Gridview处于编辑模式和非编辑模式时如何控制Gridview的大小？

我会让我的 Gridview 用户控件处于灰色框架其 div 标签中无论 Gridview 是否处于编辑模式我确实使用了 Gridview 的宽度和样式但它不起作用我该怎么做呢 GridViewStyle It didn t w
如何使用react-router维护状态

我有一个 React 应用程序其中包含一个保存初始状态的主 App js 文件然后我设置了一些路线来导航我的应用程序在其中一条路线中我有一个按钮按下该按钮会处理设置的状态我知道这是有效的因为我已经控制台记录了状态的变化然而
Raspberry Pi：未设置 X11 DISPLAY 变量，但该程序执行了需要它的操作

我正在使用 PuTTY 与 Raspberry Pi 进行套接字连接我正在开发一个电视记分牌应用程序我正在使用 WinSCP 来复制这些 sh文件到树莓派当我运行脚本时 timer sh bin bash java jar home
SQL Server 查询返回多行

我目前正在开发一个 SSIS 包该包将表从一个数据库提取到另一个数据库两个数据库中的表都使用同一列作为主键我提取数据的 select 语句是一个简单的 select 语句当我运行该包时我收到一条错误指出存在重复的主键值我检查了
gsub 和 pad 位于括号内

我有这样的向量 x lt c 20 0 23 15 0 2 16 0 09 我不想弄乱括号外面的数字但想删除里面数字的前导零使所有内容都有 2 位数字输出将如下所示 20 23 15 20 16 09 有用的信息我可以使用以下函数删
如何使用 sympy.lambdify 和 Max 函数来替换 numpy.maximum 而不是 numpy.amax？

我正在尝试使用 sp Max x 0 来对大分析表达式进行羔羊化我想使用 numpy 来向量化我的计算因此 x 将是一个数组我需要 x 和 0 的元素最大值不过 sympy 默认情况下会将 sp Max 更改为 np amax 它沿
如何在 json 模式中表示 sum/union 类型

我正在尝试使用 json schema 记录 JSON 的现有用法系统允许对象属性之一具有以下两种可能性 Either tracking number 123 Or tracking number 123 124 125 我如何使用 js
如何将模型对象数组转换为以模型 id 作为键的对象？

在 Javascript 中我有一个模型对象数组 id 13 title Some title 1 time friday id 15 title Some title 3 time Saturday id 16 每个对象有超过2个值和属
Android logcat 错误 TundConnector 和 NetlinkEvent

我刚刚注意到我的 LogCat 中出现了一致的错误大约每秒并且想知道是否有人可以阐明这个问题 Droid X2 带最新更新 10 21 14 52 49 590 ERROR TundConnector 1482 Communicatio
UITableViewCell 附件在滚动到屏幕外时消失

我有一个充满对象的 UITableView 在里面didSelectRowAtIndexPath方法我有一个 UITableViewCellAccessoryCheckmark 在选择行时出现并在取消选择时消失这是代码didSelectR
用户脚本仅适用于后端提供的页面，但不适用于 SPA 方式的前端

我在 Greasemonkey Tampermonkey 上运行以下用户脚本我运行它facebook com它通过 HRO 从后端提供一些网页在前端提供其他一些网页就像单页应用程序 SPA 一样 UserScript name fac
Log4J2 JSONLAYOUT 如何添加自定义参数

如何向Log4j2的JSONLAYOUT添加自定义参数还有一种方法可以将模式添加到 JSONLAYOUT 的消息元素中吗我已经尝试过此处列出的选项 gt logging apache org log4j 2 x manual layou
在 Delphi 中使用 SecureZeroMemory

我明白有一个SecureZeroMemoryC 中的函数函数实现定义在
Xcode GPU 着色器分析器

Xcode gt GPU Capture 框架 gt GPU 着色器分析器无法工作我运行 Capture 框架并通过 GPU 着色器分析器打开 Metal 计算着色器源代码但我看不到这样的着色器代码性能概况GPU 着色器分析器 htt
正则表达式用 SED/AWK 替换特定列

我的数据如下所示制表符分隔 Organ K ClustNo Analysis LN K200 C12 Gene Ontology LN K200 C116 Gene Ontology CN K200 C2 Gene Ontology 我想

正则表达式用 SED/AWK 替换特定列

使用 awk

怎么运行的

使用 sed

正则表达式用 SED/AWK 替换特定列 的相关文章

随机推荐

热门标签

正则表达式用 SED/AWK 替换特定列的相关文章