假设有一个如下所示的文件:
xxxx aa whatever
yyyy bb whatever
zzzz aa whatever
我想将其分成 2 个文件,其中包含:
first:
xxxx aa whatever
zzzz aa whatever
second:
yyyy bb whatever
IE。我想根据行中的某些值对行进行分组(规则可以是:用空格分隔的第二个单词),但不要对组内的行重新排序。
当然我可以编写一个程序来做到这一点,但我想知道是否有任何现成的工具可以做这样的事情?
抱歉,我没有提到它,因为我认为这是非常明显的 - 不同“单词”的数量很大。我们谈论的至少有 10000 个。 IE。任何基于事先枚举单词的解决方案都行不通。
而且 - 我真的不喜欢多通道分割 - 有问题的文件通常很大。
这将创建名为output.aa
, output.bb
, etc.:
awk '{print >> "output." $2}' input.file
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)