shell文本去重

2023-10-26

1.单个文件去重

参考:https://blog.csdn.net/bitcarmanlee/article/details/82426072

# 将重复的多行变为一行
sort file |uniq

## uniq -u 只显示不重复的行
sort file |uniq -u

2.两个文件的交集,并集


求两个文件的并集

# 求两个文件的并集,如果有重复的行只保留一行
## sort 排序
## uniq 去重,重复的行只保留一行
cat file1 file2 | sort | uniq > result

求两个文件的交集

# 求两个文件的交集,即两个文件中都有的行
## uniq -d 只显示重复的行
cat file1 file2 | sort | uniq -d > result

求两个文件的差集

# 求两个文件的差集,即只有一个文件中有的行
## uniq -u 只显示不重复的行
cat file1 file2 | sort | uniq -u > result

3.两个文件合并


上下合并

# 以追加行的方式合并,如果file1有n行,file2有m行,result为n+m行
cat file1 file2 > result

左右合并

合并后一个文件的内容在左边,一个文件命令在右边

# 左右合并
paste file1 file2 > result

4.多个文件合并去重

# 例如有4个文件
nt.deny hk.deny jp1.deny jp2.deny

# 将4文件排序,去重,然后合并为一个新文件
sort nt.deny hk.deny jp1.deny jp2.deny |uniq > hosts.deny

# 将相同后缀的文件排序,去重,然后合并为一个新文件
sort *.deny |uniq > hosts.deny
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

shell文本去重 的相关文章

  • C程序调用shell脚本

    我有一个小型 C 程序 调用 shell 脚本 myScript sh 我得到的 ret 值为 256 请帮助我了解系统调用出了什么问题 int main int ret ret system myScript sh ret gt gt r
  • 我可以从命令行打印 html 文件(带有图像、css)吗?

    我想从脚本中打印带有图像的样式化 html 页面 谁能建议一个开源解决方案 我使用的是 Linux Ubuntu 8 04 但也对其他操作系统的解决方案感兴趣 你可以给html2ps http user it uu se jan html2
  • 在哪里可以找到并安装 pygame 的依赖项?

    我对 Linux 比较陌生 正在尝试安装 python 的 pygame 开发环境 当我运行 setup py 时 它说我需要安装以下依赖项 我找到并安装了其中之一 SDL 然而 其他人则更加难以捉摸 Hunting dependencie
  • fopen 不返回

    我在 C 程序中使用 fopen 以只读模式 r 打开文件 但就我而言 我观察到 fopen 调用没有返回 它不返回 NULL 或有效指针 执行在 fopen 调用时被阻止 文件补丁绝对正确 我已经验证过 并且不存在与权限相关的问题 任何人
  • 域套接字“sendto”遇到“errno 111,连接被拒绝”

    我正在使用域套接字从另一个进程获取值 就像 A 从 B 获取值一样 它可以运行几个月 但最近 A 向 B 发送消息时偶尔会失败 出现 errno 111 连接被拒绝 我检查了B域套接字绑定文件 它是存在的 我也在另一台机器上做了一些测试 效
  • 无法使用 wget 在 CentOS 机器上安装 oracle jdk

    我想在CentOS上安装oracle java jdk 8 我无法安装 java jdk 因为当我尝试使用命令安装 java jdk 时 root ADARSH PROD1 wget no cookies no check certific
  • 两种情况或 if 哪个更快? [关闭]

    Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案 我必须制作一个 非常 轻的脚本 它将接受用户的选项并调用脚本中的函数来执行一些任务 现在我可以使用 IF 和 CASE 选项 但我想知道两
  • PHP 从命令行启动 gui 程序,但 apache 不启动

    首先 我阅读了有类似问题的人的一些帖子 但所有答案都没有超出导出 DISPLAY 0 0 和 xauth cookies 这是我的问题 提前感谢您的宝贵时间 我开发了一个小库 它使用 OpenGL 和 GLSL 渲染货架 过去几天我将它包装
  • 将 PDF 转换为 600dpi 的 TIFF 和 jpg 96 dpi

    我想使用 ImageMagick 从 Python 脚本将 pdf 转换为 600 dpi 的 tiff 和 96 dpi 的 jpg 我使用 imagemagick 命令行完成了这项任务 但我想使用python中的Imagemagick将
  • NPTL 和 POSIX 线程有什么区别?

    NPTL 和 POSIX 线程之间的基本区别是什么 这两者是如何演变的 POSIX 线程 pthread 不是一个实现 它是几个函数的 API 规范 纸上的标准 英文 其名称以pthread 以及定义在
  • 在 iOS 模拟器中安装应用程序的脚本

    我正在尝试自动化构建应用程序 运行单元测试以及最终运行 UI 测试的过程 我正在通过命令行 xcodebuild sdk iphonesimulator6 0 在某个目录中构建应用程序 如何通过命令行 在 Library Applicati
  • Linux 可执行文件与 OS X“兼容”吗?

    如果您在基于 Linux 的平台上用 C 语言编译一个程序 然后将其移植以使用 MacOS 库 它会工作吗 来自编译器的核心机器代码在 Mac 和 Linux 上兼容吗 我问这个问题的原因是因为两者都是 基于 UNIX 的 所以我认为这是真
  • 安装J语言的JQt IDE,出现错误

    我一直按照这里的说明进行操作 http code jsoftware com wiki System Installation Linux http code jsoftware com wiki System Installation L
  • 从 shell 命令调用 SOAP 请求

    我使用curl 向Web 服务发送SOAP 请求 并使用shell 脚本获取响应 请在下面找到我正在使用的命令 curl H Content Type text xml charset utf 8 H SOAPAction d sample
  • iptables通过注释删除特定规则

    我需要删除一些具有相同评论的规则 例如 我有带有 comment test it 的规则 所以我可以像这样获得它们的列表 sudo iptables t nat L grep test it 但是我怎样才能删除所有带有注释 测试它 的 PR
  • 有谁知道在哪里定义硬件、版本和序列号。 /proc/cpuinfo 的字段?

    我想确保我的 proc cpuinfo 是准确的 目前它输出 Hardware am335xevm Revision 0000 Serial 0000000000000000 我可以在代码中的哪里更改它以给出实际值 这取决于 Linux 的
  • 多处理:仅使用物理核心?

    我有一个函数foo它消耗大量内存 我想并行运行多个实例 假设我有一个有 4 个物理核心的 CPU 每个核心有两个逻辑核心 我的系统有足够的内存来容纳 4 个实例foo并行但不是 8 个 此外 由于这 8 个核心中的 4 个是逻辑核心 我也不
  • 如何从我自己的脚本向 Fish shell 提供制表符补全?

    我运行的是 Ubuntu 13 10 和 Fish 2 1 0 我想自己编写一个 Python 脚本来从命令行执行一些任务 该脚本将需要命令行参数 我怎样才能编写我的脚本 以便 Fish 可以请求并获取给定参数的可能值 潜在值列表是动态的
  • shell-out 值到 md5(加密)函数

    我正在寻找一种解决方案 我正在构建 JSON 记录 并需要在 JQ 中生成一些文本 但将此文本通过管道传输到 MD5 求和函数并将其用作键的值 echo first John last Big jq id first last md5 通过
  • 如何更改 Apache 服务器的根目录? [关闭]

    Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案 如何更改 Apache 服务器的文档根目录 我基本上想要localhost从 来 users spencer projects目录而不是

随机推荐

  • 表格嵌套_vlookup+left函数嵌套如何运用,表格数据查询的另类用法

    今天我们来学习一下vlookup函数的不一样的操作方式 如何利用vlookup left文本提取函数进行数据的另类查询 一 案例说明 如上图所示 我们需要根据人员的手机号码 根据我们统计的运营商号码段来进行判断 确认人员的手机号码属于哪个运
  • Matlab 回归分析与预测

    统计分析 回归分析与预测 数理统计 回归分析 回归分析类型 回归分析目的 一元线性回归 多元线性回归的案例 B BINT R RINT STATS regress Y X B BINT R RINT STATS regress Y X AL
  • Pyrthon闭包操作

    在函数编程中经常用到闭包 闭包是什么 它是怎么产生的及用来解决什么问题呢 给出字面的定义先 闭包是由函数及其相关的引用环境组合而成的实体 即 闭包 函数 引用环境 想想Erlang的外层函数传入一个参数a 内层函数依旧传入一个参数b 内层函
  • 使用Python探索四大名著【红楼梦】人物之间的关系,简直帅呆了

    嗨 大哥们 我来了 红楼梦 作为我国四大名著之一 古典小说的巅峰之作 粉丝量极其庞大 而红学也经久不衰 所以我们今天通过 Python 来捋一下红楼梦里那错综复杂的人物关系 话不多说 开始整活 一 准备工作 红楼梦txt格式电子书一份 金陵
  • 什么是分数阶控制器

    转自他人论文 本博文仅做整理 一 介绍 分数阶微积分是一个古老而又 新鲜 的概念 早在整数阶微积分创立的初期 就有一些学者开始考虑 它的含义 然而 由于缺乏应用背景和计算困难等原因 分数阶微积分理论及应用的研究一直没有得到太 多实质性进展
  • Linux cat命令详解

    cat命令是linux下的一个文本输出命令 通常是用于观看某个文件的内容的 cat主要有三大功能 1 一次显示整个文件 cat filename 2 从键盘创建一个文件 cat gt filename 只能创建新文件 不能编辑已有文件 3
  • IMX6ULL移植篇-uboot网络配置工作

    一 uboot 网络IP配置 1 硬件连接 在使用 uboot 的网络功能之前先用网线将开发板的 ENET2 接口和电脑或者路由器连接 I MX6U ALPHA 开发板有两个网口 ENET1 和 ENET2 一定要连接 ENET2 ENET
  • 机器人基础知识二

    1 四元数 quaternion 可以看作中学时学的复数的扩充 它有三个虚部 形式如下 q w xi yj zk 四元数旋转可以避免万向节锁现象 只需要一个4维的四元数就可以执行绕任意过原点的向量的旋转 方便快捷 在某些实现下比旋转矩阵效率
  • TCP洪水攻击(SYN Flood)的诊断和处理

    1 SYN Flood介绍 前段时间网站被攻击多次 其中最猛烈的就是TCP洪水攻击 即SYN Flood SYN Flood是当前最流行的DoS 拒绝服务攻击 与DDoS 分布式拒绝服务攻击 的方式之一 这是一种利用TCP协议缺陷 发送大量
  • postman 配置统一的ip地址

    1 建立个开发环境 编辑配置一个 base url 地址 2 在请求的地址中直接使用 base url 使用配置的地址 开启方便切换各个环境的地址ip 转载于 https www cnblogs com yangjiming p 93413
  • Windows10下python-pcl的安装步骤说明,亲测ok

    Windows10下python pcl的安装步骤说明 1 环境依赖 2 安装步骤 2 1 安装visual studio 2017 2 2 安装pcl并配置环境变量 2 3 编译python pcl并且导入moudle 2 4 验证安装成
  • 有点牛,10分钟把小程序直接迁移到APP

    大家好 我是北妈 0 没想到现在的APP都已经卷成这样了 最近一个朋友跟我吐槽他最近接手的一个APP项目 说现在的APP都想把自己从工具发展成平台 堆砌了各类形形色色的功能 然后如果APP一有点小问题或者增加一个小功能就需要发版迭代 同时代
  • Flask框架七:ORM操作MySQL(一)

    1 ORM基础操作 注意点 创建新表时必须写Base metadata create all 数据库中已存在这张表就可以不写 写了不会报错 代表将创建的 类 表映射到数据库中 如果数据库中已经存在这个表了 则不会改变表结构 如果后续操作有冲
  • AI绘画

    今天用Midjourney生成了质量极高的美少女武士后续会作为固定栏目来分享美图接下来请欣赏作品 提示词分享 1 an asian girl dressed in samurai style in the style of anime ae
  • (基于Python的毕业设计)微博舆情分析系统(附源码+论文)

    大家好 我是岛上程序猿 感谢您阅读本文 欢迎一键三连哦 目录 一 项目简介 二 系统设计 2 1软件功能模块设计 2 2数据库设计 三 系统项目部分截图 3 1管理员功能模块 3 2热搜数据 3 3热搜 四 论文目录 五 部分核心代码 4
  • 共阳极数码管与共阴极数码管联合使用来循环显示数字00-99。

    使用两个分立式数码管分别连接在P0和P2端口上 实现数字从00 99的循环显示 与上篇文章一样先查询一下共阴极与共阳极数码管数字0到9的数码表 共阴极数码管0 9的数码表 code int SEG CODE1 0x3f 0x06 0x5b
  • vue.config配置多个地址跨域

    本博客是本人在开发过程中遇到问题所积累下的经验 在前端想要实现跨域 在前端使用接口的时候 如果需要使用来源不同的接口 可以在vue config配置多个跨域 例如下面例子中的两个配置 一个是局域网内的接口 一个是部署在外网上的接口 在使用时
  • C练题笔记之:Leetcode-662. 二叉树最大宽度

    题目 给你一棵二叉树的根节点 root 返回树的 最大宽度 树的 最大宽度 是所有层中最大的 宽度 每一层的 宽度 被定义为该层最左和最右的非空节点 即 两个端点 之间的长度 将这个二叉树视作与满二叉树结构相同 两端点间会出现一些延伸到这一
  • Ubuntu22.04安装opencv4并配置VsCode

    一 安装Opencv 第一步 下载opencv 下载地址 https github com opencv opencv 第二步 解压安装 unzip opencv 4 6 0zip 第三步 安装编译文件 sudo apt get insta
  • shell文本去重

    shell文本去重 1 单个文件去重 2 两个文件的交集 并集 求两个文件的并集 求两个文件的交集 求两个文件的差集 3 两个文件合并 上下合并 左右合并 4 多个文件合并去重 1 单个文件去重 参考 https blog csdn net