如何使用 Bash 从一组字符串 B 中过滤出一组字符串 A

2024-02-05

我有一个字符串列表，我想从另一个字符串的超集中删除这些字符串，而不是按任何特定顺序，从而构造一个新的集合。这在 Bash 中可行吗？

看起来您正在寻找运行时间优于 O(nm) 的东西，所以这里有一个答案。 Fgrep 或 grep -F 使用 Aho-Corasick 算法从固定字符串列表中生成单个 FSM，因此检查 SET2 中的每个单词需要 O（单词长度）时间。这意味着该脚本的整个运行时间为 O(n+m)。

（显然运行时间也取决于单词的长度）

[meatmanek@yggdrasil ~]$ cat subtract.sh 
#!/bin/bash
subtract()
{
  SET1=( $1 )
  SET2=( $2 )
  OLDIFS="$IFS"
  IFS=$'\n'
  SET3=( $(grep -Fxv "${SET1[*]}" <<< "${SET2[*]}") )
  IFS="$OLDIFS"
  echo "${SET3[*]}"
  # SET3 = SET2-SET1
}
subtract "$@"
[meatmanek@yggdrasil ~]$ . subtract.sh 

[meatmanek@yggdrasil ~]$ subtract "package-x86 test0 hello world" "computer hello sizeof compiler world package-x86 rocks"
computer sizeof compiler rocks
[meatmanek@yggdrasil ~]$

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

bash

string

filter

如何使用 Bash 从一组字符串 B 中过滤出一组字符串 A 的相关文章

关于C字符串的问题

我是 C 语言新手对 C 字符串非常困惑以下是我的问题从字符串中查找最后一个字符如何找出字符串中的最后一个字符我带着类似的东西来 char str hello printf c str strlen str 1 return 0
我的 unix 脚本出了什么问题

bin bash while echo n Player s name read name name ZZZ do searchresult grep name playername if searchresult 0 then echo
如何将命令作为参数传递给 ssh [重复]

这个问题在这里已经有答案了我的需要是让这个命令起作用 sshpass p XXXX ssh oStrictHostKeyChecking no email protected cdn cgi l email protection sudo
为什么你可以在字符串上重载 __radd__ 而不是 __rmod__ ？

在Python中您可以覆盖右和左加法运算符
如何将从 date_parse 返回的日期数组转换回日期字符串

我有一个由 php 例程 date parse 返回的格式的日期数组我需要将此日期数组转换回日期字符串我正在寻找一个与 date parse 例程相反的函数这是一个接受日期数组作为参数并返回日期字符串的函数 http php net
此 bash 命令在 Makefile 中未正确运行

在 Makefile 里面我有这样的 release version poetry version cut f2 d echo release version 如果我运行我的终端中的语句将毫无问题地运行 gt version poetry
从 PHP 中的字符串中删除转义序列

我正在使用一个已转义字符序列的 mysqldump 文件我需要知道字符串的长度作为其数据库值但转储中包含转义字符这会增加字符串的长度我用过stripslashes 它正确地取消转义单引号和双引号但它不会触及 r n 我担心其中还有
apt-get install tzdata 非交互式

当我尝试 apt get install y tzdata 将显示用于选择时区的命令行选项我试图在脚本中使用它来进行一些设置如何在没有用户输入的情况下使 apt get 运行我知道重新配置 tzdata 我可以做 echo Ameri
未找到命令“ember”

看来我搞砸了 ember cli 安装我已经使用 sudo 安装了 npm 但是在阅读了 npm 上 ember cli 和 sudo 的一些问题后我按照此处的说明卸载并重新安装https gist github com isaacs
如何使用 PHP 查找字符串中字符的序列模式？

假设我有随机的文本块 EAMoAAQAABwEBAAAAAAAAAAAAAAABAgMFBgcIBAkBAQABBQEBAAAAAAAAAAAAAAAGAgMEBQcBCBAAAQMDAgMEBQcIBQgGCwEAAQACAxEEBSEG
如何将 R 数据框中的多个字符列合并为单个列

我正在处理人口普查数据需要将四个字符列合并为一列 Example LOGRECNO STATE COUNTY TRACT BLOCK 60 01 001 021100 1053 61 01 001 021100 1054 62 01 00
如何在 sed 中转义方括号[重复]

这个问题在这里已经有答案了我正在使用 grep 和 sed 解析遗留的 C 代码当尝试替换方括号时发生了一些奇怪的事情以下代码替换方括号效果很好 echo xyx xzx xyx sed s g 结果是 xyx xzx xyx 当我
powershell stdin 管道和重定向

你好我一直在制作一个小的跨平台脚本我可以将其卷曲并通过管道传输到bash和Powershell中基本思想是服务器向解释器发送一个命令然后它给出一个命令将所有输出重定向到标准输出 bash 中的一个例子是 some commands
shell_exec 的输出被截断为 100 个字符

当在 shell 中运行以下命令时 curl F file filename http 192 168 0 1 产生以下输出 Accuracy 0 0 1 classification Accuracy 0 0 1 classificati
为什么我不能将 sed 的输出重定向到文件

我正在尝试运行以下命令 someprogram tee dev tty sed s 2 gt output file 但当我去查看时该文件始终是空白的如果我删除 gt output file从命令末尾我可以看到 sed 的输出没有任
从另一列的子字符串创建列

我有一个 Pandas 数据框对象我想从现有列的子字符串创建新列我的数据如下所示 Date variable want1 want2 want3 0 02 01 08 Australia Sydney A Australia Sydne
如何使用我在 github 中发布的 bash 脚本执行 chsh？

我有一个要点我总是用它来在新服务器上安装我需要的软件包 http gist github com 4372049 http gist github com 4372049 我需要做的就是通过 ssh 在新服务器中输入以下内容 bash c
如何限制firebase中的字符串长度

我在 firebase 数据库中工作我需要限制字符串字段的长度我怎么做到该字段的路径是 Col1 doc1 描述也就是说从集合 col1 开始然后进入 doc1 然后对于 doc1 下的所有集合以及该集合下的所有文档描述字段需
toUpperCase() 方法什么时候创建一个新对象？

public class Child public static void main String args String x new String ABC String y x toUpperCase System out println
从 Amazon S3 存储桶下载文件的脚本

尝试编写脚本以从 Amazon S3 存储桶下载文件 cURL 网站上的示例遇到问题下面的脚本产生我们计算的请求签名与您的签名不匹配假如检查您的密钥和签名方法感谢任何帮助 bin sh file filename php buck

随机推荐

glPopMatrix() 喊叫“setup_hardware_state 中不支持纹理格式”

我正在尝试对 Linux 的私人视频播放器进行一些优化旨在提高性能因为播放 MP4 文件对 CPU 的占用很大自从视频帧采用 YV12 编码并且 OpenGL 不提供显示此格式的本机方法现在有一段代码在CPU上运行在将图像发送到G
Mongoose - 使用聚合返回单个文档而不是文档数组

在开始使用聚合来创建文档的时间戳之前我使用 findOne 这样我可以获得单个对象但现在我得到一个包含单个对象的数组是否可以使查询返回单个对象而不是数组先感谢您我正在使用的查询 News aggregate match id n
如何使用元数据注释在 Dart 分析器中提供警告消息？

我创建了一个像这样的元数据注释 class UseInt const UseInt UseInt class Foo Should give a lint warning saying The class should only use i
防止 MEX 文件在 MATLAB 中崩溃

我有一个 MEX 文件是我从别人那里借来的用来帮助我编写半自动核检测算法问题是 MEX 文件偶尔会导致分段错误但是如果代码第二次使用相同的参数运行那就没问题了我希望有一种try catchMEX 文件的习语但在周六花了大
android 退出时清除应用程序缓存

我想要做的是在应用程序退出时清除应用程序的缓存我可以通过以下步骤手动完成此任务管理应用程序 gt 我的应用程序 gt 清除缓存 gt gt 但我想通过在应用程序退出时编程来完成这项任务请帮助我提前致谢要清除应用程序数据请尝试这种
使用 Microsoft Graph 查询 AzureAD Graph 扩展属性

我正在从 Azure AD Graph API 迁移到 Microsoft Graph 因为它现已弃用以前可以使用以下方式访问用户的扩展属性Microsoft Azure ActiveDirectory GraphClient GetEx
实体框架将两个表列映射到同一相关表键

我的情况是我有一张名为Elements 现在我正在创建一个名为Divergences基本上会存储成对的Elements 的目的Divergence是检查是否有两个Elements有不同的答案 Element Divergence Elem
如何检查列表中的所有元素是否符合条件？

我有一个列表其中包含许多子列表每个子列表包含 3 个元素例如 my list a b 0 c d 0 e f 0 每个子列表的最后一个元素是一个排序标志每个子列表的初始值为 0 随着我的算法的进展我想检查该标志是否至少有一个元素为
在 Inno Setup 中禁用静默和非常静默卸载

是否可以在 Inno Setup 中禁用静默和非常静默卸载您不能直接禁用它但您可以检查它是否以静默模式运行并在运行期间显示消息退出InitializeSetup InitialiseUninstall 事件函数 function In
Maven 结构和 Java EE 应用

如何在 Java EE 应用程序中组织 Maven 模块目前我们所做的是在父 POM 下拥有以下 Maven 模块 ear ejb ejb api core The ejb模块仅包含 EJB 类而core模块包含所有其他实用程序类包括
如何以编程方式获取有关 CellTable 标头的信息？

我正在使用 GWT 2 4 我有一个 com google gwt user cellview client CellTable 小部件但我无法找出在构造小部件后获取字符串标头的编程方法我像这样添加列数据 tableWidget add
标记上出现语法错误，需要使用variableDeclarator

SQLiteDatabase db this getWritableDatabase ContentValues cv new ContentValues cv put colDeptID 1 cv put colDeptName Sale
在视图中的模型中保存文件有效，但在 Celery 任务中无效

我遇到了这种非常奇怪的行为当我在视图中保存新的模型实例时分配的文件会被保存但是当我在 Celery 中这样做时实例会被保存但文件不会被保存这些是我的观点缩短 def post self request args kwargs
C++中需要知道一个目录是否有写权限

我需要知道指定的目录具有登录凭据的本地或共享路径是否具有写入权限我正在使用 GetFileAttributes 但它总是返回 FILE ATTRIBUTE DIRECTORY 而没有其他内容我的代码如下所示 if storageLo
构造函数接受参数时的 GTest 固定装置？

我有一个简单的示例类它有一个数据成员这是一个指向犰狳矩阵的指针的 std vector 构造函数将这样的向量作为唯一的参数这是文件TClass cpp include
使用 linq 从 xml 获取键值对

我如何使用 linq 从此 xml 示例中提取键值对
未找到方法或数据成员错误？

使用 VB 6 和 Crystal Report 9 我想在水晶报告中显示输出上周我使用了 VB 6 和 Crystal Report 8 5 运行良好但最后一天我重新安装了 Windows XP VB 6 和 Crystal Repo
java中如何监控文件夹的变化？

我有以下代码用于监视文件夹中 java 中的任何更改 public class FolderWatcher public List
为什么 boost 包含两个不同版本的 Strong_typedef.hpp？

当我最近构建一个项目时我注意到我收到了关于以下内容的编译器警告变成错误 BOOST STRONG TYPEDEF宏被重新定义经过进一步调查我注意到有两个不同的版本strong typedef hpp包含在 boost 中一个位于顶
如何使用 Bash 从一组字符串 B 中过滤出一组字符串 A

我有一个字符串列表我想从另一个字符串的超集中删除这些字符串而不是按任何特定顺序从而构造一个新的集合这在 Bash 中可行吗看起来您正在寻找运行时间优于 O nm 的东西所以这里有一个答案 Fgrep 或 grep F 使用 Ah

如何使用 Bash 从一组字符串 B 中过滤出一组字符串 A

如何使用 Bash 从一组字符串 B 中过滤出一组字符串 A 的相关文章

随机推荐

热门标签