如何在 HashSet 中搜索时使用正则表达式

2024-01-27

我正在编写一个 Java 程序，我需要在其中搜索集合中的特定单词。必须搜索的单词类似于 (“wo.d”) where '.'可以用任何其他字母代替。我正在使用正则表达式来匹配此类类型的单词大小写。

这就是我到目前为止所拥有的

HashSet<String> words = new HashSet<String>();//this set is already populated
String word = "t.st";
if(word.contains(".")){
    Pattern p = Pattern.compile(word);
    Matcher m;
    boolean match = false;
    for(String setWord : words){
        m = p.matcher(setWord);
        if(m.matches())
            match = true;
    }
    if(match)
        System.out.println("Its a match");
    else
        System.out.println("Its not a match");
}
else{
    System.out.println("The word does not contain regex do other stuff");
}

上面的代码可以工作，但效率不高，因为它在一秒钟内被调用很多次。因此它会在程序中产生滞后。

一旦获得匹配，您就需要停止迭代，因此假设您使用Java 8, your for循环可以有效地重写为下一个：

boolean match = words.stream().anyMatch(w -> p.matcher(w).matches());

您还可以使用并行化研究parallelStream()代替stream()特别是如果你的Set有很多话。

如果你不使用Java 7，仍然可以使用FluentIterable https://google.github.io/guava/releases/19.0/api/docs/com/google/common/collect/FluentIterable.html from 谷歌番石榴 https://github.com/google/guava但不幸的是没有能力并行研究。

boolean match = FluentIterable.from(words).anyMatch(
    new Predicate<String>() {
        @Override
        public boolean apply(@Nullable final String w) {
            return p.matcher(w).matches();
        }
    }
);

但就你而言，我不相信使用FluentIterable比简单地添加一个更有趣break当您获得匹配时，因为它仍然更容易阅读和维护

if (p.matcher(setWord).matches()) {
    match = true;
    break;
}

所以，如果你真的需要使用正则表达式你不能使用Java 8，你最好的选择是使用break如上所述，没有什么魔术需要考虑。

假设你会只有一个字符需要替换，可以使用startsWith(String) https://docs.oracle.com/javase/8/docs/api/java/lang/String.html#startsWith-java.lang.String- and endsWith(String) https://docs.oracle.com/javase/8/docs/api/java/lang/String.html#endsWith-java.lang.String-这将永远是比正则表达式快得多。像这样的东西：

// Your words should be in a TreeSet to be already sorted alphabetically 
// in order to get a match as fast as possible
Set<String> words = new TreeSet<String>(); //this set is already populated
int index = word.indexOf('.');
if (index != -1) {
    String prefix = word.substring(0, index);
    String suffix = word.substring(index + 1);
    boolean match = false;
    for (String setWord : words){
        // From the fastest to the slowest thing to check 
        // to get the best possible performances
        if (setWord.length() == word.length() 
            && setWord.startsWith(prefix) 
            && setWord.endsWith(suffix)) {
            match = true;
            break;
        }
    }
    if(match)
        System.out.println("Its a match");
    else
        System.out.println("Its not a match");
}
else {
    System.out.println("The word does not contain regex do other stuff");
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何在 HashSet 中搜索时使用正则表达式的相关文章

如何在Spring Boot中初始化一次MongoClient并使用它的方法？

您好我正在尝试导出MongoClient在 Spring Boot 中成功连接后我尝试在其他文件中使用它这样我就不必每次需要在 MongoDB 数据库中进行更改时都调用该连接连接非常简单但目标是将应用程序连接到我的数据库一次然后
使用正则表达式验证输入字符串是否为 0-255 之间的数字

我在将输入字符串与正则表达式匹配时遇到问题我想验证输入数字在 0 255 之间并且长度最多应为 3 个字符代码工作正常但当我输入 000000 至任意长度时显示 true 而不是 false 这是我的代码 String IP 000
Glassfish：在部署期间修改 EAR 的部署描述符

经过几天的搜索尝试和摇头我将这个问题发布到 SO 尽管它seems已经得到答复这是场景我有一个 EAR 应用程序目前包含一个 WAR 和一个 EJB 模块 EJB 模块使用 JPA persistence xml 并且一些无状态
全静态方法和应用单例模式有什么区别？

我正在创建一个数据库来存储有关我的网站用户的信息我正在使用 stuts2 因此使用 Java EE 技术对于数据库我将创建一个 DBManager 我应该在这里应用单例模式还是将其所有方法设为静态我将使用这个 DBManager 进
Python 按照层次结构按多个分隔符分割字符串

我只想根据多个分隔符例如 and 和按顺序分割字符串一次例子 121 34 adsfd gt 121 34 adsfd dsfsd and adfd gt dsfsd adfd dsfsd adfd gt dsfsd adfd dsf
在R中提取其他两个字符串之间的字符串

我试图找到一种简单的方法来提取出现在两个已知子字符串之间的未知子字符串可以是任何内容例如我有一个字符串 a lt anything goes here STR1 GET ME STR2 anything goes here 我需要提取
( 后的正则表达式匹配数

我正在尝试使用正则表达式来匹配开括号字符后的可变长度的数字我努力了 d 但该正则表达式在匹配中包含括号我该如何排除它我正在使用 Sublime Text 正则表达式引擎来进行匹配您可以使用积极的后视 http www regula
两条腿的 OAuth 和 Gmail Atom feed

我们正在尝试让 2 legged OAuth 与 Gmail Atom feed 一起使用我们使用 John Kristian Praveen Alavilli 和 Dirk Ba lfanz 贡献的 Java 库 http oauth
使用 JNI 从 Java 代码中检索 String 值的内存泄漏

我使用 GetStringUTFChars 从使用 JNI 的 java 代码中检索字符串的值并使用 ReleaseStringUTFChars 释放该字符串当代码在 JRE 1 4 上运行时不会出现内存泄漏但如果相同的代码在 JR
为什么 "asdf".replace(/.*/g, "x") == "xx" ？

我偶然发现了一个令人惊讶的对我来说事实 console log asdf replace g x Why two替代品似乎任何没有换行符的非空字符串都会产生此模式的两个替换使用替换函数我可以看到第一个替换是整个字符串第二个替换是
Java 不可变对象 [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我正在学习不变性的概念据我了解一旦创建对象不可变对象就无法更改其值但我不明白不可变对象的以下用途 They are 自动是线程
Java字符串查找和替换的最佳方法？

我正在寻找 Java 中字符串查找和替换的最佳方法这是一句话我的名字叫米兰人们都知道我叫米兰瓦西奇我想用 Milan Vasic 替换 Milan 弦但在我已经有 Milan Vasic 的地方情况不应该是这样搜索替换后的结
如何列出hadoop hdfs中目录及其子目录中的所有文件

我在 hdfs 中有一个文件夹其中有两个子文件夹每个子文件夹大约有 30 个子文件夹最后每个子文件夹都包含 xml 文件我想列出所有 xml 文件仅给出主文件夹的路径在本地我可以这样做apache commons io 的 h
如何使 JScrollPane 与嵌套 JPanel 一起正常工作？

我正在使用 NetBeans 在 Java 中构建 Swing 应用程序但我遇到布局问题我的主框架包含一个JScrollPane其中包含一个JPanel called contentPanel其中又包含一个JPanel called l
删除 .htaccess 中 URL 中各处的多组斜杠

我目前有一个网站访客可以访问每个网址并使用任意数量的斜杠来分隔文件夹名称例如如果 URL 应该是 http example com one two three four 然后用户可以通过以下任意方式访问同一页面 http examp
Struts2中的变量声明

Struts2中如何声明变量并为该变量赋值使用设置标签
Lucene/Hibernate 搜索锁定异常

我使用 Hibernate Search 在 Web 应用程序上索引和全文搜索项目没有问题来自我的 pom xml
Excel VBA 自动过滤子字符串

我的 Excel 中有多行其中 D 列为 TDM 02 Bundle Rehoming 5 NE TDM 02 Bundle Rehoming 23 NE IP 02 Bundle Rehoming 7 NE 等请注意大多数情况下 N
获取Java中ResultSet返回的行数

我用过一个ResultSet返回一定数量的行我的代码是这样的 ResultSet res getData if res next System out println No Data Found while res next code t
Java 可变 BigInteger 类

我正在使用 BigIntegers 进行计算该计算使用一个调用 multiply 大约 1000 亿次的循环并且从 BigInteger 创建新对象使其非常慢我希望有人编写或找到了 MutableBigInteger 类我在 jav

随机推荐

为 ObjectContext 创建接口

我正在尝试创建一个抽象层ObjectContext 我理解 OC 是一个工作单元但我并不完全了解如何为它编写一个好的界面理想情况下我希望能够交换实现的 RealDataContext IDataContext对于像 FakeDataC
求解 a^3 + b^4 = c^3 + d^3 最佳运行时间

注意这个问题不同于写出 a 3 b 3 c 3 d 3 的所有解 https stackoverflow com questions 14454133 write all solutions for a3 b3 c3 d3因为我需要帮助理
SQL 如果 select 语句不返回任何行，则执行替代 select 语句

基本上什么语法可以让我实现标题声明 If select statement 1 returns 0 rows THEN select statement 2 else select statement 3 以便 sql 返回语句 2 或
将图库中的所有图像加载到 android 中的应用程序中

我正在创建一个应用程序其中我需要图库中的所有图像到我的应用程序中其中有一个 girdview 我希望所有文件夹中的所有图像都显示在网格视图中 String proj MediaStore Images Media DATA MediaS
如何从 pytorch 模块获取子模块序列？

对于火炬module https pytorch org docs master generated torch nn Module html 我想我可以用 named children named modules等来获取子模块的列表但是
为什么 d3.js v3 在实现缩放时会破坏我的力图，而 v2 不会？

我有一个使用 d3 js 创建的强制布局我希望同时拥有可拖动力布局的正常功能以及缩放功能我基本上已经从 http jsfiddle net nrabinowitz QMKm3 http jsfiddle net nrabinowitz
在 SQL Server 日期时间字段中格式化日期时间的正确方法是什么

我在 C 中有一个 dateTime 对象我想插入 SQL Server 日期时间字段正确的格式是什么正确的方法是使用参数化查询 not文本格式然后你就可以使用强类型SqlDbType DateTime http msdn micr
反应本机平面列表不滚动

我已经使用 FlatList 很多次了但从未有过这样的经历我有一个视图页面顶部有一个图像而我的列表在下面当我尝试滚动时列表弹到顶部对此找不到好的解决方案这是我的清单
在 Play Framework 中使用 POST 路由参数

我有一个登录路由应将其输入参数作为 POST 变量传输我已经这样定义了我的路线 POST v1 accounts login controllers v1 Accounts login username String password
标准WPF选项卡控件中是否有Selected Tab Changed事件

在WPF中是否有一个事件可以用来确定何时TabControl选定的选项卡发生变化吗我尝试过使用TabControl SelectionChanged但是当孩子在选项卡中的选择发生更改时它会被多次触发您需要检查事件的来源以隔离最外层的
UISegmentedControl 委托/触摸事件

我有一个 UISegmentedControl 有六个段我希望它们在值更改时调用一个方法而且当每个段获得一个UIControlEventTouchDragIn因为我希望当用户尝试选择 UILabel 上的某些内容并将手指拖过控件时 UI
在哪里可以找到 IntelliJ 其他语言的词典？

IntelliJ 拼写检查器仅捆绑了英语和阿拉伯语奇怪我认为它是在东欧制造的他们甚至没有捆绑他们的语言我的客户是德国人所以我的所有代码都是英语代码德语界面混合的而且我找不到 IntelliJ 的德语词典当前的IDEA版
排除字符串列表中的相似点以提取差异

我有一个句子列表除了书名之外其他句子都相同如何循环遍历列表并排除相似之处以找到书名这是一个例子可以是任何有相似之处的短句蝇王这本书堪称经典杀死一只知更鸟是一本经典之作麦田里的守望者这本书堪称经典我遇到的问题是我不能简
如何阻止 Telerik RadWindow 在下一次回发时始终重新加载

我在网页中调用 RadWindow 作为对话框我从代码隐藏中调用因为我需要传递一些参数 radWindow1 NavigateUrl url 英国德国法国 radWindow1 VisibleOnPageLoad true 这很有效
ruby on Rails 的 Mahout 插件

我想在 Ruby on Rails 项目中使用 Apache Mahout 来实现推荐和协作过滤特别是我的要求是建议相关标签推荐相关文章根据用户的喜好提示他评论文章根据用户的地理位置和其他元信息向他推荐类似的用户如果任何其他解
我什么时候应该明确使用@synthesize？

据我所知从 XCode 4 4 开始 synthesize将自动生成属性访问器但刚才我读了一个关于的代码示例NSUndoManager 并且在代码中它注意到 synthesize被明确添加喜欢 interface RootViewCo
Azure DevOps 中“bash exited with code 1”中的 Cypress 测试退出失败

我已将 Cypress 测试设置为在 Azure DevOps 中运行我通过 yml 文件中的 CMD 命令运行测试然后获取测试结果当测试通过时一切都按预期工作并且测试结果显示在摘要中当测试失败时 CMD 步骤会失败并显示错误
如何使用 Powershell 下载并安装适用于 Windows 的 git 客户端

我必须编写自动 powershell 脚本来从 gihtub 克隆存储库但我需要使用命令行安装 git 您能否让我知道如何使用命令行在窗口上下载并安装 git 而无需执行任何手动工作提前致谢希望在不使用巧克力的情况下做同样的事情以下
为什么 tkinter（或海龟）似乎丢失或损坏？它不应该是标准库的一部分吗？

当尝试使用 Tkinter 标准库包或其相关功能使用海龟图形时我看到了许多不同的问题 turtle和内置的 IDLE IDE 或者使用将此作为依赖项的第三方库例如使用 Matplotlib 显示图形窗口似乎即使没有隐藏标准库模块名
如何在 HashSet 中搜索时使用正则表达式

我正在编写一个 Java 程序我需要在其中搜索集合中的特定单词必须搜索的单词类似于 wo d where 可以用任何其他字母代替我正在使用正则表达式来匹配此类类型的单词大小写这就是我到目前为止所拥有的 HashSet

如何在 HashSet 中搜索时使用正则表达式

如何在 HashSet 中搜索时使用正则表达式 的相关文章

随机推荐

热门标签

如何在 HashSet 中搜索时使用正则表达式的相关文章