Java Regex 从 HTML 锚点 (...) 标记获取文本

2023-11-22

我正在尝试获取某个标签内的文本。所以如果我有：

<a href="http://something.com">Found<a/>

我希望能够检索Found text.

我正在尝试使用正则表达式来做到这一点。我能够做到，如果<a href="http://something.com>保持不变，但事实并非如此。

到目前为止我有这个：

Pattern titleFinder = Pattern.compile( ".*[a-zA-Z0-9 ]* ([a-zA-Z0-9 ]*)</a>.*" );

我认为最后两部分 -([a-zA-Z0-9 ]*)</a>.*- 还好，但我不知道第一部分该怎么做。

正如他们所说，不要使用正则表达式来解析 HTML。如果您意识到缺点，那么您可能会逃脱惩罚。尝试

Pattern titleFinder = Pattern.compile("<a[^>]*>(.*?)</a>", Pattern.DOTALL | Pattern.CASE_INSENSITIVE);
Matcher regexMatcher = titleFinder.matcher(subjectString);
while (regexMatcher.find()) {
    // matched text: regexMatcher.group(1)
}

将迭代字符串中的所有匹配项。

它不会处理嵌套<a>标签并忽略标签内的所有属性。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Java

regex

Java Regex 从 HTML 锚点 (...) 标记获取文本的相关文章

如何使用 SimpleDateFormat 解析多种格式的日期

我正在尝试解析文档中的一些日期用户似乎以类似但不完全相同的格式输入了这些日期以下是格式 9 09 9 2009 09 2009 9 1 2009 9 1 2009 尝试解析所有这些内容的最佳方法是什么这些似乎是最常见的但我想让我困扰
对话框上的 EditText 不返回任何文本

我太累了找不到错误我没有发现任何错误但我没有从 editText 收到任何文本请看下面的代码活动密码 xml
为什么 java 编译器不报告 Intellij 中多播表达式的未经检查的强制转换警告？

为什么下面的代码没有报告 Intellij IDEA 的未经检查的警告jdk 1 8 0 121自从Supplier
来自数据库的 jfreechart 散点图

如何使用java中的jfreechart绘制mysql数据库表中数据的散点图我使用过 Swing 库任何链接都会有帮助我搜索了谷歌但找不到理解的解决方案如果您有代码请提供给我实际上我确实做了条形图并使用 jfreechart 绘
在文本文件中搜索单词并返回其频率

如何在包含单词文本的文本文件中搜索特定单词并返回其频率或出现次数使用扫描仪 String text Question how to search for a particular word in a text file containin
如何在 JSP 中导入类？

我是一个完全的JSP初学者我正在尝试使用java util List在 JSP 页面中我需要做什么才能使用除以下类之外的类java lang 使用以下导入语句进行导入java util List 顺便说一句要导入多个类请使用以下格式
使用 RecyclerView 适配器在运行时更改布局屏幕

我有两个布局文件如下所示如果列表中存在数据则我显示此布局当列表为空时我会显示此布局现在我想在运行时更改布局当用户从列表中删除最后一项时我想将布局更改为第二张图片中显示的空购物车布局 In getItemCount Recy
主线程如何在该线程之前运行？

我有以下代码 public class Derived implements Runnable private int num public synchronized void setA int num try Thread sleep 1
如何从 Retrofit2 获取字符串响应？

我正在做 android 正在寻找一种方法来执行超级基本的 http GET POST 请求我不断收到错误 java lang IllegalArgumentException Unable to create converter for
[A-z0-9]+ 正则表达式匹配方括号[重复]

这个问题在这里已经有答案了我正在努力解决以下正则表达式 A z0 9 如果针对此字符串进行测试 a919238 a asd 它返回a919238 包括方括号我尝试输入我在 regex101 上的测试用例 https www regex1
检测两个正则表达式是否可能匹配相同的字符串[重复]

这个问题在这里已经有答案了给定两个正则表达式是否可以检测是否存在与它们都匹配的可能字符串例如给定正则表达式A and 我可以看到那个字符串 A 匹配他们两个这是一个简单的案例我的问题是针对更广泛的情况给定任何两个有效的正则表达
如何通过php获取网页的Open Graph协议？

PHP 有一个简单的命令来获取网页的元标记 get meta tags 但这仅适用于具有名称属性的元标记然而开放图谱协议如今变得越来越流行从网页获取 opg 值的最简单方法是什么例如我看到的基本方法是通过 cURL 获取页面并使用
如何记录来自 Akka (Java) 的所有传入消息

在 Scala 中您可以使用 LoggingReceive 包装接收函数如何通过 Java API 实现相同的目标 def receive LoggingReceive case x do something Scala API 有Lo
如何在Java中正确删除数组[重复]

这个问题在这里已经有答案了我刚接触 Java 4 天从我搜索过的教程来看讲师们花费了大量精力来解释如何分配二维数组例如如下所示 Foo fooArray new Foo 2 3 但我还没有找到任何解释如何删除它们的信息从内存的情
Java：拆箱整数时出现空指针异常？

此代码导致空指针异常我不知道为什么 private void setSiblings PhylogenyTree node Color color throws InvalidCellNumberException PhylogenyTr
Java的-XX:+UseMembar参数是什么

我在各种地方论坛等看到这个参数并且常见的答案是它有助于高并发服务器尽管如此我还是找不到 sun 的官方文档来解释它的作用另外它是Java 6中添加的还是Java 5中存在的顺便说一句许多热点虚拟机参数的好地方是这一页 ht
使用FFMpeg确定视频类型，然后进行转换？

我正在尝试以编程方式确定文件的真实类型看来我必须使用 FFMPeg 来实现这一点我想确定上传的文件实际上是否是 MP4 或 FLV 对于 Flash 视频或 WebM 对于 HTML5 我知道 FFMPeg 中的 i 运算符但我不知
Hibernate 和可序列化实体

有谁知道是否有一个框架能够从实体类中剥离 Hibernate 集合以使它们可序列化我查看了 BeanLib 但它似乎只进行实体的深层复制而不允许我为实体类中的集合类型指定实现映射 BeanLib 目前不适用于 Hibernate 3 5
JAXB - 列表<可序列化>？

我使用 xjc 制作了一些课程 public class MyType XmlElementRefs XmlElementRef name MyInnerType type JAXBElement class required false
启动Java项目时发生类冲突：ClassMetadataReadingVisitor将接口org.springframework.asm.ClassVisitor作为超类

我正在使用最新的Spring框架版本 3 2 2 RELEASE 开发一个Java Web项目但是现在项目启动时遇到了问题详细错误是 java lang IncompleteClassChangeError 类 org springfr

随机推荐

如何将 Enter 键绑定到 tkinter 按钮

我正在尝试绑定回车键 with a button 在下面的代码中我试图从条目小部件中获取条目当按钮bt被按下它调用enter 获取条目的方法我还希望通过按回车键我没有得到想要的结果在条目小部件中输入的值不会被读取并且enter
如何在 Kubernetes 中从工作节点找到主节点

我需要知道我当前的工作节点连接到哪个主节点我可以通过在主节点中输入 kubectl getnodes 命令来查看工作节点但我需要从工作节点本身找到主节点简单来说 kubernetes集群中如何从worker节点找到master节点您
如何记录 Spring Data JPA 存储库方法的执行时间？

我有简单的 Spring Data JPA 存储库 public interface UserRepository extends JpaRepository
C# 中的匿名类型

x is compiled as an int var x 10 y is compiled as a string var y Hello z is compiled as int var z new 0 1 2 but ano is c
Rails Mongoid 无法进行身份验证 - 失败并出现错误 13：“未授权对 my_db.my_collection 进行查询”

这个问题据说最新版本的Moped已经解决了但我仍然遇到这种情况我有一个 Rails 4 2 应用程序Mongoid 为 MongoDB 数据库创建了一个用户读写 and dbOwner角色并设置授权真 in the mong con
MPAndroidChart LineChart：使用日期而不是字符串作为 X 轴

MPAndroid图表折线图默认情况下接受 X 轴字符串有没有办法将日期设置为 X 轴的数据类型仅将日期转换为字符串的问题是图表可能会根据数据点而倾斜例如如果我在 1 月份有一个数据条目在 6 月份有 10 个数据条目则默认情况
Shiny - 在输出中使用观察函数调用的结果

我有一个闪亮的应用程序其中基于所选选项列数据集动态重新计算重新计算的结果用于向用户显示另一组选项并创建绘图目前我正在使用observe 读取用户选择重新计算数据集并更新 UI 但是当显示输出图时我必须再次重新计算因为o
无法解析 com.android.support:appcompat-v7:28.0.0

对此有很多不同的问题但使用时存在问题v7 28 0 v7 28 v7 28 0 0 rc02但是当我同步我的项目时我收到此错误无法解决 app debug compileClasspath 的依赖关系可以无法解析 com andr
如何防止 Android 设备从 Qt 应用程序进入睡眠状态

我正在 Android 上部署 Qt 应用程序需要防止设备进入待机状态否则我的线程会被中断而且我的 BLE 连接也会丢失我发现这样如何以编程方式防止 Android 设备进入睡眠状态应执行此 Java 代码 PowerMana
如何知道每次通话/短信的 SimSlot 号码？

您只知道广播接收器中的 sim 插槽号经过一个月的研究我得到了一个对我来说效果很好的解决方案如下所示首先将 android permission READ PHONE STATE 权限添加到您的清单文件中实现电话事件接收器为您的
如何在 android 文本视图中使用 getlinecount()

我想知道我的文本视图中有多少行我已经设置了文本视图文本然后我想获取文本视图中需要多少行我使用 mytextview getLineCount 但它不起作用它总是返回 0 有人能帮我吗您需要发布获取行数的方法这是示例代码 imag
C# Windows 服务自终止服务

如何让服务自行终止 Environment Exit 将导致应用程序启动但服务保持运行任何想法您可以使用 SCM 从服务本身关闭您的服务 System ServiceProcess ServiceController svc new
启用 CORS 的服务器不拒绝请求

我正在尝试使用快递Cors使用我的 resitfy 服务器它似乎并没有拒绝来自其他 ip 的请求我在本地工作所以我尝试将 origin 设置为随机公共 IP 但我的所有请求仍在处理中这是我的路线 module exports fun
Hibernate：删除多对多关联

我有两个具有多对多关联的表数据库片段 loads Id Name sessions Id Date 会话负载 LoadId会话ID Hibernate 映射片段 loads hbm xml
跨数据库外键错误

这是我的第一个数据库 DB1 的模型 from django db import models class Company models Model name models CharField max length 100 null Tru
初始化 Objective-C 类别中的静态变量

我试图创建一个静态变量来存储图像字典不幸的是我能找到的初始化它的最好方法是检查使用该变量的每个函数由于我是在类别内创建此变量因此我不能仅在初始化程序内初始化它有没有更简洁的方法来初始化 navigationBarImages st
Typescript：对象和基元之间的 keyof typeof union 始终是 never

首先我的问题的一些背景信息我有一个项目在其中我通过 Socket IO 接收一个对象因此我没有关于它的类型信息此外它是一种相当复杂的类型因此需要进行大量检查以确保接收到的数据良好问题是我需要访问由接收到的对象中的字符串指定的
不（最大宽度：512px）不工作

我有以下 HTML 页面 Foobar 但是这对窗口没有响应width 媒体规则从未适用如果我删除not 它按预期工作我不明白什么not max width 是的我知道还有其他方法可以完成同样的事情并且not max width
角度单元测试失败，但不是本地测试

升级到 Angular 版本 11 后 Travis CI 上的单元测试现在失败在本地它们确实成功了即使在使用相同的节点 nvm 和 npm 版本进行全新安装之后所有单元测试的错误都是相同的 Failed fn bind is no
Java Regex 从 HTML 锚点 (...) 标记获取文本

我正在尝试获取某个标签内的文本所以如果我有 a href http something com Found a a 我希望能够检索Found text 我正在尝试使用正则表达式来做到这一点我能够做到如果 a href a a gt 我

Java Regex 从 HTML 锚点 (...) 标记获取文本

Java Regex 从 HTML 锚点 (...) 标记获取文本 的相关文章

随机推荐

Java Regex 从 HTML 锚点 (...) 标记获取文本

热门标签

Java Regex 从 HTML 锚点 (...) 标记获取文本的相关文章