在文档中查找 HTML 字符串

2024-01-04

我想获取所有 HTML<p>...</p>在一个文档中。
Using Regex使用以下命令查找所有此类字符串:

Regex regex = new Regex(@"\<p\>([^\>]*)\</p\>", RegexOptions.IgnoreCase);

但我无法得到任何结果。我的正则表达式有什么问题吗?

现在,我只想得到介于两者之间的所有内容<p>...</p>标签并希望为此使用正则表达式,因为源不是 HTML 文档。


不要使用正则表达式解析 HTML https://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454!!!


相反,使用HTML 敏捷包 http://html-agility-pack.net/?z=codeplex.

例如:

var doc = new HtmlDocument();
doc.Load(...);

var pTags = doc.DocumentNode.Descendants("p");

EDIT:即使文档实际上不是 HTML,您也可以执行此操作。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

在文档中查找 HTML 字符串 的相关文章

  • 从 html 页面和 javascript 调用 java webservice

    我正在尝试从 javascript 调用 java 实现的 Web 服务 使用 NetBeans IDE 我读过很多关于 jQuery 和 AJAX 的内容 但我似乎无法掌握它 假设我的 Web 服务 WSDL 位于 http localh
  • 跨多个控件共享事件处理程序

    在我用 C 编写的 Windows 窗体应用程序中 我有一堆按钮 当用户的鼠标悬停在按钮上时 我希望按钮的边框发生变化 目前我有以下多个实例 每个按钮一个副本 private void btnStopServer MouseEnter ob
  • iframe 位置居中

    所以我找到了这段用于将内容放在中心的代码 但我的问题是它是为容器制作的 你知道如何为 iframe 制作它吗 或者你知道另一个代码吗 代码 center margin auto width 60 border 3px solid 73AD2
  • 基于范围的 for 循环中的未命名循环变量?

    有没有什么方法可以不在基于范围的 for 循环中 使用 循环变量 同时也避免编译器发出有关未使用它的警告 对于上下文 我正在尝试执行以下操作 我启用了 将警告视为错误 并且我不想进行像通过在某处毫无意义地提及变量来强制 使用 变量这样的黑客
  • 按字典顺序对整数数组进行排序 C++

    我想按字典顺序对一个大整数数组 例如 100 万个元素 进行排序 Example input 100 21 22 99 1 927 sorted 1 100 21 22 927 99 我用最简单的方法做到了 将所有数字转换为字符串 非常昂贵
  • .Net Core / 控制台应用程序 / 配置 / XML

    我第一次尝试使用新的 ConfigurationBuilder 和选项模式进入 Net Core 库 这里有很多很好的例子 https docs asp net en latest fundamentals configuration ht
  • A* 之间的差异 pA = 新 A;和 A* pA = 新 A();

    在 C 中 以下两个动态对象创建之间的确切区别是什么 A pA new A A pA new A 我做了一些测试 但似乎在这两种情况下 都调用了默认构造函数 并且仅调用了它 我正在寻找性能方面的任何差异 Thanks If A是 POD 类
  • 在 Selenium WebDriver 上如何从 Span 标签获取文本

    在 Selenium Webdriver 上 如何从 span 标记检索文本并打印 我需要提取文本UPS Overnight Free HTML代码如下 div id customSelect 3 class select wrapper
  • 是否有比 lex/flex 更好(更现代)的工具来生成 C++ 分词器?

    我最近将源文件解析添加到现有工具中 该工具从复杂的命令行参数生成输出文件 命令行参数变得如此复杂 以至于我们开始允许它们作为一个文件提供 该文件被解析为一个非常大的命令行 但语法仍然很尴尬 因此我添加了使用更合理的语法解析源文件的功能 我使
  • Windows 10 中 Qt 桌面应用程序的缩放不当

    我正在为 Windows 10 编写一个简单的 Qt Widgets Gui 应用程序 我使用的是 Qt 5 6 0 beta 版本 我遇到的问题是它根本无法缩放到我的 Surfacebook 的屏幕上 这有点难以判断 因为 SO 缩放了图
  • .NET 选项将视频文件流式传输为网络摄像头图像

    我有兴趣开发一个应用程序 它允许我从 xml 构建视频列表 包含视频标题 持续时间等 并将该列表作为我的网络摄像头流播放 这意味着 如果我要访问 ustream tv 或在实时通讯软件上激活我的网络摄像头 我的视频播放列表将注册为我的活动网
  • 网络参考共享类

    我用 Java 编写了一些 SOAP Web 服务 在 JBoss 5 1 上运行 其中两个共享一个类 AddressTO Web 服务在我的 ApplycationServer 上正确部署 一切都很顺利 直到我尝试在我的 C 客户端中使用
  • AccessViolationException 未处理

    我正在尝试使用史蒂夫 桑德森的博客文章 http blog stevensanderson com 2010 01 28 editing a variable length list aspnet mvc 2 style 为了在我的 ASP
  • 什么是 C 语言的高效工作流程? - Makefile + bash脚本

    我正在开发我的第一个项目 该项目将跨越多个 C 文件 对于我的前几个练习程序 我只是在中编写了我的代码main c并使用编译gcc main c o main 当我学习时 这对我有用 现在 我正在独自开展一个更大的项目 我想继续自己进行编译
  • 在 URL 中发送之前对特殊字符进行百分比编码

    我需要传递特殊字符 如 等 Facebook Twitter 和此类社交网站的 URL 为此 我将这些字符替换为 URL 转义码 return valToEncode Replace 21 Replace 23 Replace 24 Rep
  • EPPlus Excel 更改单元格颜色

    我正在尝试将给定单元格的颜色设置为另一个单元格的颜色 该单元格已在模板中着色 但worksheet Cells row col Style Fill BackgroundColor似乎没有get财产 是否可以做到这一点 或者我是否必须在互联
  • 允许 iframe 跨域链接到目标父框架

    我有 2 个域 域 1 上的一个页面使用 iframe 加载域 2 中的内容 如何允许来自domain2 iframe 内 的链接在domain1 的完整父框架中打开 我一直在关注IE和w3c的新沙箱属性 http www w3 org T
  • 已过时 - OpenCV 的错误模式

    我正在使用 OpenCV 1 进行一些图像处理 并且对 cvSetErrMode 函数 它是 CxCore 的一部分 感到困惑 OpenCV 具有三种错误模式 叶 调用错误处理程序后 程序终止 Parent 程序没有终止 但错误处理程序被调
  • 如何将字符串“07:35”(HH:MM) 转换为 TimeSpan

    我想知道是否有办法将 24 小时时间格式的字符串转换为 TimeSpan 现在我有一种 旧时尚风格 string stringTime 07 35 string values stringTime Split TimeSpan ts new
  • 为什么 strtok 会导致分段错误?

    为什么下面的代码给出了Seg 最后一行有问题吗 char m ReadName printf nRead String s n m Writes OK char token token strtok m 如前所述 读取字符串打印没有问题 但

随机推荐

  • C# 8.0 默认接口实现基本语法/显式调用

    我一直在搞乱默认的接口实现 认为您必须向下转换为接口类型才能使用默认方法实现 我还发现了一堆关于另一种语法的注释 我找不到这是否已经包含在内 我确实找到了关于它的外观的 决定 但是它不起作用 我做错了吗 还是这个新语法尚未包含在内 有些相关
  • 如何将 matplotlib 图导出为具有可编辑文本字段的矢量图形?

    我正在尝试导出多个绘图以在 Adob e Illustrator 中进行编辑 并且尝试将标题 轴标签和条形图标签作为单独的文本字段 即 如果我单击 Illustrator 或您选择的编辑器 中的标题 整个标题就是一个单独的字段 以下是我如何
  • C# - 无法处理 Enter 和 Tab 键事件

    我是新的 c 我正在使用下面的代码 但该代码不适用于 Enter 键和 Tab 键 请解决这个问题 private void Panel Load object sender EventArgs e this KeyDown new Key
  • 对于给定的二叉树找到最大二叉搜索子树

    对于给定的二叉树 找到最大的子树也是二叉搜索树 Example Input 10 50 150 25 75 200 20 15 35 65 30 120 135 155 250 Output 50 25 75
  • Powershell 文本搜索 - 多个匹配项

    我有一组 txt 文件 其中包含以下一个或两个字符串 red blue green orange purple 列表中还有更多 50 多种 可能性 如果有帮助 我可以判断 txt 文件是否包含一项或两项 但不知道它们是哪一项 字符串模式始终
  • catch(...) 中的 throw 是按值还是按引用抛出

    我的老板回答了这个问题为什么catch块中存在 三点 https stackoverflow com questions 36737602 why three points in catch block is exist 36738071
  • C++11 使用 OpenGL 进行多线程渲染可防止主线程读取 stdin

    它似乎与平台相关 适用于我的笔记本电脑上的 Ubuntu 12 04 不适用于我的工作站上的另一个 Ubuntu 12 04 这是关于我使用两个线程所做的事情的示例代码 include
  • 在 C/C++ 中连接字符串

    如何使用 C C 连接字符串 我尝试了以下方法 PS errorInfo是一个char 我应该返回它 errorInfo strcat Workflow strcat workflowToString workflow utf8 strca
  • Gradle执行dex错误命令行太长

    我正在使用 gradle 在 Windows 上构建 Android 应用程序 当涉及到最后一个模块时 我面临以下错误 What went wrong Execution failed for task client test dexApi
  • 使用 Ruby 迭代 JSON 并获取数组中的键、值

    我在处理这个 JSON 时遇到了一些问题 ENAX BRANCHESM 10 repo test ASO PATH tmp pruebaAlvaro ARTIFACTS example1 jar another one jar and an
  • Ember.js 如何引用 Grunt.js 预编译的 Handlebars 模板?

    我一直在探索 Ember js 以及 Grunt js 但我无法理解 Ember js 如何找到并使用预编译的 Handlebars 模板 现在我的 Gruntfile js 看起来像这样 module exports function g
  • jquery 选择 iframe 子元素

    我正在使用 editArea 库和 jquery 来完成我需要的操作 所以在我的html中有一个iframe标签 editArea使用我需要的是使用jquery访问类似的东西 iframe textarea keydown function
  • 即使使用导航2.2.1后仍然有错误没有当前导航节点

    我尝试过阅读this https stackoverflow com questions 59970818 navcontroller no current navigation node after device rotation但这并不
  • 有没有办法在 Sparx Enterprise Architect 中搜索元素类型?

    模型搜索功能似乎没有办法将结果限制为特定类型 例如Class Node等有没有办法实现呢 我知道我可以编写 SQL 查询 但是无法找到正确的表名 EDIT 看来我可以执行以下操作 Select Object Type AS CLASSTYP
  • 如何修复 CA2100 Review SQL 查询的安全漏洞问题

    我正在分析我的代码并遇到这个安全问题 CA2100 检查 SQL 查询是否存在安全漏洞 传递到 Add item loadgrid 中的 SqlDataAdapter SqlDataAdapter string SqlConnection
  • 使用模型进行 ID 分配

    我尝试使用模型绑定将 ID 分配给选择控件中的项目 但最终出现错误 这是我的代码 Model languages language English locale en language German locale de 选择控制 var o
  • android书签ContentProvider制作书签但在浏览器的书签中不可见

    我正在使用 Android 的浏览器书签 ContentProvider 以编程方式创建新书签 书签已创建 我可以通过 ContentProvider 以编程方式检索它 但书签在浏览器书签视图中不可见 想法 Saving the bookm
  • 如何正确removeFromSuperview?

    苹果说 removeFromSuperview 取消链接 来自其超级视图的接收者及其 窗口 并将其从 响应者链 void 从超级视图中删除 切勿在以下情况下调用此方法 显示 所以 当我想删除一个视图时 我习惯于将它从它的超级视图中删除 为什
  • 操作系统关闭过程中会发生什么?

    我希望这与编程足够相关 操作系统关闭过程中到底发生了什么 我们以开源的 Linux 为例 可能对此有更多的了解 如何 内核线程终止 当计算机处于 清除 状态时 电源是否停止供电 很明显 我所说的清晰状态是指 CPU 中不再发生任何事情 等等
  • 在文档中查找 HTML 字符串

    我想获取所有 HTML p p 在一个文档中 Using Regex使用以下命令查找所有此类字符串 Regex regex new Regex