从

标签中提取内容 C# RegEx

2024-03-24

我有一个代码`

string tag = "div";
string pattern = string.Format(@"\<{0}.*?\>(?<tegData>.+?)\<\/{0}\>", tag.Trim());
Regex regex = new Regex(pattern, RegexOptions.ExplicitCapture);
MatchCollection matches = regex.Matches(data);

我需要在之间获取内容<div class="in"> .... </div> tags

   <div class="in">
        <a href="/a/show/7184569" class="mm">ВАЗ 2121</a> <span class="for">за</span>    <span class="price">2 700 $</span></span><br/><span class="year">1990 г.</span><br/><div style="margin: 3px 0 3px 0">1.6 л, бензин, КПП механика, с пробегом, белый, литые диски, тонировка, спойлер, ветровики, противотуманки, Движок после капитального ремонта!</div><div>
     <span style="display:block; padding: 4px 0 0 0;"><span class="region">Костанай</span><span class="adv-phones">, +7 (777) 4464451</span></span>

            <small class="gray air">24 просмотра</small>


            <small class="gray air">13 июня</small>
    </div>
    <div class="selectItem" title="Выбрать" id="fv_sic_7184569">
        <a href="#" class="fav-button" id="fav_7184569">&nbsp;</a>           </div>
</div>

我该怎么做？我的代码不起作用。

这是一个可以提取简单 div 标签的正则表达式：

// <div[^>]*>(.+?)</div>

string tag = "div";
string pattern = string.Format(@"<{0}[^>]*>(?<tegData>.+?)</{0}>", tag.Trim());

然而，使用 RegEx 进行 HTML 解析几乎总是不合适的，而且肯定无法正常工作。这只是因为 HTML 等标记语言不是常规语言。

话虽这么说，您最好使用 XML 解析器来解析文档或片段，然后提取您需要的内容。事实上，使用只进解析器甚至可能比尝试使用 RegEx 更快。

你应该看看.NET 中的 XmlReader 类 http://msdn.microsoft.com/en-us/library/system.xml.xmlreader.aspx.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

c

regex

Parsing

html

从

标签中提取内容 C# RegEx 的相关文章

对“组件”类型的引用声明它是在“系统”中定义的

尝试在 UWP 应用程序中获取一些 WMI 对象在 net 4 6 上运行 VS2015 我收到 ForEach 和方法调用错误指出引用类型组件声明它是在系统中定义的错误为 CS7069 using System using
在 C# 中读取并发送 mp4 文件

我使用以下代码从服务器读取 mp4 文件并通过 http 发送它我的服务器端是 mvc4 控制器有趣的是视频在 Chrome 中渲染得很好但在 ios 设备上没有得到任何东西所以我认为这可能是响应流标头问题我缺少什么吗 var
具有自定义字段名称的 RavenDB 查询索引

我在 RavenDB 中收集了 Message 文档定义 class Message string Content Tag Tags class Tag string Value 我有索引 from doc in docs Message
为什么弹性物品会包裹而不是收缩？

我想知道是否有人可以给我一个关于如何计算 Flexbox 布局的简单介绍特别是优先级顺序例如 div style display flex div style height 200px background color lightgre
C# 中是否有相当于 php array_merge 的函数

如果不是创建它的最佳方法是什么注意合并不仅仅是附加它融合了相同的键此功能存在于 List 元素上在 C 中数组是固定宽度的项因此在不创建新数组的情况下无法修改大小然而列表却是另一回事你可以做 List
如何强制操作系统收回内存？（C++）

在我的 C 代码中我分配了大量内存来创建树然后在每个节点中使用删除来释放内存删除所有内容后我检查操作系统使用的内存量发现内存未释放这是预期的因为该进程不会立即将内存返回给操作系统因为它仍然可能会再次使用它问题是我在删
MaxLength 数据注释是否可以与 List 一起使用？

一个可以用 MaxLength 具有字符串和简单数组的属性 i e MaxLength 500 public string ProductName get set Or MaxLength 50 public string Products
ASP.NET MVC：如何在返回状态代码 404 的同时提供内容？ [复制]

这个问题在这里已经有答案了可能的重复如何配置 IIS 以使用自定义内容提供 404 响应 https stackoverflow com questions 2551959 how to configure iis to serve m
C#等待串口数据

我试图通过 C 应用程序从指纹扫描仪获取数据但在指纹发送之前我的整个代码都会执行我尝试使用延迟功能System Threading Thread Sleep 1000 因此它可以在下一步执行之前获取数据但这一切似乎都是徒劳的任何人
动态创建多个上传文件

我想知道是否有人知道动态创建上传表单的最佳方法这就是我想要实现的目标下面显示的代码允许一次上传我想要一个按钮按下该按钮后应添加另一种形式用于文件上传因此如果我想上传假设有 7 个文件我想按按钮 7 次来创建这些上传表单每
用 org.Json 解析 Java 中的 JSON？

我在这方面遇到了很多麻烦我正在尝试进行更新并且正在使用从 url 返回此内容的 api JSON downloadUrl URL fileName Name gameVersion Version name Name projectId
为什么 ReadKey 在从 Git Bash 运行 .net-core 控制台应用程序时会抛出异常？

这是代码 ConsoleKeyInfo cki while cki Console ReadKey true Key ConsoleKey Escape Console WriteLine cki Key 当我使用 dotnet run 从
如何对列表进行垂直排序？

我在下面使用这个HTML and CSS对列表进行排序的代码vertical 输出是horizontal sorted 我的示例代码
css打印模式：仅在生成的word文档的第一页上显示页眉和页脚

我使用 html 代码成功生成了 Word 文档其中页眉和页脚以 css 打印模式设置样式这是我的代码
如何使 YY_INPUT 指向字符串而不是 Lex & Yacc (Solaris) 中的标准输入

我想要我的yylex 解析字符串而不是文件或标准输入如何使用 Solaris 提供的 Lex 和 Yacc 来做到这一点重新定义YY INPUT 这是一个工作示例使用命令编译并运行 yacc d parser y lex lexer
Python 比 C++ 更快、更轻吗？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
当我已经定义了变量时，为什么会收到一条错误消息，指示变量不存在？

我收到一条错误消息表明MyRandomArray在当前上下文中不存在如何在 C WinForms 应用程序中跨类访问变量 public void Quiz Load object sender EventArgs e string My
如何仅从源代码构建 TensorFlow lite 而不是所有 TensorFlow？

我正在尝试使用 Edgetpu USB 加速器与 Intel ATOM 单板计算机和 C API 进行实时推理 Edgetpu 的 C API 基于 TensorFlow lite C API 我需要包含来自tensorflow lite目
如何编辑 .csproj 文件

当我使用 NET Framework 4 0 MSBUILD EXE 文件编译 csproj 文件时出现错误在 website01 csproj 的当前上下文中找不到 lable01 实际上我需要添加每个 ASP NET 页面及其代码
尝试返回 IQueryable 时发生转换错误

我有一个查询应该返回IQueryable

随机推荐

对于系统文本的多语言支持 x 种语言来说，这是一个很好的设计吗？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案这个实现的扩展性是否良好要求是系统必须支持x种语言其中 x will 企业可以翻译的尽可能多的语言所有系统维护的值页面内容电子邮件内
使用 AVPlayer 传输音频

当在表视图中选择一行但它不播放时我尝试使用 AVPlayer 播放 URL 中的音频我究竟做错了什么这是代码 void tableView UITableView tableView didSelectRowAtIndexPath N
如何在 Xcode 中使用 boost::multi precision::float128

我正在尝试在 xCode 项目中使用 boost multi precision float128 我的编译器版本是 Apple clang 版本 11 0 0 clang 1100 0 20 17 目标 x86 64 apple darw
检查模型是否存在，如果在 Laravel 中找不到则继续路由

我有两个模型我不想在其 URL 前面添加前缀例如用户和帖子如果我有一个网址https example com title of the post https example com title of the post and htt
正确确定日期字符串是否是该格式的有效日期

我从 API 收到一个日期字符串其格式为yyyy mm dd 我目前正在使用正则表达式来验证字符串格式该格式工作正常但我可以看到在某些情况下根据字符串它可能是正确的格式但实际上是无效的日期 IE 2013 13 01 例如 PHP
R包已安装但无法加载？

我在 R 中安装了 digest 包 gt install packages digest Installing package into C Users user Documents R win library 3 3 as lib is
为什么 Replace() 在我的 Python 函数中不起作用？ [复制]

这个问题在这里已经有答案了这是实际代码 def replace exception chars string exception chars dict Old New old new exception chars keys list e
如何更改时间选择器对话框片段的默认配色方案？

我正在尝试更改时间选择器对话框片段的默认颜色现在我不知道我应该做什么这就是我设法将我的主题设置为没有actionBar but this is the dialog i get 这是我的 xml 样式文件
睡眠或暂停 NSThread

我正在创建一个新线程它每隔一定时间就运行我的方法之一现在我正在做的事情如下 NSThread thread NSThread alloc initWithTarget self selector selector setUpTimerT
如何向 clang-cl 添加 std=c++11 标志？

我尝试在Windows下使用clang cl编译C 11程序 Clang cl 是 clang 的包装器以便与 cl Visual Studio 编译器更加兼容我尝试添加 std c 11 and std c 11并且都被拒绝了这并
Ruby on Rails：我的实际目标是什么？

我一直在 Ruby on Rails 3 中构建应用程序并且开始担心性能优化现在我希望我的问题对于这个网站来说不太主观但我对事实感兴趣而不是讨论所以这里是虽然我试图让视图渲染得更快但有一件事我根本不知道我的目标是什么给定一
在同一活动中将数据片段传递给片段

我有一些问题想询问有关在活动中将数据从一个片段传递到另一个片段的问题我不知道该怎么做有人可以帮忙吗这是我的代码 ShareFragment java package com example user8 myapplication im
C - 两个指针之间的转换行为

2020年12月11日更新感谢一些程序员老兄在评论中的建议我的根本问题是我们的团队正在实现动态类型存储引擎我们分配多个字符数组 PAGE SIZE 缓冲区16 对齐存储动态类型的数据没有固定的结构出于效率原因我们无法执行字节
在 Windows 8 Metro 风格应用程序中，如何在应用程序未运行时更新动态磁贴？

在 Windows 8 Metro 风格应用程序中如何在应用程序未运行时更新动态磁贴当操作系统开始启动时动态磁贴开始运行 http blogs msdn com b windowsappdev archive 2012 04 16 c
Selenium Python 最小化浏览器窗口

我知道如何从驱动程序对象调用最大化窗口的方法 driver maximize window 但是当我需要最小化浏览器窗口隐藏它时应该使用什么方法呢实际上驱动程序对象没有最大化窗口属性我的目标是在浏览器窗口中默默地工作我不想在我的
如何从 docker 镜像中删除图层？

我通过增量提交构建了一个 docker 映像这导致在我的 docker 镜像中创建了很多层随后镜像的大小变得非常大有没有办法去除图层并从而减小图像的大小任何帮助将不胜感激您可以尝试导出图像然后再次导入通过这种方式所有图层都
TortoiseMerge 可以用作 Windows Git Bash 的 difftool 吗？

我刚刚开始使用 Git 我想使用 TortoiseMerge 作为 difftool 和 mergetool In my HOME gitconfig我有以下部分我已经删除了这个问题的用户和颜色部分 merge tool tortoise
如何在android中以编程方式将视频发送到电子邮件

我想从我的 Android 应用程序将 30 秒的视频发送到电子邮件我已发送带有图像附件的电子邮件但它不适用于视频请帮助我做到这一点提前致谢 send setOnClickListener new OnClickListener O
针对依赖扩展对象的任务的 Gradle 插件最佳实践

我希望获得有关定义依赖于外部状态的插件任务的最佳实践的反馈即在引用插件的 build gradle 中定义我使用扩展对象和闭包来推迟访问这些设置直到它们需要且可用为止我也对任务之间共享状态感兴趣例如将一个任务的输出配置为另一任务的
从

标签中提取内容 C# RegEx

我有一个代码 string tag div string pattern string Format lt 0 gt

从 标签中提取内容 C# RegEx

从 标签中提取内容 C# RegEx 的相关文章

随机推荐

热门标签

从

标签中提取内容 C# RegEx

从

标签中提取内容 C# RegEx 的相关文章