C# - 使用 HTML Agility Pack 获取标签内的文本

2024-04-23

我使用以下代码来解析 HTML 文档并将其存储为 CSV 文件。

string actuald=null;
string data1 = File.ReadAllText("E://text.html");
HtmlDocument doc = new HtmlDocument();
doc.LoadHtml(data1);
HtmlNodeCollection col = doc.DocumentNode.SelectNodes("//pre");

foreach (HtmlNode node in col)
{
     actuald=node.Attributes[""].Value;
}
File.WriteAllText("E://text.csv",actuald);
Console.WriteLine("Data Converted");
Console.ReadKey();

在html文档中，我需要提取的内容位于 pre > 之间。我的文件的内容看起来像

<HTML><HEAD><TITLE>NCEDC_Search_Results</TITLE></HEAD><BODY>Your search parameters are:<ul>
<li>start_time=1973/01/01,00:00:00
<li>end_time=2037/01/01,00:00:00
<li>minimum_magnitude=3.0
<li>maximum_magnitude=10
<li>etype=E
<li>rflag=A,F,H,I
<li>system=selected
<li>format=ncread
</ul>
<PRE>
Date       Time             Lat       Lon  Depth   Mag Magt  Nst Gap  Clo  RMS  SRC   Event ID
----------------------------------------------------------------------------------------------
1973/01/01 06:59:19.23  36.8037 -121.5087   5.65  3.60   Md   28  35    6 0.09 NCSN    1013957 
1973/01/01 07:57:39.65  37.0925 -121.5055   9.19  3.10   ML   45  90    5 0.07 NCSN    1013959 
</pre></html>

但在 html 文档中我没有在任何 html 标签下指定类？属性[""]中应该给出什么内容？

要获取节点内的文本：

actuald = node.InnerText;

获取包含 HTML 标签的文本

actuald = node.InnerHtml;

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

c

htmlagilitypack

C# - 使用 HTML Agility Pack 获取标签内的文本的相关文章

C# 中的简单获取字符串（忽略末尾的数字）

我认为正则表达式太过杀伤力而且它需要我一些时间来编写一些代码我想我现在应该学习因为我知道一些正则表达式分隔字母数字字符串中的字符串的最简单方法是什么它将永远是 LLLLDDDDD 我只想要字母 l 通常只有 1 或 2 个字母 T
是否已经有一些基于 std::vector 的 set/map 实现？

对于小型集合或地图通常使用排序向量而不是基于树的向量要快得多set map 特别是对于 5 10 个元素的情况 LLVM 有一些类本着这种精神 http llvm org docs ProgrammersManual html ds se
正确别名向量

我无法在其他地方找到答案所以我想我只需要问这个我正在尝试获取向量其中存储 int 指针的别名如下所示 void conversion Engine ENGINES The Engine class has a vector of
Qml 中的 FileDialog 在发布中不起作用

我正在与以下项目合作Qt Quick Control 2 当我尝试在调试模式下运行软件时 FileDialog qml 可以完美打开但是当我将其部署为发布模式时它无法工作这是我的代码 import QtQuick 2 4 import
如何将 list 对象附加到另一个对象

在 C 中我有两个list
以 ASCII 字符串形式获取 MemoryStream 内容的快速方法

我在 MemoryStream 中有一个 JSON 字符串我使用以下代码将其作为 ASCII 字符串获取 MemoryStream memstream new MemoryStream Write a JSON string to mem
JObject ToString 与 StringEnumConverter 不起作用

我正在尝试序列化一个匿名类如下所示 public enum ErrorCode A B C var response JObject FromObject new Error new Message Test Code ErrorCode
boost::unordered_map 是...有序的吗？

我有一个 boost unordered map 但它看起来是有序的给我一种压倒性的你做错了的感觉为什么输出是这样的我希望底层的哈希算法能够随机化这个顺序 include
提高 ASP.NET/C# 编译速度的最佳方法是什么？

更新请将您的答案集中在硬件解决方案上您使用什么硬件工具插件来提高 ASP NET 编译和首次执行速度我们正在寻找固态硬盘来加快速度但现在价格确实很高我现在有两个 RAID 0 的 7200 rpm 硬盘但我对性能不再满意所
如何对具有无效值的属性使用 JSON.net 的默认值

我正在使用 Newtonsoft JSON 库来反序列化来自 Web 服务的响应问题是某些字段包含无效值例如一条记录上的一个字段包含一个 T 表示该字段应该是数字我想做的是将无效字段的值设置为 null 或其他默认值我的所有属性都
使用 .NET Core Razor Pages 将文件下载到浏览器

使用 ASP NET Razor Pages 我尝试将文件下载到浏览器在页面 html 中使用这样的链接效果很好 href DownloadableFiles testB csv download newname gt Download
如何获取 TFS 2013 中所有用户的列表

我正在使用 Team Foundation Server TFS 2013 和 Visual studio 2012 我需要 TFS 中所有用户的列表有没有办法使用C 获取TFS中的所有用户从TFS 2010获取用户列表您可以尝试使用
cuda中有模板化的数学函数吗？ [复制]

这个问题在这里已经有答案了我一直在寻找 cuda 中的模板化数学函数但似乎找不到在普通的 C 中如果我调用std sqrt它是模板化的并且将根据参数是浮点数还是双精度数执行不同的版本我想要这样的 CUDA 设备代码我的内核将真
实体框架..自引用表..获取深度=x的记录？

我成功地在实体框架中使用自引用表但我不知道如何获得所需深度的记录这应该是什么逻辑 Model public class FamilyLabel public FamilyLabel this Children new Collectio
使用 Entity Framework Core 在运行时迁移

我正在将 PHP Illuminate 应用程序移植到 ASP NET Core EF Core 其中一部分由类似 Wordpress 的安装过程组成该过程要求提供数据库凭据然后创建应用程序运行所需的表本质上我想在运行时运行某种迁移
产量回报延迟迭代问题

我知道yield return 利用了延迟加载但我想知道我是否可能滥用迭代器或者很可能需要重构我的递归迭代器方法返回给定的所有祖先PageNode包括pageNode itself public class PageNodeIterat
如何使用 GCC 在 C 上编译库？

我用这些文件创建了一个库pila h and pila c 我编译文件pila c with gcc pila c c这个库运行良好我已经测试过了然后我又做了一个图书馆这个库有文件pila funciones extra h and
使用本地系统帐户运行时，GetAccessControl 方法失败，出现意外错误代码 3

我已经创建了 Windows 服务并使用本地系统帐户运行它该服务正在读取用户文件并查找其所有者在获取文件的访问权限以查找所有者时它抛出以下异常方法失败出现意外错误代码 3 StackTrace 在 System Security
GridView，在代码中添加标题行第 2 部分

这是这篇文章的延续但添加了完整的代码 ASP NET GridView 在代码中添加标题行 https stackoverflow com questions 19119004 asp net gridview adding header
我如何将 C++ 与 VALA 混合起来

我需要用 C 编写跨平台的 GUI 应用程序但由于 C 的大多数 GUI 库都有点乏味而且我对 C NET 非常熟悉我发现使用 GTK 的代码 Vala 代码非常有趣并且与其他方式相比有点容易那么我该如何将 VAlA 与 C 混合

随机推荐

确定文件是否是 zip 存档内的目录

我根据规范读取 zip 文件并从中央目录获取每个文件的信息从标题中我读到 define VERSION NEEDED OFSSET 6 UINT16 versionNeeded UINT16 zipFile VERSION NEEDED
ios：如何检测 UITextField 是否使用了语音听写？或者点击键盘上的麦克风按钮

如何检测 UITextField 是否使用了语音听写或者点击键盘上的麦克风按钮有什么办法可以做到这一点吗 UITextField 符合UI文本输入协议 https developer apple com library prerelea
即使在向其附加内容时，也使滚动条固定在底部

为了更好地理解我尝试实现聊天框并平滑过渡先前上方的聊天消息这里是http jsfiddle net eEEGE http jsfiddle net eEEGE 当我单击添加时我希望所有数字 1 9 向上滑动并在其下方附加 1
NuGet 框架程序集不工作

我正在尝试更新 nuget 包以添加一些程序集引用但出现以下错误命名空间中的元素 metadata http schemas microsoft com packaging 2010 07 nuspec xsd http schema
c++11 #include 给出编译错误

尝试从已编译的源文件创建目标文件时出现编译错误我正在使用 c 11 附带的标头我还使用 C 模式识别库和其他几个包含的库我所做的只是添加 include
Keynote iPad 应用程序的 URL 方案参考？

我正在尝试从我正在构建的应用程序启动 Keynote 应用程序我如何知道 Keynote 支持的 URL 方案如果有在 iTunes 中同步应用程序然后转到导航栏中的应用程序按住 Ctrl 键单击 Keynote 在 Finde
crontab 作业的 STDOUT 和 STDERR 输出在哪里

有谁知道 CentOS 中正常 crontab 作业输出的 STDOUT 和 STDERR 在哪里我检查了 var log cron文件但它只记录了 cron 作业执行的时间和命令没有找到 STDOUT 或 STDERR 内容看看
如何在管理页面显示模型的所有字段？

这是模型页面 https i stack imgur com uvhDA png 在这张图片中这里只显示标题我使用了 def unicode self return self title 这是每个单独的对象 https i stack
为什么 React JSX 中分号会抛出错误？

下面是我在 JSX 中渲染方法的一部分为什么后面的分号抛出错误在普通 JavaScript 中完全没问题 ul libraries map function item return li item name toLowerCase l
在同一起始元素标记内，前缀“无法从”重新定义为

我正在尝试使用 C 生成以下 xml 元素
net.TCPConn 允许在 FIN 数据包后写入

我正在尝试为一些服务器端代码编写单元测试但我在确定关闭测试用例时遇到了困难环回 TCP 连接似乎无法正确处理干净关闭我在一个示例应用程序中重现了这一点该应用程序按顺序执行以下操作创建客户端和服务器连接通过从客户端向服务器成功发送
滑行。缓存到外部存储（SD 卡）

I use Glide https github com bumptech glide用于在我的 Android 应用程序中加载图像 3 5更新后开发者提供了滑翔模块 http bumptech github io glide javad
Jquery延迟执行脚本

具有以下条件 navMain nav1 hover function this addClass hover if browser msie browser version lt 7 select css visibility hidden
在 Delphi 中实现 MVVM 绑定（View <-> ViewModel）的最佳方法？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案对于使用本机组件的多平台应用程序标准的 Delphi 方法已不再足够到目前为止我们的结构只有几个部分 GUI 表单和业务逻辑现在我们需
无法找到适合角度 - Bower 安装的版本

我已经设置了我的 Angular 应用程序因此当它被推送到 Heroku 时它就会运行bower install 但是由于版本问题我收到了错误当我跑步时bower install在本地我得到了这个 Unable to find a s
在 Angular 2 中调用单击事件的函数

如何在组件打字稿内声明一个函数并在 Angular 2 中的单击事件上调用它以下是 Angular 1 中相同功能的代码我需要 Angular 2 代码
WAL 存档：失败（请确保已设置 WAL 传送）

我正在尝试配置 Barman 进行备份当我做一个barman check replica我不断得到 Server replica WAL archive FAILED please make sure WAL shipping is se
如何使用 python 或 CL 将文件复制到剪贴板，然后使用 STRG+V 粘贴它？

我正在尝试将文件复制使用 python 或 CL 命令然后可以使用 python 调用到剪贴板以便稍后使用 STRG V 粘贴它据我了解文件不会移动到剪贴板中而是剪贴板保存路径和告诉操作系统这是一个文件的参数标志我
基本 Flask 应用程序未运行（类型错误：模块中缺少必填字段“type_ignores”）

我有一个非常基本的 Flask 应用程序其依赖项是从我的 requests txt 安装的所有这些依赖项都安装在我的虚拟环境中下面给出的requirements txt aniso8601 6 0 0 Click 7 0 Flask
C# - 使用 HTML Agility Pack 获取标签内的文本

我使用以下代码来解析 HTML 文档并将其存储为 CSV 文件 string actuald null string data1 File ReadAllText E text html HtmlDocument doc new HtmlD

C# - 使用 HTML Agility Pack 获取标签内的文本

C# - 使用 HTML Agility Pack 获取标签内的文本 的相关文章

随机推荐

热门标签

C# - 使用 HTML Agility Pack 获取标签内的文本的相关文章