HtmlAgilityPack 获取页面标题和 H1 标签

2024-01-05

嘿，我正在尝试通过执行以下操作从网页获取页面标题和 H1 标签

    doc.LoadHtml(htmlSourceCode)

    txtTitle.Text = doc.GetElementsByTagName("title").InnerText()

    txtH1.Text = doc.GetElementsByTagName("H1").InnerText()

    For Each channel In doc.DocumentNode.SelectNodes(".//meta[@name='description']")
        txtDescription.Text = channel.Attributes("content").Value
    Next

上面唯一有效的代码是 txtDescription 部分。标题和 H1 都没有。我需要使用什么类型的语法才能获得这两个标签？

html 代码如下所示：

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head><meta http-equiv="content-type" content="text/html;charset=utf-8" /><title>
    The title text is here!
</title><link rel="icon" type="image/x-icon" href="http://www.zzzz.com/favicon.ico" />
....
<div class="main-content">
    <div class="block-info">
        <div class="container">
            <div class="article">
                <h1>
                    This is the H1 tag with the text!</h1>

<p>As the 2nd held tru

您可以使用doc.DocumentNode.SelectSingleNode("//head/title") and doc.DocumentNode.SelectNodes("//body//h1").

Or doc.DocumentNode.Descendants("title").SingleOrDefault() and doc.DocumentNode.Descendants("h1").

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

VBNET

Browser

webbrowsercontrol

htmlagilitypack

HtmlAgilityPack 获取页面标题和 H1 标签的相关文章

更改组合框下拉列表边框的颜色

My code Private Sub ComboBox2 DrawItem sender As Object e As DrawItemEventArgs Handles ComboBox2 DrawItem If e Index lt
当用户尝试打开新实例时返回到已打开的应用程序

这是我有一段时间想不通的问题防止第二个实例很简单并且有很多方法但是恢复已经运行的进程则不然我想最小化撤消最小化并将正在运行的实例置于最前面在其他窗口后面将应用程序置于最前面我使用的语言是 VB NET 和 C 我发现这段代码
android 多关键词搜索

我的应用程序包含搜索功能它将搜索数据库内的内容我的搜索的弱点是我只能使用一个标签进行搜索例如我只能搜索猫它会返回我的数据库中包含猫一词的内容因为我正在使用LIKE在 select 语句期间进行查询如何使用多个标签进行搜索
布局引擎和javascript引擎的区别

经过大量阅读似乎当人们说浏览器引擎时他们指的是诸如 gecko 或 webkit 之类的布局引擎我还知道布局引擎基本上负责绘制屏幕而javascript引擎则用于解释但问题是对于现代网络应用程序来说哪一个对性能影响更大这
简单的if检查多个值vb

在Sql中我们可以像这样过滤 SELECT FROM 表名 WHERE 列名 IN firstValue secondValue 如何在VB Net中检查有简单的方法吗或者只是 If variable firstValue Or va
如何检查浏览器是否支持 WebAssembly？

随着所有新的主要浏览器都支持 WebAssembly 我如何检查当前访问我网站的浏览器是否支持它有几种方法可以检测 WebAssembly 的存在基本的一个是检查是否WebAssembly如果类型 object 在全局作用域中但是在不
在Python中打开网站框架或图像

所以我对 python 相当熟练并且经常使用 urllib2 和 Cookies 来实现网站自动化我刚刚偶然发现了 webbrowser 模块它可以在默认浏览器中打开一个网址我想知道是否可以从该 url 中仅选择一个对象并打开它具
String.Format - 它如何工作以及如何实现自定义格式字符串

With String Format 例如可以格式化DateTime对象以许多不同的方式每次我寻找所需的格式时我都需要在互联网上搜索我几乎总能找到一个可以使用的例子例如 String Format 0 MM dd yyyy Date
从 VB.NET 应用程序填写 PDF 表单

我的任务是在 VB Net 中创建一个 Windows 应用程序要求之一是从 MSSQL 数据库读取数据并将某些值放入 PDF 表单中如何使用 VB Net 将数据放入预先存在的 PDF 文件中另外是否可以将PDF文件作为资源放入
如何从代码后面的 Blazor WebAssembly 项目打开浏览器窗口/选项卡：

我正在将 UWP 应用程序转换为托管 ASP NET Core 的 Blazor WebAssembly 我的标记代码位于 Index razor 中后面的代码位于 Index razor cs 中在 UWP 项目中我通过 oncli
根据值从绿色到红色[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我需要一个在 vb net 中返回从红色值 0 到绿色值 100 的颜色的函数另外我需要一种方法来确定字体的颜色应该是白色还是
如何使用网络浏览器控件填写 html 表单

在VB6 classic中我们可以这样做 Private Sub Form Load WebBrowser1 Navigate2 http yourSite com End Sub Private Sub Command1 Click W
Android 浏览器缩放？

我正在尝试为 Android 创建一个移动网站当我将主体宽度设置为 480px 屏幕宽度时结果比我预期的大 50 左右看来 android 正在缩放它所绘制的内容并弄乱了我所有的布局有谁知道如何禁用它或解决它我已经在使用这个您
ASP.NET DropDownList OnSelectedIndexChanged 事件未触发

我试图同时使用一些 AJAX 和 ASP Net 来运行函数而无需刷新整个页面但我在执行此操作时偶然发现了一个问题这是我的代码
如何使用JQuery动态获取Body元素高度

当我调整浏览器窗口大小时我需要获取主体元素的高度和宽度请帮我用JQuery解决这个问题在窗口对象上使用调整大小事件 window resize function var width document width or window w
如何在浏览器控件中隐藏 HtmlElement

我有一个 webbbrowser 控件可以导航到包含图像的页面我想从我的网络浏览器中隐藏或删除该图像我尝试在 DocumentCompleted 事件上设置以下方法但没有成功 webBrowser1 Document GetElem
WPF DataGrid 排序后滚动到顶部

我有一个使用数据网格的 Net 4 0 WPF 应用程序目前按列排序后网格的滚动位置保持在排序前的位置对于此应用程序我需要在任何排序后滚动到网格顶部我尝试过像这样处理排序事件 Private Sub myDataGrid Sor
使用 CoCreateInstance 从 C++ 调用 COMVisible VB.Net dll

自从我上一个问题以来在某种程度上取得了进展我已经编译了以下项目它是基于https stackoverflow com a 10949784 846550 https stackoverflow com a 10949784 84655
语音识别编程问题入门

所以你们可能都看过钢铁侠其中托尼与一个名为贾维斯的人工智能系统进行交互演示剪辑here http www youtube com watch v Go8zsh1Ev6Y 抱歉这是广告我非常熟悉 C C 和 Visual Basi
解析 XML 标签不匹配时出错

随机推荐

jQuery - 动画时调用函数

是否可以调用一些函数 animate事件我得打电话resize 某些 div 上的每个调整大小事件的函数例如我在窗口调整大小事件上调用函数 window resize resize 但现在我想在动画事件中调用这个函数每个改变的像素
PostgreSQL - INNER JOIN 两个带有 LIMIT 的表

我见过this https stackoverflow com questions 11824501 inner joining three tables帖子几乎与我的问题一致但我的具体问题是我需要对第三个表查询施加限制如LIMIT
在Python中获取所有已安装的Windows程序的“正确”且可靠的方法？

我见过很多用 python 检索 WinXP 上安装的程序的方法是什么proper and 最坚固的这样做的方法目前我正在访问HKLM SOFTWARE Microsoft Windows CurrentVersion Uninstal
对字符串调用成员函数guessExtension()

在 Symfony 4 中我收到此错误对字符串调用成员函数guessExtension 在之前我使用相同的代码来上传图像并且做得很好但在这里我遇到了错误有没有人遇到过同样的问题并解决了 em this gt getDoctrine
当表达式=带有对象和字符串的数组时，angularjs ng-class不起作用

我不知道现在是否是为了它但我坚持 AngularJS 文档中的一个声明 https docs angularjs org api ng directive ngClass https docs angularjs org api ng d
从 eventbridge api 目标调用 AWS Lambda 函数 URL

我正在利用 Eventbridge API Destination 调用 lambda 函数的 url 并将其限制到我想要的速率当 lambda 函数的 invoke url auth 类型设置为 None 时此方法有效当我将函数 U
如何根据数据类型在 python 中设置条件？

这个问题看似简单但我却想不出来我知道你可以在 python 中检查数据类型但是如何根据数据类型设置条件呢例如如果我必须编写一段代码来对字典列表进行排序并将所有整数相加那么如何隔离搜索以仅查找整数我想一个简单的例子看起来像这样
“ ./bin/spark-shell ” 无法在 ubuntu 14.04 上使用带有 Hadoop 2.6+ 的 Spark 1.6 预构建版本

在 Ubuntu 14 04 上新下载了带有 Hadoop 2 6 的 Spark 1 6 预构建版本到桌面上我导航到 Spark shell 并按照下面给出的链接启动 Spark快速启动 Spark 链接 http spark apac
如何通过selenium和python点击smtebook中嵌入的youtube视频的播放按钮

我想点击 youtube 播放https smtebooks us downfile 13192 building serverless python web services zappa pdf https smtebooks us do
给定一个整数数组，找到线性时间和常量空间中第一个缺失的正整数

换句话说找到数组中不存在的最小正整数该数组也可以包含重复项和负数这个问题是 Stripe 在编程采访中提出的我设计了一个解决方案如下所示 include
用javascript解析算术表达式

有没有一种简单的方法用javascript来转换以下表达式 e a b c d 变成类似的东西 multiply e add multiply a add b c d 表达式将存储在字符串中我愿意接受任何可以避免我编写自己的解析器的解决
如何在 .NET 中以编程方式重新启动 Windows 服务

如何在 NET 中以编程方式重新启动 Windows 服务另外我需要在服务重启完成后做一个操作本文 http www csharp examples net restart windows service 使用ServiceContr
spring hibernate.createSQLQuery 作为自定义实体返回

我在做Query query hibernate createSQLQuery select abc def from table 是否可以将结果自动解析到 POJO 列表这样我就可以这样做 List
下载 Laravel 时 Composer 非常慢

你能帮我吗我想通过以下方式安装 Laravelcomposer create project laravel laravel进入cms目录但 Composer 下载它非常非常慢你能帮我看看如何增强它吗这是我的终端 saidalo S
Bootstrap Datetimepicker设置日期

我正在使用一个日期时间选择器 http eonasdan github io bootstrap datetimepicker 来自 Eonasdan 到目前为止效果很好我有一个像这样的 HTML 元素 div div 并使用 datet
Win32 (GDI) - 设置静态控件的不透明度

我正在使用 C 无 MFC 或 GDI 我想要的是将子窗口的不透明度设置为 100 我的子窗口是STATIC控制我想知道这是否可能如果可以有人可以指出我如何做到这一点的正确方向这是我的设置我创建我的父窗口如下 HWND hWnd
有没有办法在远程主机上运行 Selenium 测试？

我想运行以下设置 on host 1 执行一些 Selenium 测试 on host 2 运行火狐浏览器 On host 1将有一个 Jenkins 实例运行测试并且host 2将是一个运行在上面的 Docker 容器host 1 并且
折叠卡打开然后立即再次关闭

我读过以前的帖子讨论了导航栏和菜单的这个问题但它似乎并不适用我有一个非常简单的例子两张卡一张默认打开另一张折叠当我尝试按卡 2 按钮展开第二张卡时它会打开但随后立即再次关闭我不确定我做错了什么这里的例子 div div
PHP：反洪水/垃圾邮件系统

我实际上正在开发一个 PHP 项目该项目将具有用户系统登录注册将丢失的密码发送到电子邮件我认为这可能非常容易受到暴力攻击和或垃圾邮件发送某人电子邮件的密码例如 1000 次等请使用您的幻想当今的网络服务器 Apache
HtmlAgilityPack 获取页面标题和 H1 标签

嘿我正在尝试通过执行以下操作从网页获取页面标题和 H1 标签 doc LoadHtml htmlSourceCode txtTitle Text doc GetElementsByTagName title InnerText txtH1

HtmlAgilityPack 获取页面标题和 H1 标签

HtmlAgilityPack 获取页面标题和 H1 标签 的相关文章

随机推荐

热门标签

HtmlAgilityPack 获取页面标题和 H1 标签的相关文章