我有以下 HTML 字符串:
<a href="/tothepage" title="the page">The Link</a>.
如何轻松从 HTML 片段中提取标题?首选正则表达式或其他 VB.NET 解决方案,但 C# 也可以。
我想要“页面”而不是链接文本:我想要标题属性的值。
如果使用 HTMLAgilityPack 很容易做到这一点,我已经安装了。
由于您已经有了 HtmlAgilityPack,您可以像这样提取“title”属性:
Option Infer On
Option Strict On
Imports HtmlAgilityPack
Module Module1
Sub Main()
Dim a = "<a href=""/tothepage"" title=""the page"">The Link</a>."
Dim doc As New HtmlDocument()
doc.LoadHtml(a)
Dim node = doc.DocumentNode.SelectSingleNode("/a")
Dim title = node?.Attributes("title")?.Value
Console.WriteLine(title) ' outputs "the page"
Console.ReadLine()
End Sub
End Module
当然,您不需要那么多行代码,因为这是一个完整的工作示例。
The ?.
部件可以防止它抛出错误,如果node
is Nothing(在这种情况下,如果没有“”元素),并防止它在没有“title”属性时抛出错误。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)