使用 xml.Load 打开 HTML 文档

2024-02-03

我想打开一个 HTML 文档(作为从 Web 上的 StreamReader 检索的字符串), 通过这样创建 XMLDocument:

XmlDocument doc = new XmlDocument

doc.Load(string containing the retrieved document).

但由于 HTML 文档包含这个头:

 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd" > 

它告诉我该文档无效...有什么方法可以解决这个问题吗?


正常的 html,即使它是有效的 html,也不是有效的 xml。

有一个名为 HtmlAgilityPack 的库,它是一个流行的第 3 方开源库,您可以使用它来解决此问题:

  • http://www.google.co.uk/search?q=htmlagilitypack http://www.google.co.uk/search?q=htmlagilitypack
  • 如何使用 HTML 敏捷包 https://stackoverflow.com/questions/846994/how-to-use-html-agility-pack/2588910
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

使用 xml.Load 打开 HTML 文档 的相关文章

随机推荐