我想打开一个 HTML 文档(作为从 Web 上的 StreamReader 检索的字符串),
通过这样创建 XMLDocument:
XmlDocument doc = new XmlDocument
doc.Load(string containing the retrieved document).
但由于 HTML 文档包含这个头:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd" >
它告诉我该文档无效...有什么方法可以解决这个问题吗?
正常的 html,即使它是有效的 html,也不是有效的 xml。
有一个名为 HtmlAgilityPack 的库,它是一个流行的第 3 方开源库,您可以使用它来解决此问题:
- http://www.google.co.uk/search?q=htmlagilitypack http://www.google.co.uk/search?q=htmlagilitypack
- 如何使用 HTML 敏捷包 https://stackoverflow.com/questions/846994/how-to-use-html-agility-pack/2588910
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)