使用 html 敏捷包;我如何从完整的 html 文档中提取 html“片段”?就我的目的而言,html“片段”被定义为 html“片段”内的所有内容<body>
tags.
例如:
输入示例:
<html>
<head>
<title>blah</title>
</head>
<body>
<p>My content</p>
</body>
</html>
期望的输出:
<p>My content</p>
理想情况下,如果内容不包含,我想返回未更改的内容<html>
or <body>
元素(例如,假设我首先传递了一个片段,如果它不是完整的 html 文档)
有人能指出我正确的方向吗?
我认为你需要分块做。
您可以对 body 或 html 进行 selectnodes 文档,如下所示
doc.DocumentNode.SelectSingleNode("//body") // returns body with entire contents :)
然后您可以检查条件是否为空值,如果提供了空值,则可以按原样获取字符串。
希望能帮助到你 :)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)