这是我的简化 HTML:
<html>
<body>
<div id="mainDiv">
<div id="divToRemove"></div>
<div id="divToKeep"></div>
<div class="divToRemove"></div>
<div class="divToRemove"></div>
</div>
</body>
</html>
我想删除 ID 或类名为“divToRemove”的 div
然后我只想选择名为“mainDiv”的 div(在 HtmlNode 中)。
结果应该是:
<div id="mainDiv">
<div id="divToKeep"></div>
</div>
我如何使用 Html Agility Pack 来做到这一点?
Thanks!
以下代码改编自此 Html Agility Pack 论坛页面 http://htmlagilitypack.codeplex.com/discussions/248692以满足您的需求。本质上,我们将获取所有 div,然后循环它们并检查它们的类或 id 是否匹配。如果存在,请将其删除。
var divs = htmldoc.DocumentNode.SelectNodes("//div");
if (divs != null)
{
foreach (var tag in divs)
{
if (tag.Attributes["class"] != null && string.Compare(tag.Attributes["class"].Value, "divToRemove", StringComparison.InvariantCultureIgnoreCase) == 0)
{
tag.Remove();
} else if(tag.Attributes["id"] != null && string.Compare(tag.Attributes["id"].Value, "divToRemove", StringComparison.InvariantCultureIgnoreCase) == 0) {
tag.Remove();
}
}
}
您还可以将这些 if 语句组合成一个大的 if 语句,但我认为这对于答案来说读起来更好。
最后,选择您要查找的节点...
var mainDiv = htmldoc.DocumentNode.SelectSingleNode("//div[@id='mainDiv']");
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)