我想获取所有 HTML<p>...</p>
在一个文档中。
Using Regex
使用以下命令查找所有此类字符串:
Regex regex = new Regex(@"\<p\>([^\>]*)\</p\>", RegexOptions.IgnoreCase);
但我无法得到任何结果。我的正则表达式有什么问题吗?
现在,我只想得到介于两者之间的所有内容<p>...</p>
标签并希望为此使用正则表达式,因为源不是 HTML 文档。
不要使用正则表达式解析 HTML https://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454!!!
相反,使用HTML 敏捷包 http://html-agility-pack.net/?z=codeplex.
例如:
var doc = new HtmlDocument();
doc.Load(...);
var pTags = doc.DocumentNode.Descendants("p");
EDIT:即使文档实际上不是 HTML,您也可以执行此操作。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)