string()
在我试图从中提取文本的某个网页上效果很好。
具有类似的结构。对于 bing,我尝试过的 xpath 是
string(//h3/a)
即使有强标签等,它也能很好地获取搜索结果,但只返回第一个结果。有没有类似 strings() 的东西,这样我就可以获得每个的全文
//h3/a
result?
有没有类似 strings() 的东西,这样我就可以获得每个的全文
//h3/a
result?
不,XPath 1.0 中没有.
来自W3C XPath 1.0 规范 http://www.w3.org/TR/xpath/#function-string(关于XPath 1.0的唯一规范性文档):
“功能:字符串字符串(对象?)
string 函数将对象转换为字符串,如下所示:
通过返回以下字符串值将节点集转换为字符串
节点集中按文档顺序位于第一个的节点。”
因此,如果您只有一个可用的 XPath 1.0 引擎,则需要选择所有的节点集//h3/a
元素,然后使用托管 XPath 的编程语言,迭代每个节点并分别获取其字符串值。
在 XPath 2.0 中使用:
//h3/a/string()
计算此 XPath 2.0 表达式的结果是一个字符串序列,其中每个字符串都是其中一个的字符串值//h3/a
元素。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)