用于选择前面元素以及可选的纯空白文本节点的 XPath

2023-12-20

给定一个元素作为上下文，我想选择前面的同级元素并检查它是否具有特定名称。需要注意的是，如果存在包含非空白内容的中间文本节点，我不想选择它。

例如，给定这个 XML 文档...

<r>
  <a>a1</a><a>a2</a>
   b
  <a>a3</a>
    <a>a4</a>
  <b/>
  <a>a5</a>
</r>

…then:

对于“a1”应该没有匹配项（没有<a>紧邻其前面的兄弟元素）
对于“a2”，则应匹配“a1”（没有中间文本节点）
对于“a3”应该没有匹配项（中间有一个包含非空白内容的文本节点）
对于“a4”，则应匹配“a3”（中间的文本节点仅为空格）
对于“a5”，不应有匹配项（前面的同级元素不是<a>).

我可以检查前面的兄弟是否是<a> with preceding-sibling::*[1][name()="a"]

但是，我不知道怎么说“选择以下同级节点，无论元素或文本性如何，然后看看它是否不是文本或normalize-space(.)=""。我最好的猜测是：

preceding-sibling::*[1][name()="a"][following-sibling::node()[1][not(text()) or normalize-space(.)=""]]

……但这似乎没有效果。

这是我的测试 Ruby 文件：

require 'nokogiri'

xpath = 'preceding-sibling::*[1][name()="a"][following-sibling::node()[1][not(text()) or normalize-space(.)=""]]'
fragment = Nokogiri::XML.fragment '<a>a1</a><a>a2</a> b <a>a3</a> <a>a4</a> <b/> <a>a5</a>'    

fragment.css('a').each{ |a| p [a.text,a.xpath(xpath).to_s] }
#=> ["a1", ""]
#=> ["a2", ""]
#=> ["a3", "<a>a2</a>"]
#=> ["a4", "<a>a3</a>"]
#=> ["a5", ""]

“a2”和“a3”的结果是错误的并且让我感到困惑。它找到前面的<a>正确，但随后无法正确验证其第一个后续兄弟是否不是文本（这应该允许“a2”找到“a1”）或者它只是空白（这应该阻止“a3”找到“a2” ”。

Edit：这是我正在编写的 XPath，以及我想要它做什么：

preceding-sibling::*[1][name()="a"]…- 找到第一个前面的元素，并确保它是一个<a>. 这似乎正在按预期工作。
- [following-sibling::node()[1][…]]- 确保第一个后续节点（找到的前面的<a>) 匹配一些条件
  - not(text()) or normalize-space(.)=""- 确保以下节点不是文本节点，或者其规范化空间为空

Use:

/*/a/preceding-sibling::node()
       [not(self::text()[not(normalize-space())])]
            [1]
              [self::a]

基于 XSLT 的验证：

<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
 <xsl:output omit-xml-declaration="yes" indent="yes"/>

 <xsl:template match="/">
     <xsl:copy-of select=
       "/*/a
          /preceding-sibling::node()
                      [not(self::text()[not(normalize-space())])]
                                        [1]
                                         [self::a]
    "/>
 </xsl:template>
</xsl:stylesheet>

当此转换应用于提供的 XML 文档时：

<r>
  <a>a1</a><a>a2</a>
   b
  <a>a3</a>
    <a>a4</a>
  <b/>
  <a>a5</a>
</r>

对 XPath 表达式进行求值，并将此求值选择的节点复制到输出:

<a>a1</a>
<a>a3</a>

Update:

问题中的 XPath 表达式有什么问题？

问题就在这里:

[not(text()) or normalize-space(.)='']

这测试上下文节点是否没有文本节点child.

但是OP想要测试上下文节点是否is一个文本节点。

Solution:

将上面的内容替换为:

[not(self::text()) or normalize-space(.)='']

基于XSLT的验证:

<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
 <xsl:output omit-xml-declaration="yes" indent="yes"/>
 <xsl:strip-space elements="*"/>

 <xsl:template match="/*/a">
     <xsl:copy-of select=
     "preceding-sibling::*[1]
                      [name()='a']
                         [following-sibling::node()[1]
                                    [not(self::text()) or normalize-space(.)='']
                       ]"/>
 </xsl:template>
 <xsl:template match="text()"/>
</xsl:stylesheet>

现在这个转换正好产生了想要的结果：

<a>a1</a>
<a>a3</a>

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

ruby

xpath

nokogiri

用于选择前面元素以及可选的纯空白文本节点的 XPath 的相关文章

帮助重构这个讨厌的 Ruby if/else 语句

所以我有这个大而多毛的 if else 语句我将跟踪号码传递给它然后它确定它是什么类型的跟踪号码我怎样才能简化这件事具体来说就是想减少代码行数 if num length lt 8 tracking service false el
用于从链接中选择文本的 xpath 表达式

我有这样的html文件内容 a class bf title Link to book href book 229920 book name a 帮我构造 xpath 表达式来获取链接文本书名我尝试使用 a 但表达式计算时没有结果如果
Rails3 SQL 日志记录输出在单独的文件中

我希望将所有 ActiveRecord SQL 日志记录重定向到不同的文件中将其放在控制台或 log development log 中有点混乱怎么做我希望将其放在 log development sql log 文件中 Thanks
检查数组元素的大小是否相同

有没有最好最有效的方法来检查数组元素的大小是否相同 1 2 3 4 5 gt false 1 2 3 4 5 6 gt true 我有什么 def element of same size arr arr map size uniq si
与 Array 相比，使用 Ruby NArray 有哪些优点？

我刚刚遇到了 Ruby 的 NArray 库请原谅我在问这个问题时的无知与标准 Ruby Array 实现相比使用 NArray 库有哪些优点我已经看到 NArray 是面向数值计算的但是看看 API 看起来好像只有一些针对数值的
Ruby，通过 SSH 和 LOG 逐一运行 linux 命令

我想用 Ruby 女巫 net ssh 编写代码在远程 Linux 机器上一一运行命令并记录所有内容在 Linux 机器上称为命令 stdout 和 stderr 所以我写函数 def rs ssh cmds cmds each do
是否可以在 proc 中查看 ruby 代码？

p Proc new puts ok 是否可以在过程中看到 ruby 代码 inspect返回内存位置 puts p inspect
Ruby on Rails 中的枚举

我是一名 C 程序员我正在研究 ruby on Rails 但我可能在心态或其他方面遇到了一些麻烦我有一个投票对象该对象可以是赞成中立或反对我通常会让投票对象有一个像这样的字段 private VoteEnum voteEnum
如何清除 ruby 中 rspec 测试之间的类变量

我有以下课程我想确保类 url 只为所有实例设置一次 class DataFactory url nil def initialize begin if url nil Rails logger debug Setting url url
Rails 5.2 Active Storage 添加自定义属性

我有一个带有附件的模型 class Project lt ApplicationRecord has many attached images end 当我附加并保存图像时我还想保存一个附加的自定义属性 display order 整数
如何防止 .NET 中的 XPath/XML 注入

如何防止 NET Framework 中的 XPATH 注入我们之前使用字符串连接来构建 XPATH 语句但发现最终用户可以执行一些任意 XPATH 例如 string queryValue pages url USER INPUT V
为 .API 文件启用自动完成功能？

有谁知道如何使用 N 站点上提供的 API 文件在 Notepad 中自动完成工作在 API 文件夹中具有 XML 自动完成文件的语言中自动完成功能工作得很好但对于使用 API 文件的语言 ruby AutoIt 等完全不起作用根
在所有延迟的作业之前挂钩

是否可以在所有delayed job任务之前运行一个方法基本上我们试图确保每台运行delayed job的服务器都有我们代码的最新实例因此我们希望运行一个方法来在每个作业运行之前检查这一点我们已经有了 check 方法并在其他地方使
如何使用 minitest 运行所有测试？

我下载了一个项目的源代码发现了一个错误并修复了它现在我想运行测试来看看我是否破坏了任何东西测试是在 minitest DSL 中进行的我如何同时运行它们我搜索了适用的 rake 任务等但没有找到这是一个链接耙子测试任务 ht
如何在 Rails 3 中连接表并计算记录数？

我有一个Collection有很多硬币的类我正在尝试选择拥有两枚以上硬币的收藏品目前我可以直接通过 Ruby 来完成此操作但效率极低我当前的代码 collections Collection all select c c coin
如何使用define_method创建类方法？

如果您尝试以元编程方式创建类方法这非常有用 def self create methods method name To create instance methods define method method name do end T
如何阻止“gem”实用程序访问我的主目录？

当我跑步时 gem install
xQuery LIKE 运算符？

有没有办法以与 SQL 相同的方式使用 XQuery 执行 LIKE 操作我不想构造一些 startswith endswith 和 contains 表达式我想要实现的目标的示例 for x in user where x first
Rails 3：用户创建自定义表单？

我正在尝试思考如何允许用户创建具有所有字段类型的自定义表单如果有一颗宝石那就太好了但我似乎无法在任何地方找到它所以我有一个像这样的数据库设置 t integer form id t string name t string hint
为什么每个方法需要将其循环的值分配给变量？

在 Rails 上工作发现我对 Rails 的理解缺乏知识each method 不知道为什么each方法需要变量 message h2 h2 不确定为什么每个方法都需要变量 message 事实并非如此require它你完全可以忽略它

随机推荐

将 pthread 变量保留为本地变量

使用时有没有办法pthread h在 Linux GCC 上将变量保留为线程函数的本地变量 int i 42 global instance of i int main pthread t threads 2 long t pthread
itunesconnect iPhone 应用程序状态 - 无效的二进制文件

每当我将应用程序提交到 itunesconnect 时大约 10 分钟后状态就会更改为无效的二进制文件并且完全没有解释原因我到处寻找答案但没有我什至重新安装了 XCode 和 App loader 请注意应用程序加载器不会给
ReactJS：如何将react-select包装在redux-form字段中？

我正在研究react select图书馆并面临一些问题我正在使用redux form库和导入
Scanf for double 在 Dev C++ 中不起作用

我在处理浮点数时遇到问题我认为这里有些东西发生冲突输出是我的代码 include
防止 UICollectionView 中的项目“包装”

我需要一个UICollectionView显示宽度和高度可能大于可见框架的网格同时保持行和列的完整性默认UICollectionViewFlowLayout allows sections滚动到屏幕外但它将项目包装在一个部分中以将它们
如何基于自己的 Equal 类消除流中的重复条目

我确实有类似的问题比如描述性的here https stackoverflow com questions 6680157 how to remove duplicate objects in a listmyobject without
HTML 表单上的多个提交按钮 - 将一个按钮指定为默认按钮 [重复]

这个问题在这里已经有答案了我有一个包含三个提交按钮的表单如下所示
如何在 SQL Server 中增加（或保留）IDENTITY 值而不插入表

有没有办法保留或跳过或增加标识列的值我有两个表以一对一的关系连接第一个具有 IDENTITY PK 列第二个具有 int PK 不是 IDENTITY 我以前先插入获取ID 然后插入第二个而且工作正常现在我需要在第二个表中插入值
从包含树状数据的 DataTable 或 List 填充 TreeView

我在数据库中创建了一个帐户表其中包含以下列 ID Name ParentID 这是记录如何存储的示例 ID Name ParentID 1 BANK A 0 2 0001 1 3 0002 1 4 BANK B 0 5 0001 4 6
当非只读类已经存在时的只读类设计

我有一个类在构造时从数据库加载它的信息这些信息都是可修改的然后开发人员可以对其调用 Save 来将该信息保存回数据库我还创建了一个将从数据库加载的类但不允许对其进行任何更新只读版本我的问题是我应该创建一个单独的类并继承还
prometheus的HTTP请求中添加自定义标头

Prometheus 发送 HTTP 请求来获取监控值我的自定义导出支持各种客户端以监视系统状态有一个通用的 REST API 可以获取监视器列表 api v1 monitor find 输出结果取决于 header 中的 Accep
将 PATH 添加到 RStudio 的路径

我在 MacOS 上运行 RStudio 需要使用一些自定义命令行工具例如csvcut 部分csvkit 对于我们团队中的多人将在他们的机器上使用的功能如果我运行一个system pip install csvcut 我使用这个命令作为
DDD – 如何针对数据库实施验证

我正在努力解决一个基本问题该项目是用 C 编写的但问题很普遍我遵循始终有效的对象原则作为一个示例我有一个具有强制属性 ProductCategory 的产品实体允许的产品类别是用户定义的因此会保留在数据库中为了类型安全和更
在 State monad 中混合和匹配有状态计算

我的程序的状态由三个值组成 a b and c 类型A B and C 不同的功能需要访问不同的值我想使用编写函数Statemonad 以便每个函数只能访问它需要访问的状态部分我有以下类型的四个函数 f State A B C x g
在 Chrome 上将 100MB 以上的文件发送到 S3 时内存崩溃

我目前正在使用 Javascript 将一些视频文件上传到 S3 该过程适用于 should正在做multipart form data在后台代码片段 let upload new AWS S3 ManagedUpload params
Wicked gem Rails - 如何创建新对象

The 逐步构建部分对象 https github com schneems wicked wiki Building Partial Objects Step by StepWicked Gem Wiki 上的页面解释了如何逐步创建对象w
使用 Google Authenticator 进行双因素身份验证 - 手动输入密钥而不是扫描二维码

在 Google Authenticator 应用中您可以扫描二维码或手动输入颁发者提供的密钥在下面的屏幕截图中您可以看到Google安全设置中2FA的设置显示了如何按照第二种方法获取TOTP 我的问题是这个密钥是如何生成的我正
如何在 Heroku 中使用 Laravel4 的 php artisan migrate 命令？

我正在起诉 Heroku 开发计划使用创建数据库PostgreSQL 数据库是在 Heroku 中创建的运行 heroku pg info 命令后 heroku pg info HEROKU POSTGRESQL XXX URL Plan
为什么这个 verilog 关系语句返回 true？

我有一条名为 sin hall2 的 9 位签名线该语句返回 true sin hall2 8 0 gt 9 d1 当我查看模拟时 sin hall2 169 我假设这是 verilog 处理比较负数的方式但我做错了什么当我执行 si
用于选择前面元素以及可选的纯空白文本节点的 XPath

给定一个元素作为上下文我想选择前面的同级元素并检查它是否具有特定名称需要注意的是如果存在包含非空白内容的中间文本节点我不想选择它例如给定这个 XML 文档

用于选择前面元素以及可选的纯空白文本节点的 XPath

用于选择前面元素以及可选的纯空白文本节点的 XPath 的相关文章

随机推荐

热门标签