如何使用 Nokogiri 获取某些标签之后或之前的文本

2024-05-13

我有一个 HTML 文档，如下所示：

<root><template>title</template>
<h level="3" i="3">Something</h>
<template element="1"><title>test</title></template>
# one
# two
# three
# four
<h level="4" i="5">something1</h>
some random test
<template element="1"><title>test</title></template>
# first
# second
# third
# fourth
<template element="2"><title>testing</title></template>

我想提取：

# one
# two 
# three
# four
# first
# second
# third
# fourth
</root>

换句话说，我想要“之后的所有文本<template element="1"><title>test</title></template>以及在那之后开始的下一个标签之前。”

我可以使用 root 之间的所有文本'//root/text()'但如何获取某些标签之前和之后的所有文本？

这似乎有效：

require 'nokogiri'

xml = '<root>
    <template>title</template>
    <h level="3" i="3">Something</h>
    <template element="1">
        <title>test</title>
    </template>
    # one
    # two
    # three
    # four
    <h level="4" i="5">something1</h>
    some random test
    <template element="1">
        <title>test</title>
    </template>
    # first
    # second
    # third
    # fourth
    <template element="2">
        <title>testing</title>
    </template>
</root>
'

doc = Nokogiri::XML(xml)
text = (doc / 'template[@element="1"]').map{ |n| n.next_sibling.text.strip.gsub(/\n  +/, "\n") }
puts text
# >> # one
# >> # two
# >> # three
# >> # four
# >> # first
# >> # second
# >> # third
# >> # fourth

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

ruby

nokogiri

如何使用 Nokogiri 获取某些标签之后或之前的文本的相关文章

缓存日期早于 1900 年的模型时出现编组错误

我有一些具有 published on 属性的活动记录模型当我尝试缓存 Publication on 日期早于 1900 年 1 月 1 日的模型时出现如下错误 Marshalling error for key popular pro
在 Ruby 文档中哪里可以找到字符串转义序列？

我可以在中找到有关 Ruby 转义序列的详细信息红宝石弦 http www tutorialspoint com ruby ruby strings htm and 转义序列 http en wikibooks org wiki Rub
在 ruby 中卸载动态声明的类

我有一个使用 theClass class eval 和 Object const set className theClass 定义的类有什么办法可以删除这个类的定义吗在测试过程中我需要加载同一类的不同版本 Object send
具有预加载功能的 ActiveRecord::Calculations 是否会进行多个数据库查询？

我的困惑源于这个问题 https stackoverflow com q 19462024 1860929 其中 OP 的模型如下 class Quote lt ActiveRecord Base has many items def ca
拆分字符串而不删除分隔符

我需要解析一个文件以获取单个 SQL 语句并从 Rails 控制器运行它们我有以下代码 sql file RAILS ROOT lib evidence interface import sql sql stmts array File
正则表达式匹配组，但组成员除外

因此有许多正则表达式可以匹配特定的组如下所示 Any character except a newline m Any character the m modifier enables multiline mode w A word c
如何在 Rails 模型中获取 request.uri？

request request 当我在控制器中写这个时它就会起作用但是如果我在模型或应用程序控制器中需要这个变量我该怎么办模型存在于 Web 请求的上下文之外您可以在 irb 中实例化它们可以在延迟作业或脚本等中实例化它们如果
YAML 每个缩进有多少个空格？

如果我在每个缩进级别使用一个空格两个或四个空格有什么区别吗 YAML 每个结构类型的空间数量有什么具体规则吗例如4嵌套空间maps 1每空间项目清单 etc 我正在为 elastic beanstalk ebextensions 编写
Ruby on Rails：如何使用 JSONPath 访问（并保存到数据库）JSON 数组中的嵌套对象/属性？

我正在尝试将 JSON 对象数组中的数据播种到我的数据库中我有两个单独的数据库表属性和单位一个属性有许多单位我已经能够通过 API 请求 JSON 数据然后将其播种到数据库成功地对属性信息属性模型执行此操作但是 Valua
安装 gem 失败并出现权限错误[重复]

这个问题在这里已经有答案了我昨天将 Mac 操作系统更新至 10 9 Mavericks 我当前的 Ruby 版本显示为 ruby 2 0 0p247 2013 06 27 修订版 41674 universal x86 64 darwi
未定义符号：尝试运行瘦网络服务器时的 SSLv2_method

我已经用 rvm 安装了 OpenSSL rvm pkg install openssl 然后做了rvm reinstall 1 9 3 with openssl dir rvm path usr 当我尝试运行瘦网络服务器时出现以下错误
rvm + Rails3 + gmaps4rails -acts_as_gmappable

我是一个红宝石导轨之类的菜鸟抱歉如果我的问题很愚蠢我设置了一个运行 ruby 1 8 7 p334 的 rvm 作为用户环境我已经为我的应用程序创建了一个 gemset 现在我想在页面上显示地址的地图我四处寻找发现了 gm
使用 PayPal REST API，如何取消付款？

使用 PayPal REST API 在客户点击取消订单并返回网站链接后我似乎无法弄清楚如何取消付款也许在生产模式下 PayPal 会自动取消这些付款但在沙盒模式下它们似乎仍处于已创建状态这一观察结果使我相信我需要在返回网
寻找在 Ruby on Rails 中构建安全 REST API 的建议

我正开始为我正在从事的项目构建 REST API 这促使我对使用 RoR 构建 API 的最佳方法进行了一些研究我很快发现默认情况下模型是向世界开放的只需在 URL 末尾添加 xml 并传递适当的参数即可通过 URL 进行调用那么
ExecJS::Runtime在 Rails 4.1.4 中不可用

UPDATE 现在一切正常了谢谢deep https stackoverflow com users 2300000 deep 我安装了 node js 然后得到了一个 TZInfo DataSourceNotFound 错误通过添加解
“Dir.entries”中的排序顺序

是否有固定默认的排序顺序Dir entries返回结果根据经验我知道前两个条目是 and 根据 Ruby 语言文档 Dir entries http ruby doc org core classes Dir html M000607不
我应该在 Heroku 上部署 Ruby on Rails 应用程序吗？

Closed 这个问题是基于意见的 help closed questions 目前不接受答案关于我自己的一些情况我今年 24 岁去年从北卡罗来纳州立大学毕业获得了分析硕士学位统计数学之类的我没有很强的编程背景这对我的问题非
需要帮助设置 ruby on Rails javascript 运行时环境

我在我的机器上设置 ruby on Rails 时遇到问题我一直在关注 Agile Web Development with Rails 这本书到目前为止一切都进展顺利我遇到的问题是当我输入时 rails server 我收到以下错误
Rails：RSpec - nil:NilClass 的未定义方法“cookie_jar”

铁轨新手尝试遵循迈克尔哈特尔的教程尝试添加辅助方法来模拟 RSpec 测试中的日志时陷入困境 describe when the a user has logged in and attempts to visit the page
为什么机架响应主体是数组而不是字符串？

他们的文档中的一个经典的 hello world 示例 class HelloWorld def call env return 200 Hello world end end 我的问题是为什么第三个值是 Hello world 而不是 H

随机推荐

PHP上传问题

我使用了一些脚本来开始在我的开发计算机上上传文件问题是尽管此操作预期很容易但每当我尝试上传图像时 Apache 似乎都会超时上传设置为On和tmp目录设置在php ini 我尝试上传主要内容gif来自谷歌一个8 36KB图像它应
grails 中的 log4j：如何登录文件？

我的 grails config groovy 中有这个 log4j 配置 log4j error org codehaus groovy grails web servlet controllers org codehaus groovy
尽管 Matplotlib FuncAnimation(...,repeat=False) 保存的动画图不断循环

我想使用制作动画matplotlib进行 Powerpoint 演示动画应该只播放一次在我的代码中参数repeat of FuncAnimation 被设置为 false 因为我需要将图导入到powerpoint中所以我使用保存它a
如何解决 FireBase 数据库 Key 中的禁止字符或解决方法

我有这个 FireBase 数据库结构我真的很想拥有像这个例子这样的密钥 US name United States PATH TO STREETS US California Orange County Orange 3138 E Ma
Swift - 必须由子类覆盖的类方法

是否有一种标准方法可以在 Swift 中创建纯虚函数即一个must被每个子类覆盖如果不是会导致编译时错误您有两个选择 1 使用协议将超类定义为协议而不是类 Pro 编译时检查每个子类不是实际的子类是否实现了所需的方法 C
将程序存储在 phpMyAdmin 中

我必须将存储过程添加到 MySQL 数据库问题是托管提供php我的管理员来管理数据库我在网上搜索了一下想法是运行创建程序的MySQL本机语句但由于程序的代码通常可能有我们必须更改 MySQL 中的分隔符 php我的管理员没有这个选
此列表分配如何进行？

我看过这个代码示例它看起来像是将一个数组初始值设定项分配给一个列表我以为它不会工作但不知何故它编译了不是数组初始值设定项吗 Children 的类型为 IList 如果大括号前没有新列表它如何工作 var nameLayout
使用 Microsoft REST API - Java 将 Xbox-Live GamerTag 转换为 XUID

我有一个 Java 应用程序它需要能够获取用户输入的 Minecraft Bedrock Edition 玩家标签并将其转换为给定帐户的 XUID 以便我可以将其存储起来以供稍后列入白名单和参考目的我一直在浏览 Microsoft R
如何在带有预编译头的项目中使用google protobuf

我有一个包含多个项目的解决方案我的项目但不是全部使用预编译头我决定使用 protobuf 但遇到了一个问题在 protoc exe 从 proto 生成 pb h 后我尝试包含标头并收到错误预编译标头未包含在 pb h 中我
Mockito mockStatic 无法解析符号

我正在使用 Spring Boot 并在单元测试中我试图模拟Files delete myFile toPath method 为此我尝试使用Mockito mockStatic 方法但是当我尝试使用它时我的 IDE Intelli
在 Java 中生成 LaTeX 输出 [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案是否有用于从 Java 生成 LaTeX 输出的 Java 库渲染乳胶 JLatex数学 https
如何在 perl 程序中查找打开的全局文件句柄

我刚刚发现一个问题我必须关闭所有打开的文件句柄才能让我的 Apache cgi 脚本继续我将问题追溯到 Parse RecDescent usr bin env perl use strict use warnings use feat
R dplyr过滤多列上的字符串条件

我有一个 df 例如 df lt read table text v1 v2 v3 v4 v5 1 A B X C 2 A B C X 3 A C C C 4 B D V A 5 B Z Z D header T 如果变量 v2 到 v5
Android 拖放 ACTION_DRAG_ENDED 未触发

我真的很花时间解决这个问题到目前为止找不到任何有相关经验的朋友这是我发布第一个应用程序之前的最后一个功能所以在结局即将到来的情况下陷入困境让我发疯如果我将对象放在可接受的区域中我的拖放效果会非常好但是如果拖放到其他地方我不会
C++11 / VS2010：返回不可复制但可移动对象的容器

考虑以下代码 include
如何使用firebase规则检查用户组数组和记录组数组是否相交

我在 firebase 中有一个记录列表其中有一个包含零个或多个组的组属性我还有 firebase auth 对象它也有零个或多个组我想为我的记录设置一个 read firebase 规则该规则将检查两个列表中是否至少存在一个组
Python Raspberry pi - 如果路径不存在，则跳过循环

我有一个收集温度文本文件中的值的功能它使用部分预定义的路径但是有时如果温度传感器未加载断开连接则路径不存在如果路径不可用如何设置条件或例外来跳过循环我想使用 continue 但我不知道要设置什么条件 def read
从 datagridview 选定的行更新 mysql 数据库

我有一个 datagridview 它在表单加载事件上加载 mysql 数据库表 t pi clients 并且我有另一个选项卡其中包含 t pi client 相应列的文本框它能够从 fullrowselect 模式获取数据到这些文本
如何在 Angular2 中为表单分配和验证数组

我的模型 this profile 在 javascript 中有一个属性叫做emails 这是一个数组 email isDefault status 然后我将其定义如下 this profileForm this formBuilder
如何使用 Nokogiri 获取某些标签之后或之前的文本

我有一个 HTML 文档如下所示

如何使用 Nokogiri 获取某些标签之后或之前的文本

如何使用 Nokogiri 获取某些标签之后或之前的文本 的相关文章

随机推荐

热门标签

如何使用 Nokogiri 获取某些标签之后或之前的文本的相关文章