XPath 选择全部，但不选择 self::strong 和 self::strong/following-sibling::text()

2024-01-17

所以我有以下示例 html 需要解析。

<div>
    <strong>Title:</strong>
    Sub Editor at NEWS ABC

    <strong>Name:</strong>
    John

    <strong>Where:</strong>
    Everywhere

    <strong>When:</strong>
    Anytime

    <strong>Everything can go down there..</strong>

    Lorem Ipsum blah blah blah....
</div>

我想提取整个 div，但我不希望 Title 和Where 和 When 标题带有以下值。

到目前为止我已经测试了以下 XPath。

a) 没有以下兄弟姐妹（1：不工作。2：工作）

1. //div/node()[not(strong[contains(text(), "Title")])]

2. //div/node()[not(self::strong and contains(text(), "Title"))]

a) 与以下兄弟姐妹（1：不工作。2：不工作）

1. //div/node()[not(strong[contains(text(), "Title")]) and not(strong[contains(text(), "Title")]/following-sibling::text())]

2. //div/node()[not(self::strong and contains(text(), "Title") and following-sibling::text())]

如何实现我所追求的目标？

我认为以下内容符合您想要做的事情 - 它排除了包含标题的强元素及其后面的文本节点。您可以将其扩展以包含您想要排除的其他重要元素：

//div/node()[not(self::strong and contains(text(), "Title") or preceding-sibling::strong[1][contains(text(), "Title")])]

强节点被跳过：

not(self::strong and contains(text(), "Title")

以下文本被跳过：

preceding-sibling::strong[1][contains(text(), "Title")]

请注意，文本节点需要检查其最近的前同级（而不是其后同级）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

xpath

XPath 选择全部，但不选择 self::strong 和 self::strong/following-sibling::text() 的相关文章

只使用 Django 的某些部分？

我喜欢 Django 但对于一个特定的应用程序我只想使用它的一部分但我对 Django 的内部工作原理还不够熟悉所以也许有人可以指出我必须做什么的正确方向查看具体来说我想使用模型和数据库抽象 The 缓存API http doc
XPATH / XSLT：选择父节点的属性与另一个节点的属性匹配的节点

我正在尝试使用 XPath 和 XSLT 对以下 XML 进行转换
如何测试使用 XCom 的 Apache Airflow 任务

我正在尝试找出一种测试 DAG 的方法其中有几个任务使用 XCom 进行通信由于控制台命令只允许我从 DAG 运行任务有没有一种方法可以测试通信而无需通过 UI 运行 DAG Thanks 这是一种对我有用的方法尽管 Airflow
使用 Python 在 Google Cloud Storage 存储桶中创建/上传新文件

如何使用 Python 和可用的客户端库在 Google Cloud Storage 中创建新的空文件或者如何使用 blob 函数 upload from filename 将新文件上传到选定的存储桶要初始化 blob 对象我们应该在
蜘蛛内的Scrapyd jobid值

Scrapy 框架 Scrapyd 服务器我在获取蜘蛛内部的 jobid 值时遇到一些问题将数据发布到后http localhost 6800 schedule json http localhost 6800 schedule jso
Spyder 导入模块出错

我正在尝试在 Spyder 中使用 sklearn 一开始当我尝试导入它时我收到 ImportError No module named sklearn 然后我用 PYTHONPATH 管理器设置 PATH 然后使用工具菜单中的更新模
检测/删除 Python 2 + GTK 中不成对的代理字符

在Python 2 7中我可以成功转换Unicode字符串 abc udc34xyz 转换为 UTF 8 结果是 abc xed xb0 xb4xyz 但是当我将 UTF 8 字符串传递给例如时 pango parse markup or
读取文件特定行号的有效方法。（奖励：Python 手册印刷错误）

我有一个 100 GB 的文本文件它是来自数据库的 BCP 转储当我尝试导入它时BULK INSERT 我在第 219506324 行上收到一个神秘错误在解决此问题之前我想看看这一行但可惜的是我最喜欢的方法 import line
使用 python 只读取 Excel 中的可见行

我想只读取 python 中 Excel 工作表中的可见行输入 Excel表所以当我过滤时作为 python 中的输出在本例中我将仅获得可见数据 1 行这是我的代码 from openpyxl import load workbo
PyCharm 无法识别字典值类型

我有一个简单的代码片段其中我将字典值设置为空列表 new dict for i in range 1 13 new dict i 现在如果在下一行的循环内我会输入new dict i 并添加一个点我希望 PyCharm 向我显示可用于
根据给定列表中的值替换列中的值[重复]

这个问题在这里已经有答案了我在数据框中有一列仅允许定义列表中存在的值例如给定列表 l1 1 2 5 6 如果列表中不存在列中的值我需要将每个值替换为 0 column Expected column 1 1 5 5 2 2 3 0
如何在数据框中绘制包含三列的无向图，形成 3 种不同类型的节点（三方）？

我正在尝试使用三个不同的列表绘制网络的可视化这三个列表形成 3 种类型的节点下面的代码正在运行如图所示需要两个列表用户 ID 评分但是我希望我的图表是三部分的即 user userId review ratings prod
检查多个 pd.DataFrame 是否相等

是否有一种 Pythonic 方式无循环或递归来检查是否超过两个pd DataFrames 例如 pd DataFrames 列表彼此相等吗就像是 all x equals dfs 0 for x in dfs with dfs数据
使用 Python 脚本打开特定文件类型？

如何使 Python 脚本成为特定文件类型例如 foo 的默认应用程序例如当我双击 Finder Explorer 中的文件时我希望该文件在 Python 脚本中打开这可以在 Win 和或 OS X 中实现吗如果重要的话该应
Celery：每个工作人员的 task_acks_late 的不同设置/向 celery 添加自定义选项

这个问题是后续问题django celery 禁用一个工作者的预取有错误吗 https stackoverflow com questions 58290045 django celery disable prefetch for one
Python：帮助（numpy）在退出时导致段错误

我遇到了一个奇怪的现象在 python 解释器中我执行以下操作 gt gt gt import numpy gt gt gt help numpy 帮助显示正确但一旦我按 q 返回解释器 Segmentation fault core
如何限制scrapy请求对象？

所以我有一个蜘蛛我认为它正在泄漏内存结果当我检查 telnet 控制台 gt gt gt prefs 时它只是从链接丰富的页面中抓取了太多链接有时它会超过 100 000 个现在我已经一遍又一遍地浏览文档和谷歌但我找不到一种方法
如何配置 Eclipse 在使用 Pydev 插件选择“运行”或“调试”时启动浏览器

我正在使用 Eclipse Pydev 插件学习 Python 和 Django 当我按运行或调试时我希望内部或外部浏览器使用 URL http 127 0 0 1 启动或刷新我见过用 PHP 插件完成的但没有用 Pydev
Matplotlib 中的 TwoSlopeNorm 未按预期工作

我正在尝试创建一个具有发散颜色图的绘图该颜色图在零附近不对称 In this https stackoverflow com a 20146989 6288682例如 DivergingNorm函数被使用并产生我想要的然而我使用的是更
通过 ManyToManyField = Value 对 django 查询集进行排序

如果有一些模型例如 class Tag models Model name models CharField class Thing models Model title models CharField tags models Many

随机推荐

如何在 pandas DataFrame 中允许重复的列名

我有一个数据框我想更新该数据框的列名称列名有重复的条目下面的代码给出错误无法从重复的轴重新索引 list alpha beta gamma alpha df pd DataFrame datframe columns list No
Spotify 最新更新：Autohotkeys 脚本损坏

我曾经使用 AutoHotKey 脚本作为 Spotify 快捷方式内置快捷方式有限只有在应用程序处于焦点状态时才有效我通常在工作时将其保留在后台不管怎样它之前已经更新了一百万次了没有任何问题但是我下载了最新的 Spotify
AVAssetExportSession 卡住（未启动）导出

我尝试从照片库导出视频但导出回调从未执行我定期检查导出进度进度始终为零下面的代码在 99 9 的情况下都有效但有时在某些设备上绝对随机它会停止工作只有重新启动 iPhone 才有帮助 AVAssetExportSession
为什么这封邮件会直接进入垃圾邮件箱？

我正在使用以下脚本发送邮件但这总是最终进入垃圾邮件文件夹为什么您在发送邮件时必须使用标头以证明邮件是来自真实来源而不是机器人尝试这个
使用 CQRS 在 DDD 中进行命令验证

我正在学习 DDD 并利用 CQRS 模式我不明白如何在不从数据存储中读取的情况下验证命令处理程序中的业务规则例如克里斯想给阿什利一件礼物该命令可能是 GiveGiftCommand 我什么时候才能验证克里斯确实拥有他想要赠送的礼物
PHP 购物车中买一送半价总计

我正在用 PHP 创建一个购物车其中一个特定的商品是买一送一半价当用户购买该商品时我希望从总数中扣除报价但我坚持如何从数学上做到这一点到目前为止我在 if 循环中从数据库获取数据有类似的内容 total total arrayc
内嵌显示单选按钮列表

我的页面上有一些广播列表我面临的问题是单选按钮的文本没有显示在单选按钮的内联中我已将重复布局放入表和流中但两者都不起作用我尝试添加一种显示样式内联但这也不起作用尽管它在复选框上起作用并且我认为也许它在这里也起作用这只是一个
增强 Jquery 拖放演示

我有一个非常匹配的要求这个 Jquery 演示 http jqueryui com demos droppable shopping cart 这是一个简单的购物车演示基本上我需要对该演示进行两项增强我需要文本输入以及可用的产品因此
BizTalk 内部和外部架构

我在网上读到您将外部模式与内部模式分开并且永远不要将内部模式暴露给任何外部参与者如果我的解决方案仅充当消息总线来在两个现有系统之间创建松散耦合我真的需要任何内部模式吗 System A makes a Request
无法验证 Google 访问令牌（段数错误）

我有非常简单的代码直接来自 Google 网站 https developers google com identity sign in web backend auth using a google api client library
将执行动态查询的结果插入表中

我有一个动态查询 strQuery执行时会产生包含很多列的结果我想将此动态查询的结果插入到临时表中我这样做是因为我想对临时表执行一些过滤并获得所需的结果之前的帖子也问过类似的问题HERE https stackoverflow com
FileSystemWatcher 一段时间后停止引发事件

我们构建了一个窗口服务来监听文件夹FileSystemWatcher 创建后我们处理文件等等但几天后该活动停止工作它有可能被垃圾收集器 GC 收集吗 GC 是否收集它的持有类这是一个单例我应该使用弱事件吗我是否存在导致事件未注册的
如何检测grails中渲染了哪个视图文件

我必须知道grails 渲染时的视图文件一种方法是过滤器中的 grails afterView 操作在这里我找不到一种方法来知道哪个视图文件已被渲染那么有没有什么方法可以让我知道哪个视图文件已被渲染方法渲染这不太漂亮但在大多数
从 Word 中提取嵌入的 Excel 工作表数据

我有一批嵌入了 Excel 工作表的 Word 文档用户通过双击工作表图像并打开嵌入的 Excel 对象在 Excel 工作表中输入数据我需要获取用户输入的数据下面是 WORD VBA 其中引用了 Microsoft Excel 15
预编译方面的语句与准备语句

我理解使用Statement和PreparedStatement之间的主要区别 PreparedStatements允许传入参数但我读到了两者之间的细微差别即PreparedStatement 可以比通用语句更快因为PreparedS
使用对象的浅拷贝时出现双重释放错误...如何修复？

如何从浅复制对象与原始对象中删除双重删除错误一个简单的例子 class INT int p dynamic define here fancy constructors etc set int i p new int p i INT
基于 WPF 和 MVVM 模式中的嵌套模型实体构建 ViewModel

我在理解如何基于以下模型构建视图模型时遇到问题我简化了模型以便更清晰 public class Hit public bool On get set public Track Track get set public class Trac
使用 docker link 时拒绝连接到 RabbitMQ

我有一个微服务应用程序它有两个服务和一个用作它们之间通信的消息队列的rabbit mq 现在我想将它们部署在docker上我在以下代码中docker compose yml file 版本 3 服务 rabbitmq build Ra
将自定义格式化程序类与 Python 的logging.config 模块结合使用

我有以下日志记录类当在代码中指定为格式化程序时它可以正常工作它通过在要记录的消息的开头添加一个字符串来扩展现有的格式化程序以帮助显示消息的重要性我不只是使用 levelname s在格式字符串中因为我不想显示 DEBUG 或 I
XPath 选择全部，但不选择 self::strong 和 self::strong/following-sibling::text()

所以我有以下示例 html 需要解析 div strong Title strong Sub Editor at NEWS ABC strong Name strong John strong Where strong Everywhere

XPath 选择全部，但不选择 self::strong 和 self::strong/following-sibling::text()

XPath 选择全部，但不选择 self::strong 和 self::strong/following-sibling::text() 的相关文章

随机推荐

热门标签