lxml find
with id='post-[0-9]*' [重复]

2024-04-02

我试图找到所有 id 以“post-{这里有很多数字}”开头的 div 标签我尝试过这样的事情：

tree.xpath("//div[starts-with(@id,'post-[0-9]')]")

但并没有真正起作用。有没有办法在 python 中不导入正则表达式来做到这一点？

XPath 1.0 http://www.w3.org/TR/xpath不支持正则表达式，即函数starts-with不支持正则表达式。

Lxml 不支持 XPath 2.0。您有以下三个选择：

切换到能够处理 XPath 2.0 的处理器。然后您可以使用fn:匹配() http://www.w3.org/TR/xpath-functions/#func-matches功能。
使用 XPath 1.0 兼容的解决方案。这相当丑陋，但它有效，并且在某些情况下可能是最简单的解决方案。然而，这不是一个通用的解决方案！它将替换中的数字@id with a -并与之匹配。所以如果原来的id是这样的post--。使用您知道不会出现在该位置的字符。



tree.xpath("//div[starts-with(translate(@id, '0123456789', '----------'), 'post--')]")

lxml 支持EXSLT 命名空间 http://www.exslt.org/regexp/functions/test/index.html您可以从那里使用正则表达式函数。我认为这是最好的解决方案。



regexpNS = "http://exslt.org/regular-expressions"
r = tree.xpath("//div[re:test(@id, '^post-[0-9]')]", namespaces={'re': regexpNS})

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

xpath

lxml

lxml find
with id='post-[0-9]*' [重复] 的相关文章

正则表达式，选择最接近的匹配

假设以下单词序列 BLA text text text text text text BLA text text text text LOOK text text text BLA text text BLA 我想做的是将 BLA 中的文本
Pandas 连接问题：列重叠但未指定后缀

我有以下数据框 print df a mukey DI PI 0 100000 35 14 1 1000005 44 14 2 1000006 44 14 3 1000007 43 13 4 1000008 43 13 print df b
使用多级解决方案计算二维网格中的最近邻

我有一个问题在 x y 大小的网格中我提供了一个点并且我需要找到最近的邻居在实践中我试图在 pygame 中找到距离光标最近的点该点跨越颜色距离阈值计算如下 sqrt rgb1 0 rgb2 0 2 rgb1 1 rgb2 1
将一维数组转换为下三角矩阵

我想将一维数组转换为较低的零对角矩阵同时保留所有数字我知道numpy tril函数但它用零替换了一些元素我需要扩展矩阵以包含所有原始数字例如 10 20 40 46 33 14 12 46 52 30 59 18 11 22 30
对于相同的查询，MySQL Workbench 比 Python 快得多

MySQL Workbench 中的以下查询需要 0 156 秒才能完成 SELECT date time minute price id FROM minute prices WHERE contract id 673 AND TIMES
如何在Python代码中查找列号

简短问题当按上述方式调用函数时我可以找到行号here https stackoverflow com questions 3056048 filename and line number of python script 同样如何找到
Tensorflow 不分配完整的 GPU 内存

Tensorflow 默认分配所有 GPU 内存但我的新设置实际上只有 9588 MiB 11264 MiB 我预计大约 11 000MiB 就像我的旧设置一样张量流信息在这里 from tensorflow python client
按多个键分组并对字典列表的值进行汇总/平均值

在Python中按多个键进行分组并对字典列表进行汇总平均值的最Pythonic方法是什么假设我有一个字典列表如下所示 input dept 001 sku foo transId uniqueId1 qty 100 dept 001
在谷歌云上训练神经网络时出现“无法获取路径的文件系统”错误

我正在使用 Google Cloud 在云上训练神经网络如下例所示 https cloud google com blog big data 2016 12 how to classify images with tensorflow u
如何使用 Celery 多工作人员启用自动缩放？

命令celery worker A proj autoscale 10 1 loglevel info启动具有自动缩放功能的工作人员当创建多个工人时 me mypc projects x celery multi start mywork
如何正确导入主代码和模块中同时使用的模块？

假设我有一个主脚本 main py 它导入另一个 python 文件import coolfunctions另一个 import chores 现在假设 Coolfunctions 也使用家务活中的东西因此我声明import chore
Jupyter Notebook 中的深色模式绘图 - Python

我正在使用 Jupyter Notebook 目前正在使用 JupyterThemes 的深色日光主题我注意到我的绘图不是处于黑暗模式并且文本仍然是黑色并且在日光照射的背景上无法读取 JupyterThemes 的自述文件建议在 ipy
如何使用 django-pyodbc (ubuntu 16.04) 配置数据库设置 Django-MSSQL？

我是 Django 新手目前正在尝试使用另一个数据库来保存我的模型即MS SQL 我的数据库部署在docker容器中 903876e64b67 microsoft mssql server linux bin sh c opt mssq
具有多个主键的 SQLAlchemy 不会自动设置任何

我有一个简单的表 class test Base tablename test id Column Integer primary key True title Column String def init self title self
线性同余生成器 - 如何选择种子和统计检验

我需要做一个线性同余生成器它将成功通过所选的统计测试我的问题是如何正确选择发电机的数字以及我应该选择哪些统计检验我想均匀性的卡方频率测试每代收集10 000个号码的方法将 0 1 细分为10个相等的细分柯尔莫哥洛夫斯米尔
根据列索引重命名 Dataframe 列

是否有内置函数可以按索引重命名 pandas 数据框我以为我知道列标题的名称但事实证明第二列中有一些十六进制字符根据我接收数据的方式我将来可能会在第 2 列中遇到这个问题因此我无法将这些特定的十六进制字符硬编码到 datafram
Django Rest Framework POST 更新（如果存在或创建）

我是 DRF 的新手我阅读了 API 文档也许这是显而易见的但我找不到一个方便的方法来做到这一点我有一个Answer与 a 具有一对一关系的对象Question 在前端我曾经使用 POST 方法来创建发送到的答案api answe
Python：无法使用 os.system() 打开文件

我正在编写一个使用该应用程序的 Python 脚本pdftk http www pdflabs com tools pdftk the pdf toolkit 几次来执行某些操作例如我可以在 Windows 命令行 shell 中使用
Streamlabs API 405 响应代码

我正在尝试使用Streamlabs API https dev streamlabs com Streamlabs API 使用 Oauth2 来创建应用程序因此首先我将使用我的应用程序的用户发送到一个授权链接其中包含我的应用程序的客
Java/Python 中的快速 IPC/Socket 通信

我的应用程序中需要两个进程 Java 和 Python 进行通信我注意到套接字通信占用了 93 的运行时间为什么通讯这么慢我应该寻找套接字通信的替代方案还是可以使其更快更新我发现了一个简单的修复方法由于某些未知原因缓冲输出流似

随机推荐

SWI-Prolog - 显示长列表

我正在使用 SWI Prolog 我正在尝试打印一个列表但如果该列表有超过 9 个项目它看起来像那样 1 15 8 22 5 19 12 25 3 有没有办法显示整个列表看一下 http www swi prolog org FAQ
在 Yii 框架中配置数据库连接

在Yii框架的main php文件中有一些配置选项这就是mysql的设置方式 db gt array connectionString gt mysql host localhost dbname testdrive emulatePr
Pylint 警告：可能存在不平衡的元组按顺序解包

我有一段Python代码 def func1 a set b join map str list a return b def func2 d 1 e 2 return func1 d e def main a b c d func2 if
Swift 中具有共享 NSUserDefaults 的 KVO

我在通过通信 NSUserDefaults 更改在主机应用程序及其扩展之间进行通信时遇到问题我初始化了NSUserDefaults using init suiteName 添加 KVO 观察者使用addObserver 方法并覆盖该方法
Lombok 未在 Netbeans 项目中工作

我想在项目中使用Lombok来使用 Getter和 Setter 我包括使用 Maven
显示图像的片段中的内存问题

我正在使用片段来显示图像页面我有一个活动主要其中包含所有片段 package com example hscroll demo import android os Bundle import android preference P
为 POCO 实施 IEquatable

我注意到 EF 的 DbSet Add 非常慢谷歌搜索了一下找到了一个 SO 答案承诺性能提升高达 180 倍 https stackoverflow com a 7052504 141172 https stackoverflow
计算 SQL 中特定事件之前和之后的事件数量？

我有一个包含日期和事件的表有一个名为 A 的事件我想知道 Sql Bigquery 中事件 A 之前和之后发生了多少个事件例如 User Date Events 123 2018 02 13 D 123 2018 02 12 B 12
从网络数据抓取类返回数据？

我正在尝试创建一个类它可以让我从网络服务获取请求的数据我被困在如何返回值上 FooClass m DataGrabber is the class which is supposed to get values dataGrabber
R：使用矢量化按间隔分配值

让我们有一个数字向量 a lt round runif 20 1 5 0 1 3 5 4 2 1 2 3 4 5 2 我需要使用如下表为这些数字分配值 1 to 2 assign A 3 to 4 assign B 5 assign C 这
Ruby Mixins 和实例变量

是否有将参数传递给混合方法的最佳实践方法使用 mixin 的类可以设置混合方法期望的实例变量或者可以将所有必要的参数作为参数传递给混合方法背景是我们有一个 Rails 控制器来发布内容但其他控制器甚至模型都需要能够充当发布者所以
错误“来源：系统进程已退出，因此请求的信息不可用”

它在我的电脑上可以工作但是当我放入另一台机器时我收到错误源系统进程已退出因此请求的信息不可用并且 exe 没有出来有哪位有经验的兄弟可以帮忙吗赞赏 p New Process With p EnableRaisingEven
GooglePlayServices Admob 问题：“无法加载广告：0”

我对新的 admob 有疑问这是我的代码尝试在我的主要活动中创建和加载广告 private void createAndLoadAd String adUnitID RelativeLayout rlRoot View upperVie
如何创建在特定条件下对另一列进行计数的列？右

下面数据已被重新调整并列出了输入和预期输出 Data structure list record id c 110101 110101 110101 110101 110101 110101 110101 110101 110101 1
如何为 ruby on Rails 创建 .htaccess？

有谁知道创建 htaccess在铁轨上请指导我谢谢 regards 您只需在网站文档根目录中创建 htaccess 文件即可在 apache 中这将是您网站的文档根目录可能类似于 var www your website com
将 KeyVaultClient 与 MSAL 令牌“未经授权”结合使用

桌面应用程序如何使用 Azure AD 读取 KeyVault 机密我能够获取 MSAL 令牌但将其交给 KeyVaultClient 始终会导致 Microsoft Azure KeyVault Models KeyVaultErro
AtomicInteger 线程安全

我怎样才能实现这里的 while 循环总是恰好执行 100 次当我执行代码时在极少数情况下它会在控制台上打印 99 或 98 行而不总是 100 行这是我不明白的 import java util ArrayList import
Android：SkImageDecoder::Factory 返回 null

我正在使用本地主机来获取图像并在 ImageView 中查看由于某种原因我收到 Factory returned null 错误我已经仔细检查了代码很多次但我不明白有什么问题任何帮助将不胜感激 GalleryZoom java
Android Rect 对象中的上、左、右、下是什么意思

我有一个 Android 项目我应该让 Apple 崩溃苹果被画在一个矩形中所以我创建了一个改变矩形位置并重新绘制的函数这是我的功能 private void updateApplesPosition for Rect rect f
lxml find
with id='post-[0-9]*' [重复]

这个问题在这里已经有答案了我试图找到所有 id 以 post 这里有很多数字开头的 div 标签我尝试过这样的事情 tree xpath div starts with id post 0 9 但并没有真正起作用有没有办法在 pyt

lxml find with id='post-[0-9]*' [重复]

lxml find with id='post-[0-9]*' [重复] 的相关文章

随机推荐

热门标签

lxml find
with id='post-[0-9]*' [重复]

lxml find
with id='post-[0-9]*' [重复] 的相关文章