XPath 和 Regexp 哪个更快？

2024-04-22

我正在为 firefox 制作一个附加组件，它使用 ajax 加载一个 html 页面（附加组件有它的 XUL 面板）。

现在，我没有寻找创建document对象并将ajax请求内容放入其中，然后使用xPath找到我需要的内容。
相反，我加载内容并将其作为带有正则表达式的文本传递。

但我有一个问题。使用 xPath 或正则表达式哪个更好？哪个执行速度更快？

HTML 页面将由数百个包含相同文本的元素组成，我基本上想做的是计算有多少个元素。

我希望我的附加组件尽快运行，但我不知道 regexp 或 xPath 背后的机制，所以我不知道哪个更有效。

希望我说清楚了。谢谢

每当您处理 XML 时，请使用 XPath（或 XSLT、XQuery、SAX、DOM 或任何其他 XML 感知方法来浏览数据）。Do never使用正则表达式来完成此任务 https://stackoverflow.com/a/1732454/111575.

为什么？ XML 处理非常复杂，需要处理其所有奇怪之处、外部/已解析/未解析实体、DTD、处理指令、空白处理、折叠、unicode 规范化、CDATA 部分等。very很难创建可靠的正则表达式方式来获取数据。只要考虑一下业界花费了多年的时间来学习如何最好地解析 XML，这应该是足够的理由不要尝试自己做这件事.

回答你的问题：当谈到速度时（应该not是您在这里最关心的问题），它很大程度上取决于 XPath 或 Regex 编译器/处理器的实现。有时，XPath 会更快（即，如果可能的话，使用键或编译的 XSLT），其他时候，正则表达式会更快（如果您可以使用预编译的正则表达式并且查询很容易）。但正则表达式对于 HTML/XML 来说从来都不容易，因为匹配嵌套括号（标签）问题，仅使用正则表达式无法可靠地解决这个问题。

如果输入很大，正则表达式往往会更快，除非 XPath 实现可以进行流处理（我相信这不是 Firefox 内部的方法）。

你写了：

“哪个更有效”*

它可以让您以相对较快的速度最快地实现可靠且稳定的实施。使用 XPath。如果您需要从浏览器运行代码，那么 Firefox 和其他浏览器中也会使用它。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

XPath 和 Regexp 哪个更快？的相关文章

contenteditable，在文本末尾设置插入符号（跨浏览器）

输出在Chrome div style border 1px solid 000 width 500px height 40px hey div what s up div div div div
Android 上的 Chrome 强制隐藏地址栏

我最近开发了一个获取混合 http https 内容的网站因此我总是将地址栏显示在顶部它不会像其他网站那样自动隐藏这就是我要说的 This https planetkde org 是网站的链接内容是从各种来源获取的因此无法过滤非
定时器内嵌套异步等待 - 不返回所需的值

我必须使用 Mocha 和 chai 测试来测试端点的响应下面是相同的代码 async function getData userId let response let interval setInterval async gt resp
从 Linux bash 解析 FB-Purity 的 Firefox idb（索引数据库 API）object_data blob

我想从 Linux bash 脚本中读取由名为 FB Purity 的特定 Firefox 插件存储的结构化数据我找到了一个名为 mozilla firefox b8eab5j0 default storage default moz e
页面其余部分完成加载后延迟加载 html5 视频

我有一个视频元素用作我正在构建的页面底部部分的背景我试图通过将 src 存储为 data src 属性并使用 jQuery 在其他资源加载后将其应用到 src 属性因为它不是英雄图像或任何东西我想加载海报以节省加载时间然后稍后加载视
History.pushState和页面刷新

我开始研究 HTML5 新历史 API 不过我有一个问题如何处理页面刷新例如用户单击一个链接该链接由 js 函数处理该函数异步加载页面内容使用history pushState 更改URL 用户刷新页面但是服务器上当然不存
有没有等效的 gulp 插件来执行“grunt Bower”？

With grunt 我可以使用命令grunt bower 由提供grunt bower requirejs https github com ck86 gulp bower files 自动生成RequireJS我本地的配置文件bowe
为什么在排序输入上插入到树中比随机输入更快？

现在我一直听说从随机选择的数据构建二叉搜索树比有序数据更快这仅仅是因为有序数据需要显式重新平衡以将树高度保持在最低限度最近我实现了一个不可变的treap http en wikipedia org wiki Treap 一种特殊的二叉搜
快速 log2(float x) 实现 C++

我需要在 C 中非常快速地实现 log2 float x 函数我发现了一个非常有趣的实现而且速度非常快 include
Antd 选择搜索框未呈现匹配项

我有产品数据我正在使用搜索值过滤数据然后使用过滤后的数据呈现选项产品数据作为道具来自全局 redux 存储由于某种原因下拉列表仅在搜索值为空时显示数据当我开始输入时 filteredData已更新组件也重新渲染但选项不显示任
如何像在浏览器中一样检索准确的 HTML

我正在使用 Python 脚本来呈现网页并检索其 HTML 它适用于大多数页面但对于其中一些页面检索到的 HTML 不完整我不太明白为什么这是我用来废弃此页面的脚本由于某种原因每个产品的链接不在 HTML 中 Link http
使用 Perl 计算字符串中的连续字符数

我有一个包含多个连续字符序列的字符串例如 aaabbcccdddd 我想将其表示为 a3b2c3d4 到目前为止我已经想出了这个 usr bin perl str aaabbcccdddd str s 1 1 g print str n
将罗马数字转换为阿拉伯数字--recursiv

我是 JavaScript 新手正在网站的帮助下学习https www jshero net koans roman1 html https www jshero net koans roman1 html 本练习是编写一个转换器将罗马
jQuery clone() 复制数据...有时...？

使用下面的示例我有一个tr我正在复制它包含一个 jQueryautocomplete 第一次克隆时自动完成功能不起作用因为附加的data items 一片空白第二次单击添加按钮时自动完成功能将起作用此后再次单击添加会
JQuery 屏蔽输入插件不起作用

我已将 JQuery Masked 输入插件添加到我的 Web 项目中但它根本不起作用该插件可以在这里找到 http digitalbush com projects masked input plugin http digitalbu
FB.getLoginStatus() 不起作用

我正在尝试编写一段代码来检查用户是否登录发现FBJS API中有一个内置方法叫做getLoginStatus 我已经在html中实现了它但出于某种原因 getLoginStatus 内部的alert 不会被触发我也尝试在 init
为什么 std::atomic 比 volatile bool 慢很多？

多年来我一直使用 volatile bool 来控制线程执行并且效果很好 in my class declaration volatile bool stop In the thread function while stop do th
TinyMCE：将 CSS 类属性与 formatselect-dropdown 格式结合使用

我想定制格式 http wiki moxiecode com index php TinyMCE Configuration theme advanced blockformats在 TinyMCE 中格式选择下拉菜单 http wiki
IE 中带有“删除”方法的 jQuery.ajax 问题

我有一个页面用户可以使用按钮编辑各种内容并选择触发 ajax 调用特别是一个操作会导致远程调用一个 url 其中包含一些数据和放置请求这因为我使用的是宁静的 Rails 后端会触发我的更新操作我还有一个删除按钮它调用相同
bool() 和operator.truth() 有什么区别？

bool https docs python org 3 library functions html bool and operator truth https docs python org 3 library operator htm

随机推荐

CakePHP 2.0 中的错误处理。转义 viewVars [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我在 Cake 2 中遇到了一个奇怪
如何在 Swift 中从备份中排除文件？

我在 Swift 1 2 中工作得很好因为我使用 filePath 作为字符串现在 Swift 2 希望我们所有人都使用 URL 路径尽管我正在阅读他们的文档但我无法让它工作 I have var fileName myRespon
DEVISE 成功登录后，如何将用户重定向回之前需要登录的操作？

我有一个 ajax 投票按钮如果用户单击竖起大拇指图像但尚未登录那么他们应该看到一个对话框要求他们先登录为了实现这个对话框我使用 jQuery 和 Facebox 绑定到 ajax failure 事件如果用户未登录 De
如何将 create-react-app 转换为 Preact？

根据 Preact 文档要将 React 应用程序转换为 Preact 您必须为 webpack 指定别名 resolve alias react preact compat react dom preact compat 你怎么能做到这
我什么时候应该使用新的 ranged-for 以及我可以将它与新的 cbegin/cend 结合使用吗？

The new 范围为当然在 C 11 中会非常简洁和有用据我了解它是如何工作的它会查找容器 begin and end通过尝试 Argument Depending Lookup ADT 但另一个补充是所有容器现在有cbegin
使共享库可供多个应用程序使用的最佳方法是什么？

与大多数商店一样我们有一个团队负责各种项目他们都需要访问与我们业务相关的相同核心信息和功能通常使用 C 语言目前我们只是将公共类从一个项目复制到另一个项目但每个人都开始有自己的风格我们希望进行整合我们使用 Tortoise
如何在 f 字符串表达式中将数字格式化为两位小数？

我正在尝试制作这个程序询问用户他们的成绩并以两位小数显示他们的成绩前任如果他们的作业得分为 10 15 则会显示作业 1 66 66 在我的代码中我似乎无法将计算出的数字转换为两位小数 print Please enter your
Django：使用 post_delete 信号时确定正在删除的用户

我希望在删除某些对象时通知管理员但我也想确定哪个用户正在执行删除是否可以这是代码 models py signal to notify admins when nodes are deleted from django db mode
如何锁定 ASP.NET MVC 操作？

我已经编写了一个用作服务的控制器和操作这项服务的运行成本相当高如果当前已存在正在运行的操作我想限制对此操作的访问有没有内置的方法来锁定 ASP NET MVC 操作 Thanks 您在寻找这样的东西吗 public MyContro
如何使用准备好的 PDO 语句设置 ORDER BY 参数？

我在使用参数时遇到问题ORDER BY我的 SQL 部分它不发出任何警告但不打印任何内容 order columnName direction ASC stmt db gt prepare SELECT field from table
Pandas 在由列表组成的元素上删除重复项

假设我的数据框是 df pandas DataFrame 1 0 0 0 1 0 产生 0 0 1 0 1 0 0 2 1 0 我想删除重复项并且只获取元素 1 0 和 0 0 如果我写 df drop duplicates 我收到以下错
Python向数据框添加列会导致NaN

我有一个系列和 df s pd Series 1 2 3 5 df pd DataFrame 当我像这样向 df 添加列时 df loc 0 2 s iloc 0 3 df loc 1 3 s iloc 1 4 I get df 0 2 1
如果存在则更改表，如果不存在则创建

我需要运行一个安装程序它也可以是更新程序安装程序需要能够最终获得 mysql 数据库的特定方案结构无论某些表是否存在丢失了几列或者因为其结构是最新的而不需要更改我怎样才能优雅地组合ALTER and CREATE 我在想一定有
在数组中的两对之间添加键/值对

我一直在寻找和思考但无法想出一个可行的解决方案来解决这个问题我有一个带有连续数字键的数组 Example Array 0 gt value 0 1 gt value 1 2 gt value 2 3 gt value 3 我需要在数组中
查询列出数据库中每个表的记录数

如何列出数据库中每个表的行数一些相当于 select count from table1 select count from table2 select count from tableN 我将发布一个解决方案但欢迎其他方法如果您使用
将对象序列化为 XML 时如何添加 XML 命名空间 (xmlns)

我正在 XStream 的帮助下将对象序列化为 XML 如何告诉 XStream 将 xmlns 插入到对象的 XML 输出中例如我有一个想要序列化的简单对象 XStreamAlias value domain public class
如何在 Spark Pipeline 中使用随机森林

我想通过网格搜索和 Spark 交叉验证来调整我的模型在 Spark 中它必须将基础模型放入管道中即管道办公室演示 http spark apache org docs latest ml guide html example mod
ASP.NET 自定义错误被忽略

我在 web config 中配置了自定义错误但 IIS 6 0 返回网站配置的自定义错误选项卡中指定的自定义错误
Coverage.py 无法发现子目录中没有 init.py 文件的测试

当我运行 python 覆盖范围时我总是需要一个空的 init py测试子目录中的文件以获得运行测试的覆盖范围这是 python2 软件包的要求但不是 python3 的要求为了重现我执行了以下操作先决条件是 python3 p
XPath 和 Regexp 哪个更快？

我正在为 firefox 制作一个附加组件它使用 ajax 加载一个 html 页面附加组件有它的 XUL 面板现在我没有寻找创建document对象并将ajax请求内容放入其中然后使用xPath找到我需要的内容相反我加载内容

XPath 和 Regexp 哪个更快？

XPath 和 Regexp 哪个更快？ 的相关文章

随机推荐

热门标签

XPath 和 Regexp 哪个更快？的相关文章