如何在一个正则表达式对象中使用多种模式？

2023-12-02

我写了一个脚本vba结合regular expressions解析company name, phone and fax来自网页。当我运行脚本时，我可以完美地获取这些信息。然而，问题是我用过三种不同的expressions为了让它们成功，我创建了三个不同的regex objects, as in rxp,rxp1, and rxp2.

我的问题：我怎样才能创建一个regex object在其中我将能够使用三个patterns与我下面所做的不同？

这是脚本（工作脚本）：

Sub GetInfo()
    Const Url$ = "https://www.austrade.gov.au/SupplierDetails.aspx?ORGID=ORG0120000508&folderid=1736"
    Dim rxp As New RegExp, rxp1 As New RegExp, rxp2 As New RegExp

    With New XMLHTTP60
        .Open "GET", Url, False
        .send

        rxp.Pattern = "Company Name:(\s[\w\s]+)"
        rxp1.Pattern = "Phone:(\s\+[\d\s]+)"
        rxp2.Pattern = "Fax:(\s\+[\d\s]+)"

        If rxp.Execute(.responseText).Count > 0 Then
            [A1] = rxp.Execute(.responseText).Item(0).SubMatches(0)
        End If

        If rxp1.Execute(.responseText).Count > 0 Then
            [B1] = rxp1.Execute(.responseText).Item(0).SubMatches(0)
        End If

        If rxp2.Execute(.responseText).Count > 0 Then
            [C1] = rxp2.Execute(.responseText).Item(0).SubMatches(0)
         End If
    End With
End Sub

参考添加到库中执行上面的脚本：

Microsoft XML, v6.0
Microsoft VBScript Regular Expressions

您可以使用替代方案构建正则表达式，启用全局匹配rxp.Global = True，并将已知字符串捕获到组 1 中，将未知部分捕获到组 2 中。然后，您将能够通过检查组 1 的值来为变量分配正确的值：

Const Url$ = "https://www.austrade.gov.au/SupplierDetails.aspx?ORGID=ORG0120000508&folderid=1736"
Dim rxp As New RegExp
Dim ms As MatchCollection
Dim m As Match
Dim cname As String, phone As String, fax As String

With New XMLHTTP60
    .Open "GET", Url, False
    .send

    rxp.Pattern = "(Phone|Company Name|Fax):\s*(\+?[\w\s]*\w)"
    rxp.Global = True

    Set ms = rxp.Execute(.responseText)
    For Each m In ms
        If m.SubMatches(0) = "Company Name" Then cname = m.SubMatches(1)
        If m.SubMatches(0) = "Phone" Then phone = m.SubMatches(1)
        If m.SubMatches(0) = "Fax" Then fax = m.SubMatches(1)
    Next

    Debug.Print cname, phone, fax
End With

Output:

Vaucraft Braford Stud       +61 7 4942 4859              +61 7 4942 0618

See the 正则表达式演示.

图案细节:

(Phone|Company Name|Fax)- 捕获组 1：三个选项中的任何一个
:\s*- 一个冒号，然后是 0+ 个空格
(\+?[\w\s]*\w) - Capturing group 2:
- \+?- 可选的+
- [\w\s]*- 0个或多个字母、数字、_或空格
- \w- 单个字母、数字或_.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何在一个正则表达式对象中使用多种模式？的相关文章

在 VBA 中循环合并单元格

是否可以循环遍历合并的单元格vba questions tagged vba 我的范围内有 6 个合并单元格B4 B40 我只需要这 6 个单元格中的值 6 次迭代上面的答案看起来已经让你排序了如果您不知道合并的单元格在哪里那么您可以
curl 无法获取网页内容，为什么？

我正在使用curl 脚本转到链接并获取其内容以进行进一步操作以下是链接和curl脚本
证明 Excel VBA Scripting.Dictionary 不保留项目插入顺序

我正在尝试决定是否为我的项目使用 Excel VBA 集合或字典出于多种原因我倾向于字典但在使用字典时我会继续阅读它For Each循环检索字典项目或从字典 Items 数组读取项目时检索顺序可能不是添加项目的顺序这对于我的应用程
Apache poi setformula 不适用于 SE

我正在尝试在 XSSFCell With POI 中设置公式 Cell setFormula SE D87 0 D80 D87 错误是名称 SE 在当前工作簿中完全未知 Why 看起来您正在尝试创建一个IF公式我发现这一页 http w
如何在正则表达式中输入“：”（“冒号”）？

冒号在正则表达式中具有特殊含义但我需要按原样使用它例如 A Za z0 9 我试图逃避它但这不起作用 A Za z0 9 在大多数正则表达式实现包括 Java 的中无论在字符类内部还是外部都没有特殊含义您的问题很可能是由于
无论如何要抓取重定向的链接吗？

无论如何我可以让 python 单击一个链接例如 bit ly 链接然后抓取生成的链接吗当我抓取某个页面时我唯一可以抓取的链接是重定向的链接它重定向到的位置就是我需要的信息所在的位置重定向有 3 种类型 HTTP 作为响应标头
[Regex]::Replace() 和 -replace 有什么区别？

我明白了之间的区别 Replace and replace 但是什么是 replace and Regex Replace 我测试了以下两个代码但对我来说结果完全相同我还提到了 PowerShell Cookbook O reilly
EPPlus Excel 行高不一致

我已经使用 EPPlus 生成了一个 excel 文件在 MS Office 2007 中一切似乎都很完美但客户端使用的是 MS Office 2010 2013 并且在第 29 行之后未设置行高这是一个非常奇怪的问题我已经尝试了
使用 Apache POI Excel 写入特定单元格位置

如果我有一个未排序的参数 x y z 列表是否有一种简单的方法将它们写入使用 POI 创建的 Excel 文档中的特定单元格就好像前两个参数是 X 和Y 坐标例如我有如下行 10 4 100 是否可以在第 10 行第 4 列的单元格
在Google电子表格中划分整列

我是 Google 电子表格的一个相对较新的用户我希望 B 列中的每个单元格都是 A 列同一行中内容除以 5 的结果 B1 B2 B3 等商应为 A1 A2 A3 等被除数除以 5 除数在示例中 B1 A1 5 我知道一项一
PHP URL 验证

我知道有无数的线程问这个问题但我一直无法找到一个可以帮助我解决这个问题的线程我基本上试图解析大约 10 000 000 个 URL 的列表确保它们根据以下标准有效然后获取根域 URL 此列表包含您能想象到的几乎所有内容包括类似的内
REGEXP_REPLACE - 仅当包含在 () 中时才从字符串中删除逗号

我在 oracle 论坛网站找到了一个例子输入字符串 a b c x y z a xx yy zz x WITH t AS SELECT a b c x y z a xx yy zz x col1 FROM dual SELECT t c
使用 selenium 和 python 来提取 javascript 生成的 HTML？萤火虫？

这里是Python新手我遇到的是数据收集问题我在这个网站上当我用 Firebug 检查我想要的元素时它显示了包含我需要的信息的源然而常规源代码没有 Firebug 不会给我这个信息这意味着我也无法通过正常的 selenium
如何使用VBA根据条件删除Excel中的行？

我目前正在构建一个宏来格式化数据表并删除不适用的数据行具体来说我希望删除列 L ABC 的行以及删除列 AA DEF 的行到目前为止我已经实现了第一个目标但还没有实现第二个目标现有代码是 Dim LastRow As Integ
选择前 n 个字符相等的行（MySQL）

我有一张带有玩家句柄的桌子如下所示 1 N Laka 2 N James 3 nor Brian 4 nor John 5 Player 2 6 Spectator 7 N Joe 从那里我想选择第一个 n 字符匹配的所有玩家但我不知道
具有连字符的 Oracle 正则表达式在 Windows 上给出的结果与在 Unix 上不同

我有以下带有正则表达式的查询 select REGEXP REPLACE TEST 3304 V2 lt gt as REG from dual 当通过 SQL Plus 在Windows机器返回以下内容 SQL gt select REG
使用 posix shell 测试字符串中的正则表达式

如何测试字符串是否与特定字符串匹配正则表达式与基本无 bash 或任何其他 posix shell 脚本在 if 语句中您可以使用expr在 POSIX shell 中计算正则表达式的命令 s Abc expr s alpha 3 e
有没有办法匹配任意 Unicode 字母字符？

我有一些文档经过 OCR 从 PDF 转换为 HTML 因此他们最终会出现很多随机的 unicode 标点符号而转换器会搞砸即省略号等他们还正确地有一堆非英语但仍然是字母字符如和俄语字符等有没有办法制作一个匹配任何 unico
从正则表达式对象中提取允许字符串的最大长度

一旦加载到 C 中是否可以从正则表达式模式中提取允许的字符串的最大长度Regex object 如果我有一个正则表达式字符串定义为 A Z0 9 0 20 我可以使用字符串操作来获取最大允许长度20 但是有没有一种方法可以更轻松地实现这
在 VBA Excel 中查找、剪切和插入行以匹配借项和贷项值

我在 Sheet1 中有以下设置数据并从第 4 行 A 列开始其中标题位于第 3 行 No Date Code Name Remarks D e b i t Cr e d i t 1 4 30 2015 004 AB 01 04 15

随机推荐

使用java servlet将excel文件发送到客户端

我在用阿帕奇兴趣点用于生成Excel文件输入Java Servlet getExcel 函数返回HSSFWorkbook 我想发送给客户 HSSFWorkbook wb getExcel 这是我到目前为止所尝试过的 block1 ByteA
不应使用 keyup 事件的“charCode”属性。值没有意义

HTML 代码
如何获取存储在数组中的字符串长度（C）

我如何获得下面字符串的长度以及数组大小 char str str 0 He str 1 llo str 2 Wor str 3 ld 我如何将它们存储在多维数组中所以这个数组看起来像这样 char strstr str 的大小 str 的
读取带有隐藏或不可见字符^M的csv文件

我尝试读取包含隐藏或不可见字符的 csv 文件但失败文件内容如下所示 my data2 lt read table text Common name Scientific name Stuff1 Stuff2 Greylag Goose
SQLite onUpgrade 有 4 个数据库版本

当我们有 4 个数据库版本并且我们在每个版本的用户表中添加了一个新字段时执行 SQLiteOpenHelper 的 onUpgrade 方法的正确方法是什么变体 A 每个 case 后都没有中断 case 2 和 3 是否继续运行 p
相对定位顶部百分比不适用于行内元素

在下面如果我对 Top 使用百分比值则不会重新定位 em 如果我使用 px 的话效果很好为什么我在 w3 中对此进行了研究但找不到任何使用百分比值的资格定位上下文是 p 因为它的相对定位应该具有从行框派生的高度编辑为了清楚
在 jQuery 中使用 $ 和变量有什么具体原因吗

我知道这是一个愚蠢的问题但我对此有点困惑例如如果我有一个带有 ID 的输入 rad1 下面几行代码有什么区别吗 var a rad1 or var a rad1 不没有真正的区别这只是一个惯例可以帮助您记住这一点a不是 DOM
如何将 numpy 数组中的多个字符串连接为单个字符串？

我有以下字符串数组作为 numpy 数组 filepaths np array Padma Meghna Jamuna 我想连接起来这样我应该得到以下内容 Padma Meghna Jamuna 我正在执行以下操作但没有达到预期效果 n
Azure AD B2C OpenID Connect 使用 WS-Federation 和 SAML 声明提供程序进行单点注销

使用 WS Federation 和 SAML 将 AD FS 配置为自定义策略作为 Azure AD B2C 上的声明提供程序 Azure AD B2C 上的依赖方正在使用 OpenID Connect 是否可以通过 OpenID Co
Android MediaPlayer 准备时间太长

嘿我正在使用 MediaPlayer 播放常规 ShoutCast 流该代码非常简单只需使用prepareAsync 和一个处理程序即可开始播放虽然它可以与 DI FM 或 ETN FM http u10 di fm 80 di p
MS Access 失败后如何恢复 ODBC 连接

有一个 MS Access 应用程序其中包含通过 ODBC 链接的 MS SQL Server 上的表当连接丢失时我收到 ODBC 错误 3146 连接物理恢复后我仍然收到 ODBC 3146 错误我必须做一些类似重新连接到服务器
prolog 中对称关系的传递闭包

我是序言初学者我想创建兄弟关系该关系应该是对称的就像兄弟阿林亚历克斯是真的兄弟亚历克斯阿林应该也是如此它也应该是传递的就像兄弟阿林亚历克斯 and 兄弟亚历克斯克劳迪乌是真的兄弟阿林克劳迪乌应该
Nuxt服务器中间件重定向不是一个函数

我想在 serverMiddleware 中重定向一个路由它说重定向不是一个函数 code export default function req res next req is the Node js http request obje
如何将参数传递给 BackGroundWorker

Imports SpeechLib Public Class Form1 Public vox CreateObject sapi spvoice Private Sub cmdSpeak Click ByVal sender As Sys
如何使用本地文件的 URL（带空格和 #）启动默认浏览器？德尔福

我想在默认浏览器中打开本地 HTML 文件例如默认浏览器是 Mozilla Firefox 要打开的文件 C 我的自定义路径新文件夹 AFile htm 请注意路径中有空格根据条件我想在 URL 末尾附加一个 Id 最终 URL
有没有 PHP 函数可以将查询字符串转换为数组？

我基本上是在寻找相反的http build query 我有以下字符串 foo bar bar var foo 我想要以下内容传递到http build query array foo gt bar bar gt array var gt
处理 Swift 3 中的 Google 登录时遇到问题

我是 iOS 新手在 Swift 3 中处理应用程序委托 URL 时遇到问题我真的可以使用一些指针下面的代码在 Swift 2 3 中运行得非常好 func application application UIApplication
Python 子进程在接收 stdin EOF 时遇到神秘延迟

我将应用程序中遇到的问题简化为以下测试用例在此代码中父进程同时生成 2 个您可以生成更多子进程这些子进程通过 stdin 从父进程读取一条大消息休眠 5 秒然后写回一些内容然而某处发生了意外的等待导致代码在 10 秒内完
PHP & MYSQL 动态下拉列表

我一直在尝试创建一个带有动态下拉列表的表单从 MYSQL 获取数据我的数据库没问题没有错误第一类下拉菜单工作正常但我想知道为什么我的第二个下拉菜单不起作用我只是无法追踪代码中的任何错误但这种情况正在发生这是我的代码动态下拉
如何在一个正则表达式对象中使用多种模式？

我写了一个脚本vba结合regular expressions解析company name phone and fax来自网页当我运行脚本时我可以完美地获取这些信息然而问题是我用过三种不同的expressions为了让它们成功我创

如何在一个正则表达式对象中使用多种模式？

如何在一个正则表达式对象中使用多种模式？ 的相关文章

随机推荐

热门标签

如何在一个正则表达式对象中使用多种模式？的相关文章