如何在 pyparsing 中与 OneOrMore 等进行非贪婪（回溯）匹配？

2024-01-13

我正在尝试使用以下方法将部分标准化的街道地址解析为其组件pyparsing。我想要非贪婪地匹配可能有 N 个令牌长的街道名称。

例如：

444 PARK GARDEN LN

应该解析为：

number: 444
street: PARK GARDEN
suffix: LN

我该如何使用 PyParsing 来做到这一点？这是我的初始代码：

from pyparsing import *

def main():
    street_number = Word(nums).setResultsName('street_number')
    street_suffix = oneOf("ST RD DR LN AVE WAY").setResultsName('street_suffix')
    street_name = OneOrMore(Word(alphas)).setResultsName('street_name')

    address = street_number + street_name + street_suffix
    result = address.parseString("444 PARK GARDEN LN")
    print result.dump()

if __name__ == '__main__':
    main()

但是当我尝试解析它时，街道后缀会被默认的贪婪解析行为吞噬。

使用否定，~，检查是否即将到来street_name实际上是一个street_suffix.

from pyparsing import *

street_number = Word(nums)('street_number')
street_suffix = oneOf("ST RD DR LN AVE WAY")('street_suffix')
street_name = OneOrMore(~street_suffix + Word(alphas))('street_name')

address = street_number + street_name + street_suffix
result = address.parseString("444 PARK GARDEN LN")
print result.dump()

此外，你不have to use setResultsName，您可以简单地使用上面的语法。恕我直言，它会带来更清晰的语法定义。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pyparsing

如何在 pyparsing 中与 OneOrMore 等进行非贪婪（回溯）匹配？的相关文章

阻止 TensorFlow 访问 GPU？ [复制]

这个问题在这里已经有答案了有没有一种方法可以纯粹在CPU上运行TensorFlow 我机器上的所有内存都被运行 TensorFlow 的单独进程占用我尝试将 per process memory fraction 设置为 0 但未成功
将 transaction.commit_manually() 升级到 Django > 1.6

我继承了为 Django 1 4 编写的应用程序的一些代码我们需要更新代码库以使用 Django 1 7 并最终更新到 1 8 作为下一个长期支持版本在一些地方它使用旧风格 transaction commit manually and
如何在 Jupyter Notebook 中运行 Python 异步代码？

我有一些 asyncio 代码在 Python 解释器 CPython 3 6 2 中运行良好我现在想在具有 IPython 内核的 Jupyter 笔记本中运行它我可以运行它 import asyncio asyncio get ev
从 Python 下载/安装 Windows 更新

我正在编写一个脚本来自动安装 Windows 更新我可以将其部署在多台计算机上这样我就不必担心手动更新它们我想用 Python 编写这个但找不到任何关于如何完成此操作的信息我需要知道如何搜索更新下载更新并从 python 脚本安
Python 使用 Gstreamer 访问 USB 麦克风时遇到问题，以便在 Raspberry Pi 上使用 Pocketsphinx 执行语音识别

所以Python的表现就好像它根本听不到我的麦克风发出的任何声音问题就在这里我有一个Python 2 7 假设使用的脚本Gstreamer通过以下方式访问我的麦克风并为我进行语音识别口袋狮身人面像我在用着脉冲音频我的设备是树莓派我的
将二维数组放入 Pandas 系列中

我有一个 2D Numpy 数组我想将其放入 pandas 系列而不是 DataFrame 中 gt gt gt import pandas as pd gt gt gt import numpy as np gt gt gt a np
根据 Pandas 中的列表对多列进行排序

感谢有关如何根据 pandas 中的倍数列表对给定多列进行排序的任何提示如下所示 import pandas as pd sort a a d e sort b s1 s3 s6 sort c t1 t2 t3 df pd DataFra
ValueError：不支持连续[重复]

这个问题在这里已经有答案了我正在使用 GridSearchCV 进行线性回归的交叉验证不是分类器也不是逻辑回归我还使用 StandardScaler 对 X 进行标准化我的数据框有 17 个特征 X 和 5 个目标 y 观察约11
CNTK 抱怨 LSTM 中的动态轴

我正在尝试在 CNTK 中实现 LSTM 使用 Python 来对序列进行分类 Input 特征是固定长度的数字序列时间序列标签是 one hot 值的向量 Network input input variable input dim
如何根据 HTTP 请求使用 Python 和 Flask 执行 shell 命令并流输出？

下列的这个帖子 https stackoverflow com questions 15092961 how to continuously display python output in a webpage 我能够tail f网页的日志
Pandas：如何将数据框插入 Clickhouse

我正在尝试将 Pandas 数据框插入 Clickhouse 这是我的代码 import pandas import sqlalchemy as sa uri clickhouse default localhost default ch
Python Pandas：如何对组中的所有项目进行分组并为其分配 id？

我有 df domain orgid csyunshu com 108299 dshu com 108299 bbbdshu com 108299 cwakwakmrg com 121303 ckonkatsunet com 121303
迭代列表的奇怪速度差异

我创建了两个重复两个不同值的长列表在第一个列表中值交替出现在第二个列表中一个值出现在另一个值之前 a1 object object 10 6 a2 a1 2 a1 1 2 然后我迭代它们不对它们执行任何操作 for in a1 p
为什么我应该使用 WSGI？

使用 mod python 一段时间了我读了越来越多关于 WSGI 有多好的文章但没有真正理解为什么那么我为什么要切换到它呢有什么好处这很难吗学习曲线值得吗为了用 Python 开发复杂的 Web 应用程序您可能会使用更全面
在 Spyder 的变量资源管理器中查看局部变量

我是 python 新手正在使用 Spyder 的 IDE 我欣赏它的一项功能是它的变量资源管理器然而根据一些研究我发现它只显示全局变量我找到的解决方法是使用检查模块 import inspect local vars def m
从 python 检测 macOS 中的暗模式

我正在编写一个 PyQt 应用程序我必须添加一个补丁以便在启用暗模式的 Macos 上可以读取字体 app QApplication Fix for the font colours on macos when running dark
falcon，AttributeError：“API”对象没有属性“create”

我正在尝试测试我的猎鹰路线但测试总是失败而且看起来我把所有事情都做对了 my app py import falcon from resources static import StaticResource api falcon API
带有 RotatingFileHandler 的 Python 3 记录器超出 maxBytes 限制

我使用以下代码来限制日志文件的大小最小示例 import logging from logging handlers import RotatingFileHandler Set up logfile and message loggin
从列表python的单个列表中删除子列表

我已经经历过从列表列表中删除子列表 https stackoverflow com questions 47209786 removing sublists from a list of lists 但当我为我的数据集扩展它时它不适用于我
使用 Python 将对象列表转为 JSON

我在转换时遇到问题Object实例到 JSON ob Object list name scaping myObj base url u number page for ob in list name json string json du

随机推荐

符号|查看 Flask 教程

我正在为 Flask 框架编写一个教程网址为http blog miguelgrinberg com post the flask mega tutorial part iii web forms http blog miguelgrin
Android 6.0 权限变更回调

我想知道当用户在 Android 6 0 上更改应用程序设置中的权限时是否有某种方式可以收到通知我一直在寻找这个答案但没有运气您知道广播接收器和某些特定意图是否可能吗或者也许有一些黑客可以实现这一目标根据这个答案 https st
在开发、登台和生产之间同步 Drupal 站点

通常在 Drupal 6 x 站点启动后我会让人们开始注册并输入他们自己的内容每当需要升级时生产中的数据库都会复制到开发版然后在开发版上完成开发然后推送到登台以供客户批准当网站最终准备上线时出现了一个问题生产服务器具有最新的
为什么 ng-scope 添加到我的部分视图的 javascript 内联中并使警报不起作用？

我正在使用 AngularJs 和模板系统我想向每个模板添加特定的内联 javascript 脚本添加与所选选项卡相关的警报框主页列表设置 Html 渲染但是添加了 ng scope 并且当您更改选项卡时没有任何警报我在这里提
jQuery datepicker altFormat 不显示

我有一个 jQuery 日期选择器它根据卖家的语言偏好进行本地化每个日期选择器自定义都有不同的日期格式但我希望提交表单时的输入采用特定的格式进行解析我尝试在日期选择器上使用 altFormat 将其设置为 mm dd yy 但我不希
角度 ui-router 维护选项卡之间的状态

想知道保留选项卡之间状态的最佳方法我使用引导选项卡和角度用户界面路由器我在其中一个选项卡中有一个谷歌地图并且不想在用户选择该选项卡时重新加载地图请指教 Thanks 我认为本期讨论了您正在寻找的内容 https github com
php mysql asc/desc 顺序

TABLE timeslot id timeslot times 1 09 00 2 09 30 3 10 00 4 10 30 5 11 00 bookslot id id timeslot date b ref 1 2 2010 02
如何让Android模拟器启动更快

我目前一直坚持使用 Atom CPU 桌面来开发 Android 应用程序有哪些方法可以改善其启动时间运行模拟器时我可以看到模拟器使用的核心数量只有一个我从 Eclipse ADT 插件中运行模拟器如何让模拟器使用两个核心而不是一
只需单击标签即可双击

我有一个标签并且单击它时正在运行一些功能但是当单击事件发生时双击事件完成然后我的函数运行两次你可以看一个简单的例子here http jsfiddle net vgWGT 2 HTML
iOS 7 master有导航栏提示时的细节布局

我在 iOS 7 中遇到布局问题要重现请创建一个简单的主从应用程序并将此行插入MasterViewController m self navigationItem prompt Master 这在DetailViewController
正则表达式允许非 ASCII 和外文字母吗？

是否可以创建一个正则表达式来允许非ascii字母与拉丁字母一起使用例如中文或希腊符号例如允许A汉语AbN汉语我目前有以下内容 w d w d s 只允许使用拉丁字母 In NET p L d p L d s 相当于你的正则表达式另外
Angular2 5 分钟安装错误 - 未定义需求

我正在做Angular2 5 分钟快速入门 https angular io docs ts latest quickstart html 现在教程已经进行了大约一半我已经正确设置了以下文件索引 html 应用程序组件 ts 应用程序
实现观察者模式时出现的问题：“成员引用基类型 ________ 不是结构或联合”

我一直在实现一个准系统观察者模式但遇到了一个有点神秘的错误成员引用基类型 Observer 不是结构或联合我认为这与我使用模板有关但我仍然对模板感到相当不舒服这是有问题的代码为了简化事情而删除了大多数 cons 析构函数主题界
在Android中绘画时如何遮盖一个简单的区域？

下面是一个简化的描述想象一下我有一个 View 类它可以绘制一面墙的图片并且我想在绘制它时切出一个窗口假设我扩展该 View 类并重写其dispatchDraw 方法来执行以下操作首先绘制背景如果有的话可以通过窗户看到接下
有没有办法像oracle中的rownum一样获取Mysql中的行号[重复]

这个问题在这里已经有答案了有没有办法像oracle中的rownum一样获取Mysql中的行号如果没有那么有什么间接的方法吗请建议直到MySQL终于支持现代SQL http modern sql com slides 获得类似内容的唯
如何标记和测量斑点的大小？

我正在用Python学习图像分析我只是一个初学者我能够编写代码我在下面分享来检测此纳米颗粒图像中的斑点纳米颗粒我可以使用以下方法检测到有 10 个纳米粒子cv2 connectedComponents 但现在我需要用数字标记每
单击标题上的按钮时阻止引导手风琴打开

我有两个操作按钮位于手风琴的标题上如下所示当我单击这些按钮之一时它会切换手风琴的状态我尝试过e preventDefault and e stopImmediatePropagation 没有结果这是jsfiddle https
如何使用垂直对齐：居中；适当地？

我想让我的列表导航与图像徽标的中心对齐我尝试使用vertical align middle 但是当我左右浮动图像时我无法让它工作这是我的代码 HTML div img src logo png ul li a href Ite
如何以最简单的方式在 V 2010Express C# 中创建 MRU？

首先我是 C 编程的新手我需要尽快创建一个简单的 MRU 好吧问题是我尝试查看一些在线示例但我发现它们有点太令人困惑了那么是否任何人都可以在工具条菜单项中创建最近使用部分而无需进入那些复杂的代码例如我将无法理解这些东西
如何在 pyparsing 中与 OneOrMore 等进行非贪婪（回溯）匹配？

我正在尝试使用以下方法将部分标准化的街道地址解析为其组件pyparsing 我想要非贪婪地匹配可能有 N 个令牌长的街道名称例如 444 PARK GARDEN LN 应该解析为 number 444 street PARK GARDEN

如何在 pyparsing 中与 OneOrMore 等进行非贪婪（回溯）匹配？

如何在 pyparsing 中与 OneOrMore 等进行非贪婪（回溯）匹配？ 的相关文章

随机推荐

热门标签

如何在 pyparsing 中与 OneOrMore 等进行非贪婪（回溯）匹配？的相关文章