包含可变数据的正则表达式 - ply.lex

2024-05-08

我正在使用 python 模块ply.lex编写一个词法分析器。我用正则表达式指定了一些标记，但现在我卡住了。我有一个list of Keywords谁应该是token. data是一个包含大约 1000 个关键字的列表，这些关键字都应该被识别为一种关键字。例如，这可以是：_Function1 _UDFType2等等。列表中的所有单词都用空格分隔，就是这样。我只是希望词法分析器能够识别此列表中的单词，以便它返回“KEYWORD”类型的标记。

data = 'Keyword1 Keyword2 Keyword3 Keyword4'
def t_KEYWORD(t):
    # ... r'\$' + data ??
    return t

text = '''
Some test data


even more

$var = 2231




$[]Test this 2.31 + / &
'''

autoit = lex.lex()
autoit.input(text)
while True:
    tok = autoit.token()
    if not tok: break
    print(tok)

所以我试图将变量添加到该正则表达式中，但它不起作用。我总是得到：No regular expression defined for rule 't_KEYWORD'.

先感谢您！约翰

正如@DSM建议你可以使用令牌装饰器 http://www.dabeaz.com/ply/ply.html#ply_nn14。查找标记的正则表达式如下cat or dog is 'cat|dog'（也就是说，单词之间用'|'而不是一个空格）。所以尝试：

from ply.lex import TOKEN
data = data.split() #make data a list of keywords

@TOKEN('|'.join(data))
def t_KEYWORD(t):
    return t

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

包含可变数据的正则表达式 - ply.lex 的相关文章

在 Python 2.7 中出现“ImportError：无法导入名称 HTTPSConnection”错误

我正在尝试在 AWS ElasticBeanstalk 中部署 django 当我按照所示步骤操作时here http docs aws amazon com elasticbeanstalk latest dg create deploy
通过 python 中的另外两个修改数组[重复]

这个问题在这里已经有答案了假设我们有三个一维数组 A 长度为 5 B 长度相同示例中为5 C 更长比如长度为 100 C最初用零填充 A给出索引C应更改的元素它们可能会重复以及B给出应添加到初始零的值C 例如如果A 1 3 3
键入的完整命令行

我想获得输入时的完整命令行 This join sys argv 在这里不起作用删除双引号另外我不想重新加入已解析和拆分的内容有任何想法吗你太迟了当键入的命令到达 Python 时您的 shell 已经发挥了它的魔力例如引
Flask 中“缺少 CSRF 令牌”，但它在模板中呈现

问题当我尝试登录使用 Flask login 时我得到Bad Request The CSRF session token is missing但令牌正在呈现在模板中 secret key 已设置并且我在本地运行localhost
为什么在连接两个字符串时 Python 比 C 更快？

目前我想比较 Python 和 C 用来处理字符串的速度我认为 C 应该比 Python 提供更好的性能然而我得到了完全相反的结果这是 C 程序 include
将 Python Pandas DataFrame 写入 Word 文档

我正在努力创建一个使用 Pandas DataFrames 的 Python 生成的报告目前我正在使用DataFrame to string 方法但是这会作为字符串写入文件有没有办法让我实现这一目标同时将其保留为表格以便我可以使
为什么 re.findall 在查找字符串中的三元组项时不具体。 Python

所以我有四行代码 seq ATGGAAGTTGGATGAAAGTGGAGGTAAAGAGAAGACGTTTGA OR 0 re findall r ATG 9 TAA TAG TGA seq 首先让我解释一下我正在尝试做什么如果这令人困惑
查找与另一列 Pandas 中的唯一值关联的列中的值的交集

如果我有一个像这样的数据框非常小的例子 col1 col2 0 a 1 1 a 2 2 b 1 3 b 2 4 b 4 5 c 1 6 c 2 7 c 3 我想要所有的交集col2当价值观与其独特性相关时col1值因此在这种情况下交集
在 Linux 上使用多处理时，TKinter 窗口不会出现

我想生成另一个进程来异步显示错误消息同时应用程序的其余部分继续我正在使用multiprocessingPython 2 6 中的模块来创建进程我试图用以下命令显示窗口TKinter 这段代码在Windows上运行良好但在Linux上
更改 Matplotlib 投影轴的背景颜色

我正在尝试使用 Cartopy 创建一个图形该图形需要在未投影的轴上绘制投影轴这是一个尽可能简单的代码版本它将轴上的内容替换为背景颜色 import matplotlib pyplot as plt import cartopy cr
为什么将模块级代码放入函数中然后调用该函数在Python中速度更快？

在亚历克斯马尔泰利的回应中使 Python 脚本面向对象 https stackoverflow com questions 1813117 making a python script object oriented 他提到在 Pyth
如何获取分类数据的分组条形图

I have a big dataset with information about students And I have to build a graph of dependencies between different value
如何通过 Python Requests 库使用基本 HTTP 身份验证？

我正在尝试在 Python 中使用基本的 HTTP 身份验证我正在使用Requests https docs python requests org 图书馆 auth requests post http hostname auth HT
从 wxPython 事件处理程序中调用函数

我正在努力寻找一种在 wxPython 事件处理函数中使用函数的方法假设我有一个按钮单击该按钮时它会使用事件处理程序运行一个名为 OnRun 的函数但是用户忘记单击 OnRun 按钮之前的 RadionButton 我想弹出一个
从迭代器外部将 StopIteration 发送到 for 循环

有几种方法可以打破一些嵌套循环他们是 1 使用中断继续 for x in xrange 10 for y in xrange 10 print x y if x y gt 50 break else continue only exec
Python 2.7 缩进错误[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案这个问题是由拼写错误或无法再重现的问题引起的虽然类似的问题可能是on topic help on topic在这里这个问题的解决方式不
Django 将 JSON 数据传递给静态 getJSON/Javascript

我正在尝试从 models py 中获取数据并将其序列化为views py 中的 JSON 对象模型 py class Platform models Model platformtype models CharField max len
如何创建用于霍夫曼编码和解码的树？

对于我的作业我将对霍夫曼树进行编码和解码我在创建树时遇到问题并且陷入困境不要介意打印语句它们只是让我测试并查看函数运行时的输出是什么对于第一个 for 循环我从主块中用于测试的文本文件中获取了所有值和索引在第二个 for 循
UnicodeDecodeError：部署到 Heroku 时，“utf-8”编解码器无法解码位置 0 中的字节 0xff

我尝试在heroku上部署我的简单django项目但我不明白如何解决这个问题这是git push heroku master remote Traceback most recent call last remote File tmp
Biopython 可以执行 Seq.find() 来解释歧义代码吗

我希望能够在 Seq 对象中搜索考虑歧义代码的子序列 Seq 对象例如以下内容应该是正确的 from Bio Seq import Seq from Bio Alphabet IUPAC import IUPACAmbiguousDNA

随机推荐

获取两个不同日期列的计数并按日期分组

我有包含两个 DATE 列的表 TS customer 和 TS verified 我正在寻找一种方法来获取结果在第一列中我有某人创建用户 TS customer 或某人经过验证 TS verified 的日期在第二列中我希望 co
如何在 Node.js 中将 HTML 转换为图像

我需要在 Node 服务器上将 HTML 模板转换为图像服务器将以字符串形式接收 HTML 我尝试过 PhantomJS 使用一个名为 Webshot 的库但它不能很好地与 Flex 框和现代 CSS 配合使用我尝试使用 Chrome
UITableView 的 reloadRowsAtIndexPaths: (NSArray *) indexPaths 无法导致重新加载，除非您调用它两次？

我有一个 UITableViewController 管理 iPad 应用程序中的 UITableView 对象表格视图与相当复杂的其他对象群联系在一起当我要求它重新加载行时遇到问题如下所示 indexPath is an NSInd
如何从 angularJS 模板调用encodeURIComponent？

我的 Angular JS 模板中有一个块 a href foos foo id foo name a 但是 foo id 属性有时可能包含时髦字符我想做这样的事情 a href foos encodeURIComponent foo i
ASP.NET：WebService 类实例化的频率是多少？如何在其中制作一个持久对象？

一个简单的问题但我在谷歌上找不到答案 Web 服务类实例化的频率是多少是每次调用 Web 服务一次还是每次任意时间段一次还是每次其他事情一次 EDIT 我本来希望这个班级能长久地生活下去但事实似乎并非如此关键是我有一个用于
如何在 React JS 组件中预加载图像？

我目前正在渲染一个子组件signInError发生这signInError存储在父组件中如果不为 null 则渲染
绑定到多个索引器

我正在尝试将索引属性与两个索引器绑定该属性看起来像这样 public Item this int x int y get return items x y set items x y value 根据http msdn microsoft
不允许从函数返回函数。我怎么能？

8 3 5 8 Functions dcl fct says 函数的返回类型不得为类型数组或function 尽管它们可能具有指针类型的返回类型或对此类事物的引用为什么规则这么明确是否有某种语法甚至允许返回函数而不是函数指针我是否误
是否可以使用脚本标签加载车把模板？或者在 Ember.js 中以编程方式定义车把模板

很简单我不想在 html 文件中定义所有车把模板我试过这个但这没有用我是否可以不以编程方式定义模板甚至只是加载车把文件以便我可以重用而且我觉得这使事情更易于维护我尝试用 ajax 加载它们并将它们附加到头部这工作正常我可
隐藏浏览器地址栏而不重新加载

我想动态通过 JavaScript 隐藏地址栏我意识到这可以在打开弹出窗口时完成但在这种情况下我没有奢侈文件是从本地磁盘打开的我不希望地址栏显示可怕且令人困惑的文件等网址这可能吗如果可能的话如何实现窗口打开后就无法更改这
如何在 Spring Boot 中访问 application.properties 文件中定义的值

我想访问中提供的值application properties e g logging level org springframework web DEBUG logging level org hibernate ERROR loggin
在r包中重新导出数据集

In R包有可能重新导出函数这使得很容易回收相同的函数而不必在不同的包之间重复代码例如 devtools session info函数是重新导出sessioninfo session info export importFrom s
如何在 Android 上禁用 HTML 输入中的自动更正？

我无法在 Android 上的网络浏览器中禁用文本输入的自动更正我试过这个
textFieldDidChangeSelection：在视图更新期间修改状态，这将导致未定义的行为

这是我的代码 struct CustomTextField UIViewRepresentable var placeholder String Binding var text String func makeUIView context
敲除映射导致堆栈溢出

我正在尝试淘汰赛和映射插件并想知道为什么这不起作用我有一个要使用映射扩展加载的视图模型 function todoListViewModel data ko mapping fromJSON data todos TodoItem op
为什么 PCRE 正则表达式比 C++11 正则表达式快得多

一些示例代码这是使用 cregex iterator 的 c 11 部分 std chrono steady clock time point begin0 std chrono steady clock now regex re
PHP 从表行中检索数据并将其存储到变量

我想这些问题已经说明了一切我的查询结果会生成与条件匹配的行我想从每个表列中获取每个数据并将其放入一个变量中 getinfo select user firstname user middlename user lastname from
在 Django 中上传文件

我在 Django 1 6 版本中上传文件时遇到问题当我尝试做的时候new file data save 在我的views py 中我收到此错误 quiz patent 22 medical record 2 exams 处的属性错误
C++：创建一个由用户输入大小的数组

我想知道我们是否可以创建一个具有用户指定大小的数组 Ex int a cout lt lt Enter desired size of the array cin gt gt a int array a 上面的程序将不起作用因为数组大小必
包含可变数据的正则表达式 - ply.lex

我正在使用 python 模块ply lex编写一个词法分析器我用正则表达式指定了一些标记但现在我卡住了我有一个list of Keywords谁应该是token data是一个包含大约 1000 个关键字的列表这些关键字都应该被识

包含可变数据的正则表达式 - ply.lex

包含可变数据的正则表达式 - ply.lex 的相关文章

随机推荐

热门标签