错误：该位置没有任何可重复的内容

2023-12-02

我有一个文本文件，其中包含俚语及其用真正的英语替代的列表。我使用“：”作为分割点将此文本文件转换为字典，并且在转换后打印字典时一切似乎都正常。

但是，源自此行的错误：slangs_re = re.compile('|'.join(slang_dict.keys())) says nothing to repeat at position 112207.

在尝试调试时，我发现该错误以某种方式与字典相关。这是因为当我运行下面的代码时，我没有得到正确的输出，但也没有得到错误。此代码的预期输出是“fitness”，但实际输出是“fitess”。

import re

test = "fitess"

slang_dict = {"fitess":"fitness", "damm":"damn"}

slangs_re = re.compile('|'.join(slang_dict.keys()))

def correct_slang(s, slang_dict=slang_dict):
    def replace(match):
        return slang_dict[match.group(0)]

    return slangs_re.sub(replace, s)

test = correct_slang(test)
print(test)

这是带有字典的代码（抱歉，文本文件太大，无法包含在内。示例可用here）。预期输出是“fitness”，但实际输出是错误：

import re

test = "fitess"

file = open("slang_conversion.txt","r")

slang_dict = {}

for line in file:
    x = line.split(":")
    a = x[0]
    b = x[1]
    c = len(b) - 1

    b = b[0:c]

    slang_dict[a] = b

slangs_re = re.compile('|'.join(slang_dict.keys())) # <-- error

def correct_slang(s, slang_dict=slang_dict):
    def replace(match):
        return slang_dict[match.group(0)]

    return slangs_re.sub(replace, s)

test = correct_slang(test)

print(test)

在阅读其他 SO 线程后，我发现在某些情况下这是一个错误，但在这种情况下似乎不是一个错误。

谢谢

我建议更换

slangs_re = re.compile('|'.join(slang_dict.keys()))

with

slangs_re = re.compile(r"(?<!\w)(?:{})(?!\w)".format('|'.join([re.escape(x) for x in slang_dict])))

并确保传递按长度降序排列的键。

from collections import OrderedDict
import re

test = "fitess no kome*"

slang_dict = {"Aha aha":"no", "fitess":"fitness", "damm":"damn", "kome*":"come", "ow wow":"rrf"}
slang_dict = OrderedDict(sorted(slang_dict.iteritems(), key=lambda x: len(x[0]), reverse=True))

slangs_re = re.compile(r"(?<!\w)(?:{})(?!\w)".format('|'.join([re.escape(x) for x in slang_dict])))
def correct_slang(s, slang_dict=slang_dict):
    def replace(match):
        return slang_dict[match.group(0)]

    return slangs_re.sub(replace, s)

test = correct_slang(test)
print(test)

See the Python演示

这会将术语作为整个单词进行检查，并转义每个搜索短语中的特殊字符，以便将它们传递到正则表达式引擎时不会出现问题。

如果您对全字匹配不感兴趣，请删除(?<!\w)（检查前导词边界）和(?!\w)（检查尾随字边界）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

regex

debugging

Dictionary

错误：该位置没有任何可重复的内容的相关文章

Django 模型在模板中不可迭代

我试图迭代模型以获取列表中的第一个图像但它给了我错误即模型不可迭代以下是我的模型和模板的代码我只需要获取与单个产品相关的列表中的第一个图像模型 py class Product models Model title models
忽略 Mercurial hook 中的某些 Mercurial 命令

我有一个像这样的善变钩子 hooks pretxncommit myhook python path to file myhook 代码如下所示 def myhook ui repo kwargs do some stuff 但在我的例子中
如何创建一个语句来打印以特定单词开头的单词？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案如何在 python 中打印从特定字母开始的单词而不使用函数而是使用方法或循环 1 我有一个字符串想要打印以 m 开头的单词 S
以同步方式使用 FastAPI，如何获取 POST 请求的原始正文？

在中使用 FastAPIsync not async模式我希望能够接收 POST 请求的原始未更改的正文我能找到的所有例子都显示async代码当我以正常同步方式尝试时 request body 显示为协程对象当我通过发布一些内容来
在Python中调整图像大小

我有一张尺寸为 288 352 的图像我想将其大小调整为 160 240 我尝试了以下代码 im imread abc png img im resize 160 240 Image ANTIALIAS 但它给出了一个错误TypeErro
如何通过在 Python 3.x 上按键来启动和中断循环

我有这段代码当按下 P 键时会中断循环但除非我按下非 P 键否则循环不会工作 def main openGame while True purchase imageGrab if a sum gt 1200 fleaButton ti
如何解决使用 Spark 从 S3 重新分区大量数据时从内存中逐出缓存的表分区元数据的问题？

在尝试从 S3 重新分区数据帧时我收到一个一般错误 Caused by org apache spark SparkException Job aborted due to stage failure Task 33 in stage 1
如何设置 Celery 来调用自定义工作器初始化？

我对 Celery 很陌生我一直在尝试设置一个具有 2 个独立队列的项目一个用于计算另一个用于执行到目前为止一切都很好我的问题是执行队列中的工作人员需要实例化一个具有唯一 object id 的类每个工作人员一个 id 我想知
首先对列表中最长的项目进行排序

我正在使用 lambda 来修改排序的行为 sorted list key lambda item item lower len item 对包含元素的列表进行排序A1 A2 A3 A B1 B2 B3 B 结果是A A1 A2 A3 B
将 matplotlib 颜色图集中在特定值上

我正在使用 matplotlib 颜色图 seismic 绘制绘图并且希望白色以 0 为中心当我在不进行任何更改的情况下运行脚本时白色从 0 下降到 10 我尝试设置 vmin 50 vmax 50 但在这种情况下我完全失去了白色关
如何在 python 中没有 csv.reader 迭代器的情况下解析单行 csv 字符串？

我有一个 CSV 文件需要重新排列和重新编码我想跑 line line decode windows 1250 encode utf 8 在由 CSV 读取器解析和分割之前的每一行或者我想自己迭代行运行重新编码并仅使用单行解析表单
无法在 osx-arm64 上安装 Python 3.7

我正在尝试使用 Conda 创建一个带有 Python 3 7 的新环境例如 conda create n qnn python 3 7 我收到以下错误 Collecting package metadata current repoda
使用 Firefox 绕过弹出窗口下载文件：Selenium Python

我正在使用 selenium 和 python 来从中下载某些文件web page http www oceanenergyireland com testfacility corkharbour observations 我之前一直使用设
如何在 OSX 上安装 numpy 和 scipy？

我是 Mac 新手请耐心等待我现在使用的是雪豹 10 6 4 我想安装numpy和scipy 所以我从他们的官方网站下载了python2 6 numpy和scipy dmg文件但是我在导入 numpy 时遇到问题 Library F
默认情况下，Keras 自定义层参数是不可训练的吗？

我在 Keras 中构建了一个简单的自定义层并惊讶地发现参数默认情况下未设置为可训练我可以通过显式设置可训练属性来使其工作我无法通过查看文档或代码来解释为什么会这样这是应该的样子还是我做错了什么导致默认情况下参数不可训练代码 im
当鼠标悬停在上面时，intellisense vscode 不显示参数或文档

我正在尝试将整个工作流程从 Eclipse 和 Jupyter Notebook 迁移到 VS Code 我安装了 python 扩展它应该带有 Intellisense 但它只是部分更糟糕我在输入句点后收到建议但当将鼠标悬停在其上方
使用正则表达式查找并替换（批处理.BAT）

我想在多个文本文件中进行查找替换如何使用 BAT 实现自动化我还需要正则表达式示例查找
如何读取Python字节码？

我很难理解 Python 的字节码及其dis module import dis def func x 1 dis dis func 上述代码在解释器中输入时会产生以下输出 0 LOAD CONST 1 1 3 STORE FAST 0 x
列表值的意外更改

这是我的课 class variable object def init self name name alias parents values table name of the variable self name 这是有问题的函数 f
迭代 pandas 数据框的最快方法？

如何运行数据框并仅返回满足特定条件的行必须在之前的行和列上测试此条件例如 1 2 3 4 1 1 1999 4 2 4 5 1 2 1999 5 2 3 3 1 3 1999 5 2 3 8 1 4 1999 6 4 2 6 1 5 1

随机推荐

我们可以在哪里放置 crossdomain.xml

您好我已在应用程序 http myserver 11090 apps 上部署了我的 Flex 应用程序并使用重定向到应用程序服务器的代理服务器 Web 服务器 https mysite site com 但在运行时应用程序在位置 htt
SQLite3 错误 - iOS

当我进行 SQL 调用时如何找出 SQLite3 给我的错误 int success sqlite3 prepare v2 database sql 1 stmt NULL if success SQLITE OK NSLog creat
没有 fill_diagonal 的 inf 的 Python 矩阵对角线

我需要将矩阵的对角线元素设置为 Inf 一个简单的方法是使用np fill diagonal np fill diagonal my matrix float inf However fill diagonal修改输入矩阵而不是返回填充对
想要删除 Browser.sleep()

大家好我正在使用量角器来测试非角度网站最初在测试时我有browser sleep 这样页面就可以完全加载我知道添加 browser sleep 不是一个好的测试方法因此想从代码中删除它我尝试了 browser wait 但出现错误
匹配第 n 次出现（排除最后一次出现）

我有一个关于正则表达式的问题我不知道为什么我不能执行以下操作例句 This is a test string with five t s 我使用的正则表达式 t 3 我希望正则表达式匹配以下内容 This is a test s 但它不
如何在列中打印嵌套的Python列表

我有一个程序它生成一个Python列表作为其输出该列表是一个嵌套列表列表名称地址电话号码的列表我希望能够以柱状格式打印似乎在陈述问题时是一个非常简单的想法但我一直无法找到一种简单的方法来从列表中提取数据如果我打印列表
检查套件完成后如何触发 Github 工作流程？

我只想在特定工作流程完成时触发工作流程有人知道该怎么做吗一些背景我有一个工作流程Tests另一个叫Build feature 我运行我的Tests每个 PR 到分支的工作流程feature 如果某些内容被推送合并到分支feature
几个 catch 块还是一个带有dynamic_cast 的catch 块？

我们有一个异常类的层次结构有一个GenericException类以及从它派生的许多类 GenericException是多态的它有一个虚拟析构函数派生类之一是FileException抛出以指示操作文件系统对象时出现错误 FileE
PHP 中“&$var”中的“&”是什么意思？ [复制]

这个问题在这里已经有答案了什么是意思是在 var in PHP 有人可以帮我进一步解释一下吗先感谢您这意味着传递变量参考而不是传递变量的值这意味着当程序流返回到调用代码时对 preparse tags 函数中该参数的任何更改都
使用react-router的history.push()和自定义URL参数

我正在尝试创建一个用户可以加入群组的应用程序我拥有的页面之一是群组仪表板为此我创建了一个 URL 参数为 id 的路由
禁止带有 `static_assert` 的函数

我想阻止某些函数被调用让我们忽略通过函数指针或其他东西调用函数的情况只关注直接函数调用的情况我可以这样做 delete 然而发布的诊断信息并不丰富我考虑过使用static assert 您可以使用它提供自定义诊断消息我放置了一个
将二维数组（字符串）存储到文件并检索它

我制作了一个简单的程序其中有一个存储大量数据的 2D 字符串数组我搜索了很多地方来了解如何存储和检索二维数组我想在程序结束时将数据保存在数组中并在程序启动时检索该数据我努力了 ObjectOutputStream toFile n
如何将 java.lang.String 的空白 JSON 字符串值反序列化为 null？

我正在尝试将一个简单的 JSON 反序列化为 java 对象然而我却变得空虚String值java lang String属性值在其余属性中空白值将转换为null值这就是我想要的下面列出了我的 JSON 和相关的 Java 类 J
从 python 中的标签名称中抓取数据

您好我正在尝试从网站上抓取用户数据我需要用户 ID 该 ID 可在标签名称本身中找到我正在尝试使用 python selenium 和 beautiful soup 中的 UID 来抓取div tag Example lt div i
使用 Android 本机应用程序中的 ADAL 库对 Azure AD 上的用户进行身份验证

我们有一个要求用户应该从本机应用程序 Android iOS 登录而不从应用程序调用 Microsoft 登录 Web 视图窗口我们有示例代码演示使用 net 控制台应用程序中的用户名和密码对 Azure AD 进行非交互式身份验证
FreeSwitch + Mode Verto + Webrtc + Android + 无法从 android 拨打电话

我做了一个mode verto安卓客户端使用WebRtc 预建库 org webrtc google webrtc 1 0 libjingle io pristine libjingle 11139 aar and 自由切换但只成功进行单
启动 JavaFX 应用程序时的内部 NPE

所以基本上我开始了一个虚拟的 JavaFX 项目只是为了为我的实际问题实现一个简约的示例但现在我什至无法再运行那个简约的项目也没有收到足够的错误信息来自己用谷歌搜索出来所以现在当我运行代码时我收到给定的错误堆栈这不会引导我到任
Biztalk 和调用 Web 服务的最佳方式

我正在编写一个 biztalk 编排需要调用一个 Web 服务可能是多个 Web 服务而且可能不止一次我面前有两个选择一在单独的代码项目中使用 wsdl 并从表达式形状的代码中调用 Web 服务二从 Biz 使用它获取架构
无法在 MySQL 中获得正确的编码

一段时间以来我一直在努力解决 MySQL 中的编码问题我正在建立一个数据库其中不仅包含拉丁文还包含西里尔文和阿拉伯文文本这是我如何创建数据库的示例 CREATE DATABASE db1 DEFAULT CHARACTER SET
错误：该位置没有任何可重复的内容

我有一个文本文件其中包含俚语及其用真正的英语替代的列表我使用作为分割点将此文本文件转换为字典并且在转换后打印字典时一切似乎都正常但是源自此行的错误 slangs re re compile join slang dict key

错误：该位置没有任何可重复的内容

错误：该位置没有任何可重复的内容 的相关文章

随机推荐

热门标签

错误：该位置没有任何可重复的内容的相关文章