Python 正则表达式中的重音字符

2024-01-01

这是我的代码

# -*- coding: utf-8 -*-
import json
import re

with open("/Users/paul/Desktop/file.json") as json_file:
    file = json.load(json_file)
print file["desc"]

key="capacità"
result = re.findall("((?:[\S,]+\s+){0,3})"+key+"\s+((?:[\S,]+\s*){0,3})", file["desc"], re.IGNORECASE)
print result

这是文件的内容

{
    "desc": "Frigocongelatore, capacit\u00e0 di 215 litri, h 122 cm, classe A+"
}

我的结果是[]

但我想要的是 result = "capacità"


您需要将字符串视为 Unicode 字符串,如下所示:

str = u"Frigocongelatore, capacit\u00e0 di 215 litri, h 122 cm, classe A+"

正如你所看到的,如果你print str.encode('utf-8')你会得到:

Frigocongelatore, capacità di 215 litri, h 122 cm, classe A+

同样的方式,你可以使你的正则表达式字符串成为unicode或原始字符串u or r分别。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Python 正则表达式中的重音字符 的相关文章

  • 如何正确地将 MIDI 刻度转换为毫秒?

    我正在尝试将 MIDI 刻度 增量时间转换为毫秒 并且已经找到了一些有用的资源 MIDI Delta 时间刻度到秒 http www lastrayofhope co uk 2009 12 23 midi delta time ticks
  • 如何使用 imaplib 获取“消息 ID”

    我尝试获取一个在操作期间不会更改的唯一 ID 我觉得UID不好 所以我认为 Message ID 是正确的 但我不知道如何获取它 我只知道 imap fetch uid XXXX 有人有解决方案吗 来自 IMAP 文档本身 IMAP4消息号
  • Argparse nargs="+" 正在吃位置参数

    这是我的解析器配置的一小部分 parser add argument infile help The file to be imported type argparse FileType r default sys stdin parser
  • 从零开始的 numpy 形状意味着什么

    好的 我发现数组的形状中可以包含 0 对于将 0 作为唯一维度的情况 这对我来说是有意义的 它是一个空数组 np zeros 0 但如果你有这样的情况 np zeros 0 100 让我很困惑 为什么这么定义呢 据我所知 这只是表达空数组的
  • Perl:正则表达式不抓取代码中的多行 C 风格注释

    我有一个 Perl 程序 读取用 C 编写的 SRC 文件 使用 SRC 文件中的正则表达式匹配来查找特定格式的数据以用作目标文件名 打开新的目标文件 执行另一个正则表达式匹配以查找包含关键字 abcd 的所有 C 风格注释 注意 这些注释
  • 从 python 发起 SSH 隧道时出现问题

    目标是在卫星服务器和集中式注册数据库之间建立 n 个 ssh 隧道 我已经在我的服务器之间设置了公钥身份验证 因此它们只需直接登录而无需密码提示 怎么办 我试过帕拉米科 它看起来不错 但仅仅建立一个基本的隧道就变得相当复杂 尽管代码示例将受
  • Seaborn Pairplot 图例不显示颜色

    我一直在学习如何在Python中使用seaborn和pairplot 这里的一切似乎都工作正常 但由于某种原因 图例不会显示相关的颜色 我无法找到解决方案 因此如果有人有任何建议 请告诉我 x sns pairplot stats2 hue
  • 在 pytube3 中获取 youtube 视频的标题?

    我正在尝试构建一个应用程序来使用 python 下载 YouTube 视频pytube3 但我无法检索视频的标题 这是我的代码 from pytube import YouTube yt YouTube link print yt titl
  • Pandas 根据 diff 列形成簇

    我正在尝试使用 Pandas 根据表示时间 以秒为单位 的列中的差异来消除数据框中的一些接近重复项 例如 import pandas as pd numpy as np df pd DataFrame 1200 1201 1233 1555
  • 如何使用列表作为pandas数据框中的值?

    我有一个数据框 需要列的子集包含具有多个值的条目 下面是一个带有 运行时 列的数据框 其中包含程序在各种条件下的运行时 df condition a runtimes 1 1 5 2 condition b runtimes 0 5 0 7
  • 无法在 osx-arm64 上安装 Python 3.7

    我正在尝试使用 Conda 创建一个带有 Python 3 7 的新环境 例如 conda create n qnn python 3 7 我收到以下错误 Collecting package metadata current repoda
  • Oracle REGEXP_INSTR() 和“a-z”字符范围与预期不匹配

    我想用REGEXP INSTR 在 oracle 数据库中检查小写 大写字符 我知道 upper and lower POSIX 字符类 但我选择了a z这给了我非常奇怪的结果 我不明白 有人可以解释一下吗 SELECT REGEXP IN
  • 当鼠标悬停在上面时,intellisense vscode 不显示参数或文档

    我正在尝试将整个工作流程从 Eclipse 和 Jupyter Notebook 迁移到 VS Code 我安装了 python 扩展 它应该带有 Intellisense 但它只是部分更糟糕 我在输入句点后收到建议 但当将鼠标悬停在其上方
  • 从字符串中获取数字

    我有一个字符串 例如 lorem 110 ipusm 我想获取 110 我已经尝试过这个 preg match all 0 9 string ret 但这正在返回 Array 0 gt 1 1 gt 1 2 gt 0 我想要这样的东西 Ar
  • 您可以将操作直接应用于map/reduce/filter 中的参数吗?

    map and filter通常可以与列表理解互换 但是reduce并不那么容易被交换map and filter 此外 在某些情况下我仍然更喜欢函数语法 但是 当您需要对参数本身进行操作时 我发现自己正在经历语法体操 最终必须编写整个函数
  • Python 无法使用套接字绑定我的外部/公共 IP 地址,给出错误但是当使用本地 IP 地址时,错误不会显示

    这是出现主要错误的代码 与我的本地 IP 的绑定将起作用 s bind 192 168 1 4 port 与我的公共 IP 的绑定失败并出现以下错误 s bind 99 99 99 99 port WinError 10049 请求的地址在
  • 从 Twitter API 2.0 获取 user.fields 时出现问题

    我想从 Twitter API 2 0 端点加载推文 并尝试获取标准字段 作者 文本 和一些扩展字段 尤其是 用户 字段 端点和参数的定义工作没有错误 在生成的 json 中 我只找到标准字段 但没有找到所需的 user fields 用户
  • 列表值的意外更改

    这是我的课 class variable object def init self name name alias parents values table name of the variable self name 这是有问题的函数 f
  • 迭代 pandas 数据框的最快方法?

    如何运行数据框并仅返回满足特定条件的行 必须在之前的行和列上测试此条件 例如 1 2 3 4 1 1 1999 4 2 4 5 1 2 1999 5 2 3 3 1 3 1999 5 2 3 8 1 4 1999 6 4 2 6 1 5 1
  • 您可以使用关键字参数而不提供默认值吗?

    我习惯于在 Python 中使用这样的函数 方法定义 def my function arg1 None arg2 default do stuff here 如果我不供应arg1 or arg2 那么默认值None or default

随机推荐

  • Alembicbulk_insert 到带有模式的表

    我正在看这个例子批量插入 https alembic readthedocs org en rel 0 1 ops html alembic op bulk insert Create an ad hoc table to use for
  • 使用 psycopg2 连接到 Google Cloud SQL Postgres 实例

    我正在尝试使用 psycopg2 连接到 Google Cloud SQL Postgres 我创建了一个 postgreSQL 实例并使用默认数据库postgres目前 我可以从 pgadmin 工具以及 gcloud shell 进行连
  • PHP HTML 到 PDF 按比例转换 [关闭]

    很难说出这里问的是什么 这个问题是含糊的 模糊的 不完整的 过于宽泛的或修辞性的 无法以目前的形式得到合理的回答 如需帮助澄清此问题以便重新打开 访问帮助中心 help reopen questions 我正在使用 PHP MySQL 和
  • 使用 CodeIgniter 通过 Google 帐户发送电子邮件

    我正在尝试使用 CodeIgniter 发送电子邮件smtp googlemail com 代码没有问题 但 Google 阻止我发送该电子邮件 这是我在 Google 帐户上收到的电子邮件 第三方最近尝试使用应用程序连接到您的 谷歌帐户
  • 使用管道屏障代替信号量

    我想确保我正确理解管道障碍 因此 只要第二个屏障的源阶段晚于第一个屏障的目标阶段 屏障就能够同步两个命令缓冲区 它是否正确 当然 如果命令缓冲区在管道的不同迭代期间执行 我将需要使用信号量 在我看来 同步是 Vulkan 中最难掌握的部分
  • ./configure --enable-shared 在 python altinstall 期间到底做了什么?

    当我使用 altinstall python 2 7 12 时 configure prefix opt python enable shared 它显示为 python 2 7 5 系统默认 python 但没有 启用共享 它显示为 2
  • 使用 data.table 查找重叠间隔组

    我有多个间隔 需要找到哪些间隔可以形成一个连续的组 在此 MWE 中 我有 Interval id Interval start 和 Interval end 我想计算 Wanted column DT lt data table Inte
  • Android:以编程方式创建滑动手势事件

    我一直试图在谷歌上找到这个特定案例的答案 但令人惊讶的是在任何地方都找不到它 只有关于检测的答案 而不是关于创建 滑动的答案 我想在屏幕上实际 运行 从右到左的模拟滑动 无论在哪里 但最好是从右边缘到左 我尝试了类似的方法 但我得到了 NP
  • Sed - 替换每行最后出现的匹配项

    所以我有以下文件 Carlton 3053 Carlton North 3054 Docklands 3008 East Melbourne 3002 Flemington 3031 Kensington 3031 Melbourne 30
  • ios9 中日期选择器不正确

    早上好 我在 ios 9 swift 2 中的日期选择器有问题 this is how my datepicker looks like in ios 8 swift 2 OK and this is my datepicker in io
  • 从 QuickTime MOV 文件解析 h.264 NAL 单元

    我正在尝试从 iPhone 上的 MOV 文件获取 h 264 NAL 单位 以便将 RTP h 264 视频从 iPhone 摄像头传输到服务器 Apple 的 API 不允许直接访问来自相机输出的编码比特流 因此我只能在写入 MOV 文
  • 在 EF4 中使用 NOLOCK 提示?

    我们正在评估 EF4 我的 DBA 说我们必须在所有 SELECT 语句中使用 NOLOCK 提示 因此 我正在研究如何在使用 EF4 时实现这一点 我读过关于如何在 EF4 中实现这一点的不同想法 但所有这些似乎都是一种变通方法 并未得到
  • 验证..让我发疯

    每次我运行我的应用程序 设备或模拟器是相同的 即使没有对代码进行任何更改 我也会从最大的 Activity 中得到每个方法 W art Verification of void com xyz abx setCredit boolean t
  • Python XML 解析网站

    我正在尝试从网站解析 我被困住了 我将在下面提供 XML 它来自一个网站 我有两个问题 从网站读取 xml 的最佳方法是什么 然后我在挖掘 xml 以获得我需要的速率时遇到了麻烦 我需要返回的数字是 Base OBS VALUE 0 12
  • 在 R 中创建桑基图;使绘图输出可解释

    我第一次使用 R 创建桑基图 显示前因事件和后继事件之间的联系以及它们发生的次数 这是我正在使用的数据类型的模拟示例 df creation df lt structure list Antecedent c Activity 1 Acti
  • 如何减少内存使用并加快代码速度

    我正在使用包含 5 列和超过 9000 万行的庞大数据集 该代码对于部分数据工作正常 但是当涉及到整个数据时 我得到了内存错误 我读过有关生成器的内容 但它对我来说似乎非常复杂 我可以根据这段代码得到解释吗 df pd read csv D
  • PowerShell - 在远程计算机上执行脚本时出现错误

    以下内容对我不起作用 WINDIR System32 WindowsPowerShell v1 0 powershell exe NoProfile Noninteractive command Invoke Command Compute
  • Android Honeycomb 中的操作栏样式

    我想使用主题和样式设置操作栏 蜂窝 的背景 你可以用代码来完成ActionBar setBackgroundDrawable Drawable 但是找不到对应的样式属性 我尝试过使用这个主题和风格Activity 但这会
  • 重构建议:映射到 POJO

    我目前参与的一个项目有一个这样的界面 public interface RepositoryOperation public OperationResult execute Map
  • Python 正则表达式中的重音字符

    这是我的代码 coding utf 8 import json import re with open Users paul Desktop file json as json file file json load json file p