与区域指示符字符类匹配的 python 正则表达式

2024-05-18

我在 Mac 上使用 python 2.7.10。表情符号中的标志由一对表示区域指示符号 https://en.wikipedia.org/wiki/Regional_Indicator_Symbol。我想编写一个 python 正则表达式来在一串表情符号标志之间插入空格。

例如，该字符串是两个巴西国旗：
- u"\U0001F1E7\U0001F1F7\U0001F1E7\U0001F1F7"
- 它将呈现如下：????????????????

我想在任意一对区域指示符符号之间插入空格。像这样的东西：

re.sub(re.compile(u"([\U0001F1E6-\U0001F1FF][\U0001F1E6-\U0001F1FF])"),
       r"\1 ", 
       u"\U0001F1E7\U0001F1F7\U0001F1E7\U0001F1F7")

...这将导致：

u"\U0001F1E7\U0001F1F7 \U0001F1E7\U0001F1F7 "

...但是该代码给了我一个错误：

sre_constants.error: bad character range

（我认为）出现问题的提示如下，它表明 \U0001F1E7 正在正则表达式中变成两个“字符”：

re.search(re.compile(u"([\U0001F1E7])"),
          u"\U0001F1E7\U0001F1F7\U0001F1E7\U0001F1F7").group(0)

这导致：

u'\ud83c'

遗憾的是我对 unicode 的理解太薄弱，无法取得进一步的进步。

我相信您在 Windows 或 Mac 中使用 Python 2.7，它具有窄 16 位 Unicode 版本 - Linux/Glibc 通常具有 32 位完整 Unicode，Python 3.5 在所有平台上也具有宽 Unicode。

您看到的是一个代码被分成一对代理对。不幸的是，这也意味着您无法轻松地使用单个字符类来完成此任务。不过，这仍然是可能的。的 UTF-16 表示U+1F1E6 (????) http://www.fileformat.info/info/unicode/char/1f1e6/index.htm is \uD83C\uDDE6，以及U+1F1FF (????) http://www.fileformat.info/info/unicode/char/1f1ff/index.htm is \uD83C\uDDFF.

我什至根本无法访问此类 Python 构建，但你可以尝试

\uD83C[\uDDE6-\uDDFF]

作为单一的替代品[\U0001F1E6-\U0001F1FF]，因此你的整个正则表达式将是

(\uD83C[\uDDE6-\uDDFF]\uD83C[\uDDE6-\uDDFF])

字符类不起作用的原因是它尝试创建从第一个代理对的后半部分到第二个代理对的前半部分的范围 - 这失败了，因为范围的开头按字典顺序大于结束。

然而，这个正则表达式在 Linux 上仍然不起作用，你需要使用原来的正则表达式，因为 Linux 版本默认使用 Wide unicode。

或者，将 Windows Python 升级到 3.5 或更高版本。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

与区域指示符字符类匹配的 python 正则表达式的相关文章

在Python3.6中调用C#代码

由于完全不了解 C 编码我希望在我的 python 代码中调用 C 函数我知道有很多关于同一问题的问答但由于一些奇怪的原因我无法从示例 python 模块导入简单的 c 类库以下是我所做的事情 C 类库设置我使用的是 VS 20
在 Numpy 中切片后确定结果数组的形状

我很难理解在 numpy 中切片后如何确定结果数组的形状例如我使用以下简单代码 import numpy as np array np arange 27 reshape 3 3 3 slice1 array 1 2 1 slice2
一次将Python dict的内容分配给多个变量？

我想做这样的事情 def f return a 1 b 2 c 3 a b f or a b f IE 这样 a 被分配为 1 b 被分配为 2 并且 c 是未定义的这与此类似 def f return 1 2 a b f 依赖于变量名称
on_delete=models.PROTECT 和 on_delete=models.CASCADE 在 Django 模型上有什么作用？

我对 Django 很熟悉但最近注意到有一个on delete models CASCADE and on delete models PROTECT模型的选项 on delete models CASCADE and on delete
如何确定非阻塞套接字是否真正连接？

这个问题不仅限于Python 这是一个一般的套接字问题我有一个非阻塞套接字想要连接到一台可访问的机器在另一端该端口不存在为什么 select 仍然成功我预计会超时 sock send 因管道损坏而失败 select 之后如何确定
python 中分割字符串以获得一个值？

需要帮助假设我在名为 input 的变量中有一个字符串 Sam Person name kind input split 通过执行上述操作我得到两个具有不同字符串 Sam 和 Person 的变量有没有办法只获取第一个值 name S
为什么 Python 中的“pip install”会引发语法错误？

我正在尝试使用 pip 安装软件包我试着跑pip install从Python shell 但我得到了SyntaxError 为什么我会收到此错误如何使用 pip 安装软件包 gt gt gt pip install selenium
sudo pip install python-Levenshtein 失败，错误代码 1

我正在尝试在 Linux 上安装 python Levenshtein 库但每当我尝试通过以下方式安装它时 sudo pip install python Levenshtein 我收到此错误命令 usr bin python c 导入
定义函数后对其进行修饰？

I think答案是否定的但我似乎找不到明确的说法我有以下情况 def decorated function function functools wraps function def my function print Hello s
在径向（树）网络x图中查找末端节点（叶节点）

给定下图是否有一种方便的方法来仅获取末端节点我所说的端节点是指那些具有一个连接边的到节点我认为这些有时被称为叶节点 G nx DiGraph fromnodes 0 1 1 1 1 1 2 3 4 5 5 5 7 8 9 10 ton
htaccess 301 重定向 - 删除查询字符串 (QSA)

我一直在努力处理一些 htaccess 重定向我只是花了一些时间在堆栈上阅读和搜索但无法获得适合我的场景的答案我正在将旧客户端网站的 301 重定向到新客户端旧页面有参数查询我想从网址中删除它 menu php idCategor
matplotlib matshow 标签

我一个月前开始使用 matplotlib 所以我仍在学习我正在尝试用 matshow 制作热图我的代码如下 data numpy array a reshape 4 4 cax ax matshow data interpolation
Python 中的 @staticmethod 与 @classmethod

方法和方法有什么区别装饰的 https peps python org pep 0318 with staticmethod http docs python org library functions html staticmethod和
在可编辑的QSqlQueryModel中实现setEditStrategy

这是后续这个问题 https stackoverflow com questions 49752388 editable qtableview of complex sql query 在那里我们创建了 QSqlQueryModel 的可
Django 在选择列表更改时创建毫无意义的迁移

我正在尝试使用可调用创建一个带有选择字段的模型以便 Django 在选择列表更改时不会创建迁移如中所述this https stackoverflow com questions 31788450 stop django from cr
无法截取宽度为 0 的屏幕截图

我正在尝试截取 Bootstrap 模态内元素的屏幕截图经过一番努力我终于想出了这段代码 driver get https enlinea sunedu gob pe driver find element by xpath div c
查找给定节点的最高权重边

我在 NetworkX 中有一个有向图边缘的权重从 0 到 1 表示它们发生的概率网络连通性非常高所以我想修剪每个节点的边缘只保留最高概率的节点我不确定如何迭代每个节点并仅保留最高权重in edges在图中有没有一个networ
如何通过字符串匹配加速 pandas 行过滤？

我经常需要过滤 pandas 数据框df by df df col name string value 并且我想加快行选择操作有没有快速的方法可以做到这一点例如 In 1 df mul df 3000 2000 3 reset inde
如何将列表字典写入字符串而不是 CSV 文件？

This 堆栈溢出问题 https stackoverflow com questions 37997085 how to write a dictionary of lists to a csv file将列表字典写入 CSV 文件的答案
Django South - 将 null=True 字段转换为 null=False 字段

我的问题是转变的最佳做法是什么null True场变成null False使用 Django South 的字段具体来说我正在与ForeignKey 你应该先写一个数据迁移 http south aeracode org docs t

随机推荐

Android Fragment onCreateView 与手势

我正在尝试在片段中使用手势我在 FragmentActivity 中有以下内容来处理我的详细信息片段我试图发生的情况是当在视图上检测到滑动时将该视图内的数据替换为上一个或下一个条目如果有更好的方法来处理这个问题我完全同意然而
必须为开发人员设定目标，即使目标不起作用[关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案 It is 大致接受 http www joelonsoftware com news 20020715 html that 设定可衡量的目标 htt
如何使 d3 饼图响应式？

我有一个 PIE 图表它工作正常但我无法使其具有响应能力和可调整大小我需要它与移动浏览器和 iPad 等兼容 div div
在 JSF 页面上显示当前日期

是否可以在 JSF 中显示当前日期今天的而不使用支持 bean 我有以下代码片段但没有成功 div class leftSide Today s date currentDate div or
在选项卡上保存数据

我有 3 个选项卡每个选项卡都有一个单独的活动我想在用户单击任一选项卡上的保存时保存数据有几个选项可供选择共享首选项全局变量或将对象保存在上下文中编辑我必须保存图像和文本字段 Android 共享首选项 https sta
Android：使 Dialog 周围的所有内容都比默认值更暗

我有一个具有以下样式的自定义对话框它显示了一个无边框对话框后面的任何内容都会稍微变暗我的设计师希望背后的一切都比 Android 的默认设置更暗但不是完全黑色有这样的设置吗我能想到的唯一解决方法是使用全屏活动而不是对话框只
为什么从 Pandas 1.0 中删除了日期时间？

我在 pandas 中处理大量数据分析并每天使用 pandas datetime 最近我收到警告 FutureWarning pandas datetime 类已弃用并将在未来版本中从 pandas 中删除改为从 datetime 模块
设置双指缩放时精确的滚动位置

我正在创建一个地图应用程序它将标记图像放置在画布上并滚动到它我正在使用浏览器的捏缩放和滚动来放大缩小地图然而我注意到有一些奇怪的行为我想知道如何解决它这有点难以解释但我们开始吧假设您处于网页的标准缩放级别无法进一步缩小
如何在 NumberPicker 中一次显示 3 个以上的值

我正在创建一个数字选择器如下图所示但如果有可用空间我想显示 3 个以上的值该选择器有 20 个项目并且有足够的空间来显示 3 个以上的值这可以使用 NumberPicker 来完成吗只需以编程方式设置numberPicker
使用 Docker Desktop 调试本地部署到 Kubernetes 的应用程序的最佳方法是什么？

我有使用 Docker 开发相对复杂的应用程序的经验使用 Visual Studio 2019 调试应用程序非常容易我只是将 docker compose yaml 设置为启动应用程序并开始调试是否可以使用 Docker Deskto
AWS StepFunction CDK 结果路径设置为 null

我无法找到一种方法来指定 null 到结果路径正如这里指出的 https docs aws amazon com step functions latest dg input output resultpath html https do
N层架构设计关注点分离

我意识到已经有很多关于 n 层设计的帖子这可能是我思考过度和兜圈子但我自己现在很困惑希望从社区得到一些澄清我试图将我创建的项目并且一开始就没有很好地设计架构分成不同的层每个层都在自己的项目中 UI 业务对象逻辑商业 DAL
如何比较 Struts 2 中 url 请求参数中的单个字符

我正在读取具有单个字符的 url 参数它将是Y or N 我必须写一个条件来检查它是否Y or N并做相应的事情这是我写的但似乎不起作用总是转到其他地方网址是
Django 的内联管理：一个“预填充”字段

我正在开发我的第一个 Django 项目我希望用户能够在管理中创建自定义表单并向其中添加字段当他或她需要它们时为此我在我的项目中添加了一个可重用的应用程序可在 github 上找到 https github com stephen
UICollectionView 拖放文件夹创建

我正在使用 UICollectionView 创建 iOS 画廊应用程序我希望用户能够拖放图像来重新排序图库并创建文件夹类似于 iPhone 上的主屏幕我发现了以下内容tutorial http nshint io blog 2015
根据 .NET Core 2.1 中的更改重新加载 Serilog JSON 配置

我目前正在开发 ASP NET Core 2 1 应用程序并使用 Serilog 进行日志记录我想在运行时为我的 Serilog 实现重新加载应用程序设置文件我的目标是在运行时更改日志级别例如我写入minimumLevelDebug
修改异步不工作

我正在尝试在发布后编辑嵌入的消息我试图使用文档中的这个示例但它不起作用 https discord foxbot me docs api Discord MessageProperties html https discord foxb
Symfony2 自定义密码编码器（bcrypt）

我已经编写了自己的密码编码器它实现了PasswordEncoderInterface class BCryptPasswordEncoder implements PasswordEncoderInterface protected en
PHP 错误：“无法通过引用传递参数 2”

我只是需要有关这个 PHP 错误的帮助我不太明白致命错误无法在第 13 行 web stud openup inactivatesession php 中通过引用传递参数 2
与区域指示符字符类匹配的 python 正则表达式

我在 Mac 上使用 python 2 7 10 表情符号中的标志由一对表示区域指示符号 https en wikipedia org wiki Regional Indicator Symbol 我想编写一个 python 正则表达式来在

与区域指示符字符类匹配的 python 正则表达式

与区域指示符字符类匹配的 python 正则表达式 的相关文章

随机推荐

热门标签

与区域指示符字符类匹配的 python 正则表达式的相关文章