使用两个具有相同字符的分解对象断言 True

2024-03-04

我有两个 unicode 字符，两者具有相同的含义。这compat字符是对origin字符，这有意义，两者应该是相同的值，但是当我试图断言它们与条件相等时，它会返回False反而。

origin = 'ᅢ'  # korean letter for: AE
compat = 'ㅐ'  # korean letter for: AE

print('origin', ascii(origin))
print('compat', ascii(compat), '\n')

decompose_origin = unicodedata.decomposition(origin)
decompose_compat = unicodedata.decomposition(compat)

print('decompose: origin', decompose_origin)
print('decompose: compat', decompose_compat, '\n')

# expected output: True
print(decompose_origin == decompose_compat)

origin '\u1162'
compat '\u3150'

decompose: origin
decompose: compat <compat> 1162

False

将字符串标准化为NFKC or NFKD正常形式 https://docs.python.org/3/library/unicodedata.html#unicodedata.normalize使它们具有可比性：

from unicodedata import normalize

origin = '\u1162'
compat = '\u3150'
for normal_form in ('NFC', 'NFD', 'NFKC', 'NFKD'):
    print(normal_form, ascii(normalize(normal_form, origin + ' == ' + compat)))
    print(normalize(normal_form, origin) == normalize(normal_form, compat))
# NFC '\u1162 == \u3150'
# False
# NFD '\u1162 == \u3150'
# False
# NFKC '\u1162 == \u1162'
# True
# NFKD '\u1162 == \u1162'
# True

Both NFKC and NFKD执行“兼容性分解，即用其等效字符替换所有兼容性字符”。这NFKC范式也适用规范组合。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

python3x

使用两个具有相同字符的分解对象断言 True 的相关文章

键入的完整命令行

我想获得输入时的完整命令行 This join sys argv 在这里不起作用删除双引号另外我不想重新加入已解析和拆分的内容有任何想法吗你太迟了当键入的命令到达 Python 时您的 shell 已经发挥了它的魔力例如引
为什么在访问 Python 对象属性时使用 getattr() 而不是 __dict__ ？

在具有一定程度的 Python 对象自省的源代码示例和 SO 答案中常见的模式是 getattr some object attribute name string 是否有理由优先选择这种模式 some object dict attri
来自 pandas 数据帧的烛台图，用日期替换索引

此代码给出了带有移动平均线的烛台图但 x 轴位于索引中我需要 x 轴位于日期中需要做什么改变 import numpy as np import pandas as pd import matplotlib pyplot as plt
Flask 失败并显示“错误：导入‘X’时，引发了 ImportError”，但不显示错误。如何找到错误的根源？

当使用以下命令启动 Flask 应用程序时 flask run 我收到错误 Error While importing wsgi an ImportError was raised Usage flask OPTIONS COMMAND A
类型错误：“datetime.datetime”和“str”的实例之间不支持“>”

我是 python 日期和时间类型的新手我有一个日期值 date 2018 11 10 10 55 31 00 00 我需要检查该日期值是否超过 90 天我试过 from datetime import datetime from da
ValueError：数据必须为正（boxcox scipy）

我正在尝试将我的数据集转换为正态分布 0 8 298511e 03 1 3 055319e 01 2 6 938647e 02 3 2 904091e 02 4 7 422441e 02 5 6 074046e 02 6 9 265747e
使用 subprocess.Popen() 或 subprocess.check_call() 时程序卡住

我想从 python 运行一个程序并找到它的内存使用情况为此我正在使用 l a out lt in txt gt out txt p subprocess Popen l shell False stdout subprocess PI
通过 Python 循环浏览网络上的目录并显示其内容（文件和其他目录）

同样的道理在Python中处理从源目录到目标目录的一组文件 https stackoverflow com questions 2593399 process a set of files from a source directory t
如何用正则表达式替换多个匹配/组？

通常我们会编写以下内容来替换一场比赛 namesRegex re compile r is life re I replaced namesRegex sub r butter There is no life in the void pr
Seaborn 中没有线性拟合的散点图

我想知道是否有办法关闭seaborn中的线性拟合lmplot或者是否有一个等效函数可以生成散点图当然我也可以使用 matplotlib 但是我发现 seaborn 中的语法和美学非常吸引人例如我想绘制以下情节 import sea
如何展平解析树并存储在字符串中以进行进一步的字符串操作 python nltk

我正在尝试从树结构中获取扁平树如下所示我想将整个树放在一个字符串中就像没有检测到坏树错误一样 S NP SBJ NP DT The JJ high JJ seven day PP IN of NP DT the CD 400 NNS
如何创建用于霍夫曼编码和解码的树？

对于我的作业我将对霍夫曼树进行编码和解码我在创建树时遇到问题并且陷入困境不要介意打印语句它们只是让我测试并查看函数运行时的输出是什么对于第一个 for 循环我从主块中用于测试的文本文件中获取了所有值和索引在第二个 for 循
无需访问 Internet 即可部署 Django 的简单方法？

我拥有的是使用 Django 开发的 Intranet 站点的开发版本以及放置在 virtualenv 中的一些外部库它运行良好我可以在任何具有互联网连接的计算机上使用相同的参数使用 pip 轻松设置 virtualenv 但是不幸
Python 读取未格式化的直接访问 Fortran 90 给出不正确的输出

这是数据的写入方式它是一个二维浮点矩阵我不确定大小 open unit 51 file rmsd nn output form unformatted access direct status replace recl Npoints
如何使用 enumerate 来倒数？

letters a b c 假设这是我的清单在哪里for i letter in enumerate letters 将会 0 a 1 b 2 c 我怎样才能让它向后枚举如 2 a 1 b 0 c 这是一个很好的解决方案并且工作完美 i
没有名为“turtle”的模块

我正在学习并尝试用Python3制作贪吃蛇游戏我正在进口海龟我正在使用 Linux mint 19 PyCharm python37 python3 tk Traceback most recent call last File hom
为boost python编译的.so找不到模块

我正在尝试将 C 代码包装到 python 中只需一个类即可导出两个函数我编译为map so 当我尝试时import map得到像噪音一样的错误 Traceback most recent call last File
MoviePY 无法在 Windows 上检测 ImageMagick 二进制文件

我刚买了一台新笔记本电脑想要设置MoviePY在那新的Windows 64x Python3 7 0 机器我对所有内容都进行了三次检查但是当涉及到我的代码的文本部分时它向我抛出了这个错误 OSError MoviePy Error
基于值的 matplotlib 条形图颜色

有没有一种方法可以根据条形图的值对条形图的条形进行着色例如 values below 0 5 red values between 0 5 to 0 green values between 0 to 08 blue etc 我找到了一些
Biopython 可以执行 Seq.find() 来解释歧义代码吗

我希望能够在 Seq 对象中搜索考虑歧义代码的子序列 Seq 对象例如以下内容应该是正确的 from Bio Seq import Seq from Bio Alphabet IUPAC import IUPACAmbiguousDNA

随机推荐

调试 Jersey 解组错误 - 错误请求语法不正确

我正在 Glassfish 上的 Jersey 的帮助下构建 REST Web 服务现在我正在为我的搜索查询的自定义输入源而苦苦挣扎如果有搜索方法 POST Path search Consumes application xml ap
HSTS 预加载列表 - www 网站可能存在 SEO 问题

让我在这里解释一下现实世界的情况我运行网站https www liloo ro https www liloo ro我想为其启用 HSTS HSTS 预加载问题是为了将其提交给预加载列表 https hstspreload org th
无法制作固定大小数组的向量？

我有这个奇怪的问题 vector
更改 igraph 图中子图的颜色

我有以下代码来绘制图的最小生成树 g is an igraph graph mst minimum spanning tree g E g color lt SkyBlue2 how to I make mst a different co
无法访问用户控制组件[关闭]

Closed 这个问题需要调试细节 help minimal reproducible example 目前不接受答案在我的用户控件中我有一个名为的 datagridviewdgvCustomers 我想在 gridview 中加载客户
延长 R 中绘图轴的长度？

如何在 R 中扩展轴线以覆盖数据范围例如在我的数据大约为 2100 我希望 x 轴的线能走那么远但不要在 2100 处做刻度线或标签这在 R 中是否可能这是用于制作上述绘图的代码 hist x breaks 50 xlab ma
对python的LOAD_FAST/STORE_FAST感到困惑

当我写一些代码时我发现一个有趣的事情 def test l for i in range 10 def f pass print f l append f test import dis dis dis test 输出是
如何从 pandas 邻接矩阵数据帧创建有向 networkx 图？

我有一个以下形式的 pandas 数据框 df A B C D A 0 0 5 0 5 0 B 1 0 0 0 C 0 8 0 0 0 2 D 0 0 1 0 我正在尝试由此创建一个 networkx 图我尝试过以下代码变体 A G ne
“cordova 平台添加 android”shasum 错误

我正在完成设置和 HelloWorld 示例http cordova apache org docs en 3 5 0 guide cli index md html The 20Command Line 20Interface http
当我导入 Xerces 库时无法构建应用程序（退出值 1）

当我导入 Xerces 库时我似乎无法构建我的应用程序由于之前的问题我已经在使用 multidex 因此我知道这一切都设置正确我花了几天时间在网上查找并尝试各种版本的 Xerces 并对我的 build gradle 进行调整但无
CSS open-quote 显示 1 个引号

我使用以下 CSS 在段落前添加左引号 blockquote padding 22px quotes 201C 201D 2018 2019 font size 15px blockquote before color 111 conten
Postgres：整数范围的唯一约束

给定两个整数开始和结束以及一个外键我如何定义一个unique对区间 start end 和foreign key 的约束鉴于我的表中有以下条目 start end foreign key 10 20 04ef8258 917c 46
Java中如何获取字符类型的类别名称？

The Character getType int codePoint 返回一个整数但我找不到方法从中获取 unicode 类别名称例如 Lu 或 Cn 我想要的是一种方法例如Character getCategoryTypeNam
scala 中的构造函数（主/辅助/默认主）

一个非常简单的练习凯霍斯特曼的 book Scala 适合不耐烦的人一直让我困惑是关于primary auxiliary and default primary构造函数例如 5 10 考虑班级 class Employee val n
不会采用父级
我有一个 ul 与几个 li 其中的所有项目都在一行中这 li li 有一个嵌套的 span and an img The img 所有项目的高度都相同但是 span 项目包含可以跨越单行或两行的文本取决于文本我尝试过申请displ
ParseException：无效的会话令牌错误

我做了一个简单的注册用户界面只是为了检查解析但由于某种原因每次我尝试注册用户时都会出现此错误这是代码 final ProgressDialog dlg new ProgressDialog this dlg setTitle Pleas
Java 中的内存映射集合

我正在填满 JVM 堆空间更改参数以为 JVM 提供更多堆空间或更改代码中算法中的某些内容以不使用这么多空间是最推荐的两个选项但是如果这两个已经被尝试和应用并且我仍然遇到内存不足的异常我想看看其他选项是什么我发现了这个例子对
使用 Keras (PIL) 和 TensorFlow 调整图像大小不一致？

我对以下之间明显的不一致感到困扰图像调整大小功能来自keras preprocessing 它们是 PIL 函数的包装器 TensorFlow 中的图像大小调整函数tf image 我正在使用 Keras 为计算机视觉任务训练深度学习模型
如何提高 PostgreSQL 中带有游标的函数的性能？

我有两个嵌套游标的功能外部游标从源获取客户的付款详细信息并根据某些业务逻辑插入到目标中内部光标获取每笔付款的付款详细信息它接连发生 Payments 表大约有 125000 行其中大约 335000 行用于付款详细信息所有这些行
使用两个具有相同字符的分解对象断言 True

我有两个 unicode 字符两者具有相同的含义这compat字符是对origin字符这有意义两者应该是相同的值但是当我试图断言它们与条件相等时它会返回False反而 origin korean letter for AE co

使用两个具有相同字符的分解对象断言 True

使用两个具有相同字符的分解对象断言 True 的相关文章

随机推荐

热门标签