获取 Unicode 字符中字符串的“实际”长度

2023-12-29

给定一个像“" (\xe2\x9c\xae),例如,可以是其他类似“Σ", "д" or "Λ") 我想找到字符打印在屏幕上时的“实际”长度

例如

len("✮")
len("\xe2\x9c\xae")

两者都返回 3,但它应该是 1


你可以这样尝试:

unicodedata.normalize('NFC', u'✮')
len(u"✮")

UTF-8 是一种 unicode 编码,它使用多个字节来表示特殊字符。查看unicodedata.normalize() https://docs.python.org/2/library/unicodedata.html#unicodedata.normalize

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

获取 Unicode 字符中字符串的“实际”长度 的相关文章

随机推荐

  • 如何避免重复将大文件加载到Python脚本中?

    我编写了一个 python 脚本来获取一个大文件 一个矩阵 50k 行 X 500 列 并将其用作数据集来训练随机森林模型 我的脚本有两个函数 一个用于加载数据集 另一个用于使用所述数据训练随机森林模型 这些都工作得很好 但文件上传大约需要
  • 使用 Node.js 设置 SSL

    我在 GoDaddy 购买了 SSL 证书 并使用以下 node js 服务器尝试设置它 var https require https module for https fs require fs required to read cer
  • 使用 Oracle 客户端 64 位和 Visual Studio 2010 时出现 BadImageFormatException!

    我们的一名开发团队成员遇到了错误 尝试加载 Oracle 客户端库抛出 BadImageFormatException 它似乎 当在 64 位模式下运行并安装了 32 位 Oracle 客户端组件时 会出现此问题 但配置系统的是我 以下是规
  • 点击事件被列表视图父项捕获

    我正在编写一个在 Firemonkey 中使用的自定义开关对象TListView每个项目的控制 除了一个奇怪的故障之外 一切都按预期进行 当用户单击其中一项而不是特定的开关对象时 它无论如何都会切换开关 我假设MouseDown当用户单击列
  • R 数据帧聚合列表

    我确实有 53 个数据框 purchase01 到purchase53 的列表 按日期排序 有 18 个变量和不同的行数 已尝试 但无法在下面粘贴示例 我想要总计的每个不同的数据帧通过其重复值 V9 因子 与列 V2 数字相加 我还没找到答
  • AFHTTPRequestOperationManager 返回块中的数据

    我在我的应用程序中创建了一个 APIController 它有几个方法可以调用特定的 api url 并返回一个用 api 调用结果填充的模型对象 该 API 使用 json 到目前为止我的代码如下所示 Definition MyModel
  • 自定义单元格:致命错误:在展开可选值时意外发现 nil

    我有一个带有创建为 xib 的自定义单元格的表格视图 我没有使用故事板 我有一个问题 我无法用来自网络服务结果的数据填充我的表 另外 我在自定义单元格中有 4 个标签 在我的自定义单元类中 当我尝试为每个项目设置标签时 它给了我如上所述的致
  • Django从apache获取环境变量

    我似乎无法让 Django 读取我从环境变量中配置的设置 我遵循了一些在线指南 并发现了一些其他问题 因此尝试配置如下 阿帕奇配置 WSGIScriptAlias v4 usr local myproject4 myproject4 wsg
  • 如何在 ASP.NET DataRepeater 控件中执行条件逻辑?

    我将 DataRepeater 控件绑定到具有许多列的表 我只想显示其中的一个子集 具体取决于填充的内容 我应该如何 在哪里进行数据中继器中的条件测试 这是我的 itemtemplate 中的代码 我得到的错误是 CS0103 名称 容器
  • 尝试从 python 写入 cassandra 时 CQL 查询中出现语法错误

    因此 我正在用 python 构建一个应用程序 该应用程序从 twitter 获取数据 然后将其保存到 cassandra 我当前的问题在于一个从kafka读取数据并尝试将其写入cassandra的脚本 如下所示 import thread
  • scala会自动关闭InputStream吗?

    我是 scala 的新手 不熟悉流关闭机制 我写了一些这样的代码 def loadResourceAsString path String val is this getClass getResourceAsStream path Sour
  • 过滤字符串列表,忽略其他项目的子字符串

    如何过滤包含字符串和子字符串的列表以仅返回最长的字符串 如果列表中的任何项目是另一个项目的子字符串 则仅返回较长的字符串 我有这个功能 有更快的方法吗 def filterSublist lst uniq lst for elem in l
  • WPF 和 3D 如何更改 3D 空间中的单个位置点?

    我在 WPF 中定义了一个非常简单的 3D 空间 它定义了一个 3D 矩形 我希望能够操作 MeshGeometry3D 上的每个 Point3D 对象 在 位置 中 属性 但我遇到了麻烦 这是我的 XAML
  • 具有多个项目的标题模板

    我正在尝试写一个HeaderTemplate对于扩展器 到目前为止 我注意到所有示例都使用 Binding 关键字从标题中获取数据 但是 如果 Header 中有多个控件会发生什么情况 如何指定应将这些控件插入到特定位置
  • 处理 Swing UI 中的异常(低级到高级以及异常包装)

    我希望在 Swing 应用程序中以有意义的方式处理异常 下面是里面的一个actionPerformed方法 这UiUtils showError显示一个 JOptionPane 其中带有一个显示 隐藏堆栈跟踪的按钮 ApplicationE
  • 一个简单的代码来快速检测任何信标

    我是快速编程的新手 我正在尝试开发检测信标的应用程序 但仍然无法检测到任何信标 let region CLBeaconRegion proximityUUID NSUUID UUIDString 11111111 1111 1111 111
  • Azure SDK、Trace.Information 和 WADLogsTable

    我正在使用 Azure SDK 2 5 在 NET 中编写新的云服务 我知道诊断发生了一些重大变化使用 2 5 SDK rekesae https msdn microsoft com en us library azure dn87397
  • 学习如何编写它们的示例解析器[关闭]

    Closed 这个问题需要多问focused help closed questions 目前不接受答案 我正在寻找可以研究的解析器和 或解析器生成器的源代码 以便进一步发展我在学校课程中获得的技能 您知道任何类型的值得推荐的解析器吗 您应
  • PHP 文件形式的图像

    我对 PHP 相当陌生 我需要知道如何将文件显示为图像 例如 打开http example com script php http example com script php将显示图像 我的理由是我需要把它放在src的属性 img 我希望
  • 获取 Unicode 字符中字符串的“实际”长度

    给定一个像 xe2 x9c xae 例如 可以是其他类似 or 我想找到字符打印在屏幕上时的 实际 长度 例如 len len xe2 x9c xae 两者都返回 3 但它应该是 1 你可以这样尝试 unicodedata normaliz