使用 perl 比较两个 Unicode 字符串

2024-05-10

当我运行以下代码时，它不会进入“在此处执行某些操作”部分：

my $a ='µ╫P[┐╬♣3▀═<+·1╪מ└╖"ª';
my $b ='µ╫P[┐╬♣3▀═<+·1╪מ└╖"ª';

if ($a ne $b) {
    # do something here    
}

还有另一种方法可以将 Unicode 字符串与 perl 进行比较吗？

如果您有两个 Unicode 字符串（即 Unicode 代码点字符串），那么您肯定已将文件保存为 UTF-8 并且实际上有

use utf8;  # Tell Perl source code is UTF-8.

my $a = 'µ╫P[┐╬♣3▀═<+·1╪מ└╖"ª';
my $b = 'µ╫P[┐╬♣3▀═<+·1╪מ└╖"ª';

if ($a eq $b) {
    print("They're equal.\n");
} else {
    print("They're not equal.\n");
}

这工作得很好。eq and ne将逐个代码点比较字符串的代码点。

某些字素（例如“é”）可以通过多种不同的方式构建，因此您可能必须正常化 http://search.cpan.org/perldoc?Unicode::Normalize首先是他们的代表。

use utf8;  # Tell Perl source code is UTF-8.

use charnames          qw( :full );  # For \N{}
use Unicode::Normalize qw( NFC );

my $a = NFC("\N{LATIN SMALL LETTER E WITH ACUTE}");
my $b = NFC("e\N{COMBINING ACUTE ACCENT}");

if ($a eq $b) {
    print("They're equal.\n");
} else {
    print("They're not equal.\n");
}

最后，Unicode 认为某些字符几乎等效，并且可以使用不同形式的规范化将它们视为相等。

use utf8;  # Tell Perl source code is UTF-8.

use charnames          qw( :full );  # For \N{}
use Unicode::Normalize qw( NFKC );

my $a = NFKC("2");
my $b = NFKC("\N{SUPERSCRIPT TWO}");

if ($a eq $b) {
    print("They're equal.\n");
} else {
    print("They're not equal.\n");
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

perl

Unicode

使用 perl 比较两个 Unicode 字符串的相关文章

如何在 Java/Eclipse 中使用特殊字符

如何在 Java Eclipse 中使用显示或等字符当我尝试直接使用它们时例如在源代码中 Eclipse无法保存文件我能做些什么编辑如何找到 unicode 转义序列问题是您使用的字符无法以文件设置的编码 Cp1252 表
是否有一个看起来像“钥匙”图标的 Unicode 字形？ [关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案 Unicode 有一百万个类似图标的字形但它们并不总是很容易搜索因为我并不总是知道它们是什么样子是否有一个看起来像钥匙的 Unicode 字
Java中的字节和字符转换

如果我将一个字符转换为byte然后回到char 那个角色神秘地消失了变成了别的东西这怎么可能这是代码 char a line 1 byte b byte a line 2 char c char b line 3 System out
无法安装 WWW::Curl::Easy: SZBALINT/WWW-Curl-4.17.tar.gz : make NO

我正在尝试在我的 Fedora 26 机器上安装 WWW Curl Easy gcc c I usr include D REENTRANT D GNU SOURCE O2 g pipe Wall Werror format securit
如何在调试器模式下运行 perl 测试？

我尝试在调试器下运行测试 perl d which prove t file t 但这没有任何效果因为每个测试都是作为单独的作业运行的我已经发现 exec选项但是当我提供它时我失去了任何选项 proverc文件和命令行 prove
将相同匹配模式的连续 2 行放入单行中

我想解析这组行以便如果得到相同的模式例如 lt email protected cdn cgi l email protection gt 在连续的行中它应该以单行形式打印并在两行之间使用 q2VDWKkY010407 222187
OpenSSL DH 密钥太小错误

我正在尝试使用简单的 PERL 脚本连接到封闭的服务器空调 usr bin perl use 5 10 1 use warnings use strict use IO Socket SSL use IO Socket SSL qw de
MIME::Lite - 无法发送邮件 [smtp.gmail.com 不支持 SMTP auth() 命令]

use MIME Lite use warnings use MIME Base64 use Authen SASL use MIME Lite use MIME Base64 use Authen SASL use warnings us
我怎样才能挂钩 Perl 的 use/require 以便抛出异常？

如果文件已经加载是否可以挂载到use require所以我可以抛出异常在我即将到来的nextgen blacklist http github com EvanCarroll nextgen blob blacklist lib nex
如何用perl逐句读取文本文件？

我想逐句读取文本文件我的问题是下面的代码仅根据时期分开 usr bin perl use strict use warnings my file data txt open FILE file my buffer while my sen
使用 -T 开关运行时 $ENV{ENV} 不安全

当我尝试最后一个例子时perlfaq5 如何计算文件中的行数 http perldoc perl org perlfaq5 html How do I count the number of lines in a file 我收到一条错误消
Matplotlib mathtext：刻度标签中的字形错误

当使用默认值时我在 matplotlib 2 0 2 中渲染数学时观察到错误mathtext https matplotlib org 1 5 1 users mathtext html mathtext tutorial与LaTeX h
Perl：HTTP::微小删除留下损坏的锚标记

我编写了一个脚本该脚本收集从数据库读取的缓冲区内的所有 URL 检查该页面是否仍然存在并使用 HTTP Tiny 从缓冲区中删除 URL 如果该 URL 无法访问或返回无效问题是 HTTP Tiny 删除左锚标记例如此处无效的文本
如何在附加的 sqlite 数据库中创建外键？

我正在尝试创建一个 sqlite3 数据库作为模拟生产环境的测试环境由于生产的设置方式表处于多个模式中我已经在 DBIx Class 中设置了类使用 schema gt storage gt dbh do将数据库与架构附加在一起并
如何将 Unicode 字符转换为简单形式？ [复制]

这个问题在这里已经有答案了有没有一个Go库可以Sj str m作为输入和返回Sjostrom作为输出您可以使用golang org x text unicode norm来处理这个问题 package main import fmt i
使用 Cygwin 安装 CPAN GD 模块失败

我已经尝试解决为什么 CPAN GD 模块无法使用 Cygwin 安装 2 天了任何帮助深表感谢谢谢 cpan install GD Going to read home xxxxxxxxxx cpan Metadata Databas
从 php 执行 bash 脚本并立即输出回网页

我有一组 bash 和 Perl 脚本开发在 Linux Box 上部署所需的目录结构可选从svn导出代码从这个源构建一个包这在终端上运行良好现在我的客户请求此流程的 Web 界面例如某些页面上的创建新包按钮将一一调用
如何在 C 中安全地声明 16 位字符串文字？

我知道已经有一个标准方法前缀为L wchar t test literal L Test 问题是wchar t不保证是16位但是对于我的项目我需要16位wchar t 我还想避免通过的要求 fshort wchar 那么 C 不是 C
快速 Perl signint 处理程序

收到 Ctrl C 时处理程序清理的最方便最清晰的方法是什么例如当我的套接字服务器以这种方式被终止时 TCP 套接字永远不会关闭我想要一个很好的衬里我可以将其放在程序的顶部来设置 sigint 处理程序或类似 atexit 的东
为什么在 Python 2.4 中使用 Unicode 数据会出现 ASCII 编码错误，而在 2.7 中却不会？

我有一个程序当在 Python 2 7 中运行时会生成正确的 Unicode 输出到标准输出当在 Python 2 4 中运行时我得到UnicodeEncodeError ascii codec can t encode chara

随机推荐

第99章啤酒瓶递归好像不行

好的这是我在学习过程中编写的简单代码 void SingTheSong int NumOfBottles if NumOfBottles 0 printf there are simply no more bottles of beer
如何使用 ActiveAdmin 创建 STI 子类的对象

给出以下设置当前不起作用 class Employee lt ActiveRecord Base end class Manager lt Employee end ActiveAdmin register Employee do for
销毁Android应用程序

我开发了一个运行良好的应用程序我使用了一些静态变量并设置了应用程序级别变量我的问题是即使在每个活动上设置 finish 之后应用程序仍显示在运行模式下关闭应用程序后当我在一段时间后启动应用程序时它将设置最后的更改我怎样才能销
Android TCP Server 仅在客户端关闭后显示来自 Python 客户端的消息

我正在使用一些示例代码它允许我从 Python 客户端向 Android 服务器 TCP 发送消息但该消息仅在客户端关闭后才会显示在 Android 模拟器上我可能缺少 tcp 套接字背后的一些基本理解第一次使用和实现我的主要目的
我所有的布局 xml 文件都变成了自动生成的文件

昨天我的应用程序上的所有内容都运行完美但今天当我打开 Android Studio 时所有 xml 文件都已损坏不确定这是否是正确的术语每个人都是这样的我今天遇到了同样的问题下面是我所做的几个步骤我取得了成功来解决这个问题只
alloca 函数作用域中的 goto 有效吗？

C 标准禁止转到存在 VLA 的函数作用域 VLA 和对 alloca 函数的调用在低级别上应该具有相同的结果我可能是错的因为我只是一个 C 不是一个低级程序员但在我的想象中这似乎很机智那么下面的代码片段也会是未定义的行为吗 int
反转 ArrayList 最简单的方法是什么？

反转这个ArrayList的最简单方法是什么 ArrayList
元标记内的属性 property="og:title" 是什么？

我有网站源代码的摘录这是做什么的属性属性代表什么其目的是什么 og title是开放图元标签之一 og 属性定义社交图中的对象例如 Facebook 使用它们 og title代表对象的标题因为它应该出现在图表中请参阅此处了解更多
如果两个数组包含相同的元素，无论这些元素出现的顺序如何，如何在 Swift 中检查？

假设有两个数组 var array1 a b c var array2 b c a 我希望这两个数组的比较结果为真以下 var array1 a b c var array2 b c a d 是假的我怎样才能在 Swift 中实现这一点
ruby 中的数组切片返回不同的结果 - nil 与空数组

我对以下事实感到困惑如果对数组进行切片length 它返回一个空数组但长度大于该值时它返回nil 这是什么原因呢例如 arr 1 2 3 4 5 这样做在哪里y gt arr length and x是任意正整数返回nil ar
不可靠网络和低带宽的 Java ORM 策略

我正在寻找 Hibernate 作为需要在不可靠网络中工作的系统我们需要对一个中央数据库进行读写访问但它可以通过一个相当不稳定的 Wi Fi 网络来访问此外可能会出现断电而导致应用程序无法完全关闭的情况因此任何解决方案都必须具有能
PHP三元运算符错误[重复]

这个问题在这里已经有答案了可能的重复 PHP 三元运算符未按预期工作 https stackoverflow com questions 14214427 php ternary operator not working as expec
C# 自动检测代理设置

C 2008 SP1 我正在使用代码来检测是否已在 Internet 选项下设置代理如果有代理那么我将在我的网络客户端中设置它所以我只是检查代理的地址是否存在如果没有则说明 Web 客户端中没有要设置的代理这是执行此操作的正确
在java中以一定精度显示双精度数

我目前正在编写一个计算器应用程序我知道双精度数并不是良好数学的最佳选择应用程序中的大多数函数都具有很高的精度但有些函数不会得到非常难看的结果我的解决方案是只向用户显示 12 位小数的精度我选择 12 是因为我的最低精度来自我的数值
使用计数器作为变量名称的一部分来访问变量

我尝试做类似的事情 cat1 array hello everyone cat array bye everyone for index 0 index lt 2 index echo cat index 1 当然是行不通的我需要在这里改
打印总和时出现“内置方法总和”奇怪的消息

使用 Python NumPy 计算矩阵的列之和 import numpy from StringIO import StringIO fileName test2 csv myFile open fileName r print Read
scipy.sparse.hstack(([1], [2])) ->“ValueError：块必须是二维的”。为什么？

scipy sparse hstack 1 2 and scipy sparse hstack 1 2 工作得很好但不是scipy sparse hstack 1 2 为什么会这样呢这是我的系统上发生的情况的痕迹 C Anaconda
使用“Any CPU”而不是“X86”编译wix项目

当我编译一个wix项目并且wix通过MSbuild启动所有现有项目的编译时我可以使用任何CPU 而不是 X86 或 64位吗如果没有我如何使用任何CPU 编译项目如果您的问题是是否可以编译 WIXPROJAny CPU那么答
Python statsmodel.api 逻辑回归 (Logit)

所以我尝试使用 python 的 statsmodels api 对二进制结果进行逻辑回归进行预测我按照教程使用 Logit 当我尝试对测试数据集进行预测时每个记录的输出都是 0 到 1 之间的小数它不应该给我零和一吗或者我是否必须
使用 perl 比较两个 Unicode 字符串

当我运行以下代码时它不会进入在此处执行某些操作部分 my a P 3 lt 1 my b P 3 lt 1 if a ne b do something here 还有另一种方法可以将 Unicode 字符串与 perl 进行比较吗

使用 perl 比较两个 Unicode 字符串

使用 perl 比较两个 Unicode 字符串 的相关文章

随机推荐

热门标签

使用 perl 比较两个 Unicode 字符串的相关文章