使用 C++11，我还需要用于 Unicode 文本的非标准字符串操作库吗？

2024-03-14

我注意到 std::string 的 length 方法返回以字节为单位的长度，而 std::u16string 中的相同方法返回 2 字节序列的数量。

我还注意到，当字符或代码点位于 BMP 之外时，长度返回 4 而不是 2。

此外，Unicode 转义序列仅限于 \unnnn，因此 U+FFFF 之上的任何代码点都不能由转义序列插入。

换句话说，似乎不支持 BMP 之外的代理对或代码点。

鉴于此，是否接受或推荐使用理解 UTF-8、UTF-16、代理项对等的非标准字符串操作库？

我的编译器是否存在错误，或者我是否错误地使用了标准字符串操作方法？

Example:

/*
* Example with the Unicode code points U+0041, U+4061, U+10196 and U+10197
*/

#include <iostream>
#include <string>

int main(int argc, char* argv[])
{
    std::string example1 = u8"A䁡????????";
    std::u16string example2 = u"A䁡????????";

    std::cout << "Escape Example: " << "\u0041\u4061\u10196\u10197" << "\n";
    std::cout << "Example: " << example1 << "\n";
    std::cout << "std::string Example length: " << example1.length() << "\n";
    std::cout << "std::u16string Example length: " << example2.length() << "\n";

    return 0;
}

这是我用 GCC 4.7 编译时得到的结果：

Escape Example: A䁡မ6မ7
Example: A䁡????????
std::string Example length: 12
std::u16string Example length: 6

std::basic_string是面向代码单元的，而不是面向字符的。如果您需要处理代码点，您可以转换为 char32_t，但标准中还没有提供更高级的 Unicode 功能。

您也可以使用\UNNNNNNNN除了直接输入非 BMP 代码点的转义序列之外（假设您使用的是支持它们的源编码）。

根据您的需要，这可能是您需要的全部 Unicode 支持。许多软件只需要对字符串进行基本操作，例如可以直接在代码单元上轻松完成的操作。对于稍高级别的需求，您可以将代码单元转换为代码点并对其进行处理。对于更高级别的需求，例如处理字素簇，将需要额外的支持。

我想说这意味着标准中有足够的支持来表示 Unicode 数据和执行基本操作。无论用于更高级别功能的第三方库都应该构建在标准库的基础上。随着时间的推移，该标准也可能包含更多更高级别的功能。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

c

Unicode

C11

使用 C++11，我还需要用于 Unicode 文本的非标准字符串操作库吗？的相关文章

在搜索 List 时，为什么 Enumerable.Any(Func predicate) 比带有 if 语句的 foreach 慢

最近有件事引起了我的好奇心 Why is the Enumerable Any Func
为什么要序列化对象需要 Serialized 属性

根据我的理解 SerializedAttribute 不提供编译时检查因为它都是在运行时完成的如果是这样那么为什么需要将类标记为可序列化呢难道序列化器不能尝试序列化一个对象然后失败吗这不就是它现在所做的吗当某些东西被标记时它会
从 MVC 迁移到 ASP.NET Core 3.1 中的端点路由时，具有角色的 AuthorizeAttribute 不起作用

我正在尝试将我的项目从 UseMVC asp net core 2 2 兼容样式升级到 UseEndpoint Routing 并且我的所有请求都被重定向到我的验证失败页面它与声明有关如果我删除 Authorize Roles Adm
对齐 GridView 中的行值

我需要在 asp net 3 5 中右对齐 gridview 列中的值我怎样才能做到这一点
访问者和模板化虚拟方法

在一个典型的实现中Visitor模式该类必须考虑基类的所有变体后代在许多情况下访问者中的相同方法内容应用于不同的方法在这种情况下模板化的虚拟方法是理想的选择但目前这是不允许的那么模板化方法可以用来解析父类的虚方法吗鉴于
ASP MVC：服务应该返回 IQueryable 的吗？

你怎么认为你的 DAO 应该返回一个 IQueryable 以便在你的控制器中使用它吗不您的控制器根本不应该处理任何复杂的逻辑保持苗条身材模型而不是 DAO 应该将控制器返回给视图所需的所有内容我认为在控制器类中看到查询甚至
如何从网站下载 .EXE 文件？

我正在编写一个应用程序需要从网站下载 exe 文件我正在使用 Visual Studio Express 2008 我正在使用以下代码 private void button1 Click object sender EventArgs
在非活动联合成员上使用“std::addressof”是否定义明确[重复]

这个问题在这里已经有答案了下面的代码是尝试实现constexpr的版本offsetof在 C 11 中它可以在 gcc 7 2 0 和 clang 5 0 0 中编译这取决于申请std addressof工会非活跃成员的成员这是明确
基于xsd模式生成xml（使用.NET）

我想根据我的 xsd 架构 cap xsd 生成 xml 文件我找到了这篇文章并按照说明进行操作使用 XSD 文件生成 XML 文件 https stackoverflow com questions 6530424 generatin
如何在c#中的内部类中访问外部类的变量[重复]

这个问题在这里已经有答案了我有两个类我需要声明两个类共有的变量如果是嵌套类我需要访问内部类中的外部类变量请给我一个更好的方法来在 C 中做到这一点示例代码 Class A int a Class B Need to access
在 C 中使用 GNU automake 中的解析器

我是 GNU autotools 的新手在我的项目中使用了 lex 和 yacc 解析器将它们作为 makefile am 中的源代码会产生以下错误配置 in AC CHECK PROGS YACC bison yacc none i
在类的所有方法之前运行一个方法

在 C 3 或 4 中可以做到这一点吗也许有一些反思 class Magic RunBeforeAll public void BaseMethod runs BaseMethod before being executed public
剪贴板在 .NET 3.5 和 4 中的行为有所不同，但为什么呢？

我们最近将一个非常大的项目从 NET Framework 3 5 升级到 4 最初一切似乎都工作正常但现在复制粘贴操作开始出现错误我已经成功制作了一个小型的可复制应用程序它显示了 NET 3 5 和 4 中的不同行为我还找到了一种解
什么是 __declspec 以及何时需要使用它？

我见过这样的例子 declspec在我正在阅读的代码中它是什么我什么时候需要使用这个构造这是 Microsoft 对 C 语言的特定扩展它允许您使用存储类信息来赋予类型或函数属性文档 declspec C https learn
我在在线程序挑战编译器中遇到演示错误

include
使用 C# 从 DateTime 获取日期

愚蠢的问题给定日期时间中的日期我知道它是星期二例如我如何知道它的 tue 2 和 mon 1 等 Thanks 您正在寻找星期几 http msdn microsoft com en us library system datetim
用于 C# XNA 的 Javascript（或类似）游戏脚本

最近我准备用 XNA C 开发另一个游戏上次我在 XNA C 中开发游戏时遇到了必须向游戏中添加地图和可自定义数据的问题每次我想添加新内容或更改游戏角色的某些值或其他内容时我都必须重建整个游戏或其他内容这可能需要相当长的时间有没
带重定向标准流的 C# + telnet 进程立即退出

我正在尝试用 C 做一个脚本化 telnet 项目有点类似于Tcl期望 http expect nist gov 我需要为其启动 telnet 进程并重定向和处理其 stdin stdout 流问题是生成的 telnet 进程在
实例化 Microsoft.Office.Interop.Excel.Application 对象时出现错误：800700c1

实例化 Microsoft Office Interop Excel Application 以从 winforms 应用程序生成 Excel 时出现以下错误这之前是有效的但突然间它停止工作了尽管代码和 Excel 版本没有变化我
是否可以在 C# 中强制接口实现为虚拟？

我今天遇到了一个问题试图重写尚未声明为虚拟的接口方法的实现在这种情况下我无法更改接口或基本实现而必须尝试其他方法但我想知道是否有一种方法可以强制类使用虚拟方法实现接口 Example interface IBuilder

随机推荐

如何获取数据列表的更改事件？

我正在使用数据列表需要检测用户何时从下拉列表中选择某些内容类似的问题已被问到 https stackoverflow com questions 16027746 jquery event when html5 datalist opt
将 SVG 图像转换为 png 以供不支持的浏览器使用 - 后备 - Modernizer.js(?) [重复]

这个问题在这里已经有答案了我正在考虑转几个SVG我的网站上的图像PNG对于不支持的浏览器SVG适当地我主要对显示的基于文本的问题有疑问IE 显示的字体完全错误所以我想我应该创建一个后备PNG 我已经尝试为此寻找一个很好的演练我自认是
使用函数式编程有效地计算素数

通过回顾 Project Euler 并解决一些问题我逐渐熟悉了 F 许多早期问题都由素数组成环顾四周后我想出了以下解决方案 let primesL let rec prim n sofar seq if sofar gt List
如何在拖动 UICollectionViewCell 时实现透明背景或圆角

我确定有must这是一种简单的方法但我已经花了很长时间在各种兔子洞里到目前为止还没有成功我有一个支持拖放的集合视图被拖动的单元格有一个UIImageView in the contentView 并且图像视图的背衬层应用了角半径单
如果其中一个进程意外终止，进程间内存会发生什么情况？

如果您对动机感兴趣我将在接下来的几句话中详细说明如果不是请跳至问题我正在考虑制作快速记录器但当程序崩溃时不受影响又名最后一些日志消息不会丢失所以我的想法是写入共享内存 ringbuffer 并让另一个低优先级进程从中读取并进行
如何在jsf中启用浏览器缓存

我使用 JSF 2 0 创建了一个 Web 应用程序我收到朋友的反馈说我应该执行浏览器缓存因为我有很多图像但是我不知道如何在 JSF 中做同样的事情任何想法提示将不胜感激关于要做什么的概念也会起作用只需使用
继承和多态性的低级细节

这个问题是我心中的一大疑惑也很难用语言来形容有时它看起来很明显有时却很难破解所以问题是这样的 class Base public int a number Base virtual void function1 virtual vo
如何通过 Java High Level Rest Client 实现安全弹性搜索

我是弹性搜索新手通过将我的 Spring boot 应用程序与 Elastic 搜索集成Java High Level Rest Client 我已经配置了 JHLRC bean 如下所示它工作正常 Bean destroyMethod
调试时如何直接在IDE中查看其他对象的私有字段？

C 是我最熟悉的语言但工作时使用 Java 我想你可以说我对使用 Visual Studio IDE 非常满意我喜欢它的调试器的一件事是我可以将监视变量 Eclipse 中的表达式 any表达因此我可以在调试时毫无问题地查看特定字
如何在Python中将集合转换为列表？

我正在尝试将 Python 2 6 中的集合转换为列表我正在使用这个语法 first list 1 2 3 4 my set set first list my list list my set 但是我得到以下堆栈跟踪 Tracebac
cmake：将 FetchContent 与 find_package() 集成

我试图理解以下文档 https cmake org cmake help latest module FetchContent html integrating with find package https cmake org cmake
ANTLR4 不报告歧义

给出以下语法 grammar ReportAmbiguity unit statements statements callStatement lt uncomment this line callStatement CALL ID arg
线程安全内存池

我的应用程序目前对性能非常关键每帧请求 3 5 百万个对象最初为了让事情顺利进行我new d一切让应用程序运行并测试我的算法该应用程序是多线程的一旦我对性能感到满意我就开始为我的对象创建一个内存管理器明显的原因是内存碎片和
Compass 和 sass：可以自动导入所有部分吗？ [复制]

这个问题在这里已经有答案了在 compass sass 设置中理想情况下我想将每个 scss 文件编译成一个大文件style css 寻找例如here https stackoverflow com questions 5688291
根据另一个 List 对 List 进行排序

我有两个列表 student new list
为什么 Android 通知需要 Firebase 以及 OneSignal、Pubnub 和 Pusher 等第三方通知提供商？

我正在研究反应本机推送通知在向任何第三方通知提供商购买产品之前我正在寻找一些答案为什么 OneSignal Pusher 和 PubNub 等第三方通知提供商基于 Firebase Cloud Messaging 他们不能在不依赖 F
列表推导式是 Python 3 中“列表（生成器表达式）”的语法糖吗？

在 Python 3 中列表理解是一个简单的语法糖用于输入到生成器表达式中list功能例如是下面的代码 squares x 2 for x in range 1000 实际上在后台转换成以下内容 squares list x 2 fo
是否对组对象使用应用与变换，以减去两列并获取平均值

考虑以下数据框 columns A B C D records foo one 0 162003 0 087469 bar one 1 156319 1 5262719999999999 foo two 0 833892 1 666304
使用 Fiddler 限制网络速度不起作用

我面临的问题几乎类似于以下线程尽管有自定义规则仍无法使用 fiddler 控制网络带宽 https stackoverflow com questions 20513610 unable to control the network b
使用 C++11，我还需要用于 Unicode 文本的非标准字符串操作库吗？

我注意到 std string 的 length 方法返回以字节为单位的长度而 std u16string 中的相同方法返回 2 字节序列的数量我还注意到当字符或代码点位于 BMP 之外时长度返回 4 而不是 2 此外 Unicod

使用 C++11，我还需要用于 Unicode 文本的非标准字符串操作库吗？

使用 C++11，我还需要用于 Unicode 文本的非标准字符串操作库吗？ 的相关文章

随机推荐

热门标签

使用 C++11，我还需要用于 Unicode 文本的非标准字符串操作库吗？的相关文章