std::u16string、std::u32string、std::string、length()、size()、代码点和字符

2024-02-13

我很高兴看到std::u16string and std::u32string在 C++11 中，但我想知道为什么没有std::u8string处理 UTF-8 情况。我的印象是std::string是为UTF-8设计的，但似乎做得不太好。我的意思是，不std::string.length()仍然返回字符串缓冲区的大小而不是字符串中的字符数？

那么，情况如何length()为新的 C++11 类定义的标准字符串的方法？它们是否返回字符串缓冲区的大小、代码点的数量或字符数（假设代理对是 2 个代码点，但一个字符。如果我错了，请纠正我）？

那么呢size();难道它不等于length()? See http://en.cppreference.com/w/cpp/string/basic_string/length http://en.cppreference.com/w/cpp/string/basic_string/length为我困惑的根源。

所以，我想，我的根本问题是如何使用std::string, std::u16string, and std::u32string并正确区分缓冲区大小、代码点数量和字符数量？如果您使用标准迭代器，您是否会迭代字节、代码点或字符？

u16string and u32string不是“新的 C++11 类”。它们只是 typedefsstd::basic_string for char16_t and cha32_t types.

length总是等于size对于任何basic_string。它的数量是T在字符串中，其中T是模板类型basic_string.

basic_string不以任何方式、形状或形式识别 Unicode。它没有代码点、字素、Unicode 字符、Unicode 标准化或任何类似的概念。它只是一个有序的序列T是。唯一可以识别 Unicode 的东西u16string and u32string是他们使用返回的类型u"" and U""文字。因此，它们可以存储 Unicode 编码的字符串，但它们不执行任何需要了解所述编码的操作。

迭代器迭代以下元素T，而不是“字节、代码点或字符”。如果T is char16_t，然后它会迭代char16_ts。如果字符串是 UTF-16 编码的，则它会迭代 UTF-16 代码单元，而不是 Unicode 代码点或字节。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

c

Unicode

std::u16string、std::u32string、std::string、length()、size()、代码点和字符的相关文章

ASP.NET MVC 中的经典 ASP (C#)

我有一个应用程序想要最终转换为 ASP NET MVC 我想要进行全面的服务升级到 ASP NET 但想要使用当前的 ASP 内容来运行当前的功能这样我就可以在对新框架进行增量升级的同时升级小部分该站点严重依赖于不太成熟的 VB6
在搜索 List 时，为什么 Enumerable.Any(Func predicate) 比带有 if 语句的 foreach 慢

最近有件事引起了我的好奇心 Why is the Enumerable Any Func
我的线程图像生成应用程序如何将其数据传输到 GUI？

Mandelbrot 生成器的缓慢多精度实现线程化使用 POSIX 线程 Gtk 图形用户界面我有点失落了这是我第一次尝试编写线程程序我实际上并没有尝试转换它的单线程版本只是尝试实现基本框架到目前为止它是如何工作的简要描述 M
32 位应用程序的特征最大矩阵大小

所以我正在寻找Eigen http eigen tuxfamily org index php title Main Page当我尝试声明大于 10000x10000 的矩阵时包崩溃我需要声明一个像这样的矩阵可靠地大约有 13000
构造函数中显式关键字的使用

我试图了解 C 中显式关键字的用法并查看了这个问题C 中的explicit关键字是什么意思 https stackoverflow com questions 121162 但是那里列出的示例实际上是前两个答案对于用法并不是很清楚
C++ 异步线程同时运行

我是 C 11 中线程的新手我有两个线程我想让它们同时启动我可以想到两种方法如下然而似乎它们都没有按照我的预期工作他们在启动另一个线程之前启动一个线程任何提示将不胜感激另一个问题是我正在研究线程队列所以我会有两个消费者和
如何配置 WebService 返回 ArrayList 而不是 Array？

我有一个在 jax ws 上实现的 java Web 服务此 Web 服务返回用户的通用列表它运行得很好 Stateless name AdminToolSessionEJB RemoteBinding jndiBinding Admi
在非活动联合成员上使用“std::addressof”是否定义明确[重复]

这个问题在这里已经有答案了下面的代码是尝试实现constexpr的版本offsetof在 C 11 中它可以在 gcc 7 2 0 和 clang 5 0 0 中编译这取决于申请std addressof工会非活跃成员的成员这是明确
Azure 事件中心 - 按顺序接收事件

我使用下面的代码从 Azure Event Hub 接收事件 https learn microsoft com en us azure event hubs event hubs dotnet framework getstarted s
基于xsd模式生成xml（使用.NET）

我想根据我的 xsd 架构 cap xsd 生成 xml 文件我找到了这篇文章并按照说明进行操作使用 XSD 文件生成 XML 文件 https stackoverflow com questions 6530424 generatin
通过 NHibernate 进行查询，无需 N+1 - 包含示例

我有一个 N 1 问题我不知道如何解决它可以在这个问题的底部找到完全可重复的样本因此如果您愿意请创建数据库设置 NUnit 测试和所有附带的类并尝试在本地消除 N 1 这是我遇到的真实问题的匿名版本众所周知这段代码对于帮助
获取 2 个数据集 c# 中的差异

我正在编写一个简短的算法它必须比较两个数据集以便可以进一步处理两者之间的差异我尝试通过合并这两个数据集并将结果更改放入新的数据集来实现此目标我的方法如下所示 private DataSet ComputateDiff DataSet
尚未处理时调用 Form 的 Invoke 时出现 ObjectDisposeException

我们得到一个ObjectDisposedException从一个电话到Invoke在尚未处理的表格上这是一些演示该问题的示例代码 public partial class Form2 Form void Form2 Load object
将代码拆分为标头/源文件

我从 Asio 的示例页面中获取了以下代码 class tcp connection public boost enable shared from this
耐用功能是否适合大量活动？

我有一个场景需要计算 500k 活动都是小算盘由于限制我只能同时计算 30 个想象一下下面的简单示例 FunctionName Crawl public static async Task
strcmp 给出分段错误[重复]

这个问题在这里已经有答案了这是我的代码给出分段错误 include
转到定义：“无法导航到插入符号下的符号。”

这个问题的答案是社区努力 help privileges edit community wiki 编辑现有答案以改进这篇文章目前不接受新的答案或互动我今天突然开始在我的项目中遇到一个问题单击转到定义会出现一个奇怪的错误无法导航到
运算符“==”不能应用于“int”和“string”类型的操作数

我正在编写一个程序我想到了一个数字然后计算机猜测了它我一边尝试一边测试它但我不断收到不应该出现的错误错误是主题标题我使用 Int Parse 来转换我的字符串但我不知道为什么会收到错误我知道它说不能与整数一起使用但我在网
双精度类型二维多维数组的 pinvoke 编组作为 c# 和 c++ 之间的输入和输出

我有以下我正在尝试解决的双物质类型的 2d 多维数组的 c 和 c pinvoke 编组我已经查看了以下热门内容以获得我目前拥有的内容使用双精度数组进行 P Invoke 在 C 和 C 之间编组数据 https stackoverflo
带重定向标准流的 C# + telnet 进程立即退出

我正在尝试用 C 做一个脚本化 telnet 项目有点类似于Tcl期望 http expect nist gov 我需要为其启动 telnet 进程并重定向和处理其 stdin stdout 流问题是生成的 telnet 进程在

随机推荐

如何正确地将 C ioctl 调用转换为 python fcntl.ioctl 调用？

以下是一个例子重置串行端口 http www roman10 net how to reset usb device in linux 在 Linux 中我想翻译以下代码片段 fd open filename O WRONLY ioctl
Rails 模型属性在数据库中没有相应的列

我有一些不需要任何持久性的 Rails 模型但是我希望 Rails 认为该模型实际上具有属性 x y z 因此当在控制器中调用像 to json 这样的方法时我可以免费获得它们例如 class ModelWithoutTableCol
@Types/node/index.d.ts TypeScript 错误 TS2309

我有一个使用 SystemJs 的 Net Core Angular 2 项目我最近从 Typings 升级到了 Types 截至 2016 年 12 月 21 日该项目已使用适用于 Net Core 1 0 1 TypeScript
自定义 SSL 证书颁发机构？

是否有可以添加到我的浏览器的自定义 SSL 证书颁发机构我们使用很多内部网址例如 http www somproject somebranch http www somproject somebranch 用于在各个分支机构工作如果我
PyQt：QFileDialog.getExistingDirectory 使用默认目录，与用户无关

当使用QFileDialog getExistingDirectory我找到了指定目录默认路径的方法我想在我的 Linux Mint 机器上的用户主文件夹中使用默认目录我用了 my dir QtGui QFileDialog get
理解Android的

我不明白图层列表是如何工作的我看了官方的带有一些示例的文档 http developer android com guide topics resources drawable resource html LayerList但它并不像预期
Django Forms 和 Bootstrap - CSS 类和

我在用着推特引导程序 https github com twitter bootstrap tree 2 0 wip使用 Django 来渲染表单 Bootstrap可以很好地格式化您的表单只要您有CSS它期望包含的类然而我的问题是
ArrayList 的 ConcurrentModificationException [重复]

这个问题在这里已经有答案了我有以下代码 private String toString List
实体框架 4.1：无法从 DbQuery 转换为 ObjectQuery

我有以下代码 public void DeleteAccountsForMonth int year int month var result from acm in this database AccountsOnMonth where
SQL 查询的日期时间参数

我正在重构我的代码考虑这个例子 public virtual List
Sherlock 操作栏的菜单项背景

我在 Sherlock 操作栏中呈现自定义视图时遇到问题发生的情况是我已经成功地在操作栏中设置了自定义视图旨在将标题文本视图设置在中心但是当我设置其他菜单项例如刷新时它的背景会显示为黑色主页按钮也会发生同样的情况请浏览以下快
加载本地数据谷歌colab

我有一个 npy 文件 largeFIle npy 保存在我的谷歌驱动器上的同一个 colab笔记本文件夹中我保存了我的谷歌colab笔记本我正在尝试使用下面的代码将数据加载到我的笔记本中但是我收到以下错误当我在笔记本电脑上本地运
C# 从 List 获取键和值

给定一个列表 private List
java 的 servicewrapper 的替代品？

我用过服务包装器 http wrapper tanukisoftware org doc english download jsp然而在过去的几次双重许可证对于商业产品来说有些复杂通常你必须付费是否有具有类似功能的完全自由和开源软件
寻找 C# 代码解析器 [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一组类最好在 net 框架中它们将解析 C 代码并返回带有参数的函数列表类及其方法属
为什么 Dockerized Hadoop 数据节点注册了错误的 IP 地址？

我有 Hadoop 2 7 1 名称节点和数据节点的单独 Docker 1 9 1 映像我可以从中创建容器并让它们通过用户定义的 Docker 网络进行通信然而数据节点似乎报告自己拥有网络网关的 IP 地址而不是它自己的 IP 地
将 admin date_hierarchy 设置为foreignkey日期字段

当我尝试设置时 date hierarchy schedule date 其中 Schedule 是外键我收到以下错误 TestAdmin date hierarchy refers to field schedule date that
使用 Express 后端将 create-react-app 部署到 heroku 在浏览器中返回无效的主机标头

标题说明了一切我在这里构建了一个最小的工作示例 https github com sehailey proxytest https github com sehailey proxytest 我已经尝试过所以我可能已经记不清了尽管它们
在 sed -i （正则表达式？）bash 内部使用变量

我看过另一个sed这里的页面我找不到使用的页面 i在正则表达式搜索部分有一个变量我正在尝试剪切文件中请求的行myresolv conf并获取其行号我班5个人都卡住了任何帮助都很棒 line grep n 3 myresolv con
std::u16string、std::u32string、std::string、length()、size()、代码点和字符

我很高兴看到std u16string and std u32string在 C 11 中但我想知道为什么没有std u8string处理 UTF 8 情况我的印象是std string是为UTF 8设计的但似乎做得不太好我的意思是

std::u16string、std::u32string、std::string、length()、size()、代码点和字符

std::u16string、std::u32string、std::string、length()、size()、代码点和字符 的相关文章

随机推荐

热门标签

std::u16string、std::u32string、std::string、length()、size()、代码点和字符的相关文章