C++ 标准是否强制要求对 wchar_t 进行编码？

2024-03-08

以下是我的 2014 年标准草案 N4140 副本的一些摘录

22.5 标准代码转换方面 [locale.stdcvt]

3 对于三个代码转换方面中的每一个codecvt_utf8, codecvt_utf16, and codecvt_utf8_utf16:
(3.1)——Elem是宽字符类型，例如wchar_t, char16_t, or char32_t.

4 对于面codecvt_utf8:
(4.1) — 构面应在 UTF-8 多字节序列和 UCS2 或 UCS4 之间进行转换（取决于Elem）在程序内。

对这两段的一种解释是wchar_t必须编码为 UCS2 或 UCS4。我不太喜欢它，因为如果这是真的，我们就将语言的一个重要属性深埋在库描述中。我试图找到对该属性的更直接的表述，但无济于事。

另一种解释是wchar_t编码不需要是 UCS2 或 UCS4，并且在不是 UCS2 或 UCS4 的实现中，codecvt_utf8不会为wchar_t。我也不太喜欢这种解释，因为如果这是真的，而且两者都不是char nor wchar_t本机编码是 Unicode，似乎没有办法在这些本机编码和 Unicode 之间进行可移植的转换。

这两种解释哪一个是正确的？还有一个我忽略的吗？

澄清我不是在询问有关适用性的一般意见wchar_t用于软件开发或属性wchar_t一个人可以从其他地方获得。我有兴趣在这两个具体段落中标准的。我试图理解什么这些具体段落包含或不包含。

澄清2。如果 4.1 表示“facet 应在 UTF-8 多字节序列和 UCS2 或 UCS4 之间进行转换或当前全局语言环境对 wchar_t 施加的任何编码“ 不会有问题。事实并非如此。它说的是它所说的。看来如果有人使用std::codecvt_utf8<wchar_t>，最终得到一堆wchar_t编码为 UCS2 或 UCS4，无论当前的全局区域设置如何。（无法指定区域设置或任何字符转换方面codecvt_utf8）。因此，问题可以这样重新表述：转换结果是否可直接用于当前全局语言环境（和/或任何可能的语言环境）进行输出，wctype查询等等？如果没有的话有什么用for？（如果上面的第二种解释是正确的，那么答案似乎是“什么也没有”）。

wchar_t只是一个完整的文字。它有最小值、最大值等。

它的尺寸没有由标准固定。

如果足够大，您可以将 UCS-2 或 UCS-4 数据存储在以下缓冲区中wchar_t。无论您使用什么系统，都是如此，因为 UCS-2 和 UCS-4 以及 UTF-16 和 UTF-32 只是按序列排列的整数值的描述。

在C++11中，有std假设数据具有这些编码，则读取或写入数据的 API。在 C++03 中，存在使用当前语言环境读取或写入数据的 API。

22.5 标准代码转换方面 [locale.stdcvt]

3 对于三个代码转换方面 codecvt_utf8、codecvt_utf16 和 codecvt_utf8_utf16 中的每一个：

(3.1) — Elem 是宽字符类型，例如 wchar_t、char16_t 或 char32_t。

4 对于方面 codecvt_utf8：

(4.1) — 方面应在程序内的 UTF-8 多字节序列和 UCS2 或 UCS4（取决于 Elem 的大小）之间进行转换。

所以在这里codecvt_utf8_utf16处理utf8一侧为 UCS2 或 UCS4（取决于 Elem 的大小），另一侧为 UCS2 或 UCS4。它进行转换。

Elem（宽字符）被假定为 UCS2 或 UCS4 编码，具体取决于它的大小。

这并不意味着wchar_t是这样编码的，它只是意味着这个操作解释了wchar_t被如此编码.

UCS2 或 UCS4 如何进入 Elem 并不是这部分标准所关心的。也许你用十六进制常量将其设置在那里。也许你是从 io 上读到的。也许你是即时计算出来的。也许您使用了高质量的随机数生成器。也许您将一个的位值加在一起ascii细绳。也许您计算了一个定点近似值log*月球将地球日改变 1 秒所需的秒数。不是这些段落的问题。这些段落只是规定了如何修改和解释位。

类似的主张在其他情况下也成立。这并不强制要求什么格式wchar_t有。它只是说明了这些方面如何解释wchar_t or char16_t or char32_t or char8_t（阅读或写作）。

其他互动方式wchar_t使用不同的方法来规定值的大小wchar_t被解释。

iswalpha http://en.cppreference.com/w/cpp/string/wide/iswalpha使用（全局）区域设置来解释wchar_t，例如。在一些当地人看来，wchar_t可能是UCS2。在其他情况下，它可能是一些疯狂的邪神编码，其细节使您能够从太空中看到新的颜色。

明确地说：编码不是数据或位的属性。编码是以下属性数据解释。很多时候只有一个proper or 合理的对数据进行任何有意义的解释，但数据本身就是位。

C++ 标准不强制要求存储在 a 中的内容wchar_t。它确实规定了某些操作对内容的解释wchar_t成为。该部分描述了某些方面如何解释数据wchar_t.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

C++ 标准是否强制要求对 wchar_t 进行编码？的相关文章

此上下文中仅支持实体类型、枚举类型或基本类型

我目前正在开发一个搜索页面我只需要返回主题的主题详细信息列表其中包含存储在 int ST 中的所有主题标签 id 目前 ST null true ST Contains b ThemeTagID 行似乎给了我一个错误附加信息无法创建
IssuerSigningKeyResolver 调用异步方法

我们使用 IssuerSigningKeyResolver 它是 Microsoft IdentityModel Tokens 的一部分用于令牌验证并接受非异步委托我们调用一个异步方法这将导致阻塞调用因此想知道使用它的正确方法是什么
我是否必须使用我的数据库训练 Viola-Jones 算法才能获得准确的结果？

我尝试提取面部数据库的面部特征但我认识到 Viola Jones 算法在两种情况下效果不佳当我尝试单独检测眼睛时当我尝试检测嘴巴时运作不佳检测图像的不同部分例如眼睛或嘴巴或者有时会检测到其中几个这是不可能的情况我使用的图像
UTF-8 在 Python 日志记录中，如何？

我正在尝试使用 Python 的日志记录包将 UTF 8 编码的字符串记录到文件中作为一个玩具示例 import logging def logging test handler logging FileHandler home ted
使用不存在和联接的 SQL 查询到 LINQ 语法

我的 SQL 查询如下所示在 SQL 中运行良好我需要将其转换为 LINQ 语法 SQL SELECT Key Id FROM LocalizationKeys AS lk WHERE NOT EXISTS SELECT 1 FROM
单击按钮本地化应用程序

我在我的项目 mainMaster 页面中找到了 imageButtons
序列化 .NET WCF 服务的类型时出现问题：服务 WSDL 在 XSD 中定义空类型

我正在使用 WCF 编写一个 Web 服务我创建了数据合约我创建了我的服务合同界面我定义了方法其参数的类型与数据契约相同我实现了创建服务类的服务合同我使用 svc 文件和 IIS 托管我的服务我尝试了我的服务寻找http
Java 统一编码

A Java char is 2 bytes http java sun com docs books tutorial java nutsandbolts datatypes html 最大大小为 65 536 但有95 221 http
如何将整个流读入 std::string ？

我正在尝试将整个流多行读入字符串中我正在使用这段代码它有效但它冒犯了我的风格感当然有更简单的方法吗也许使用字符串流 void Obj loadFromStream std istream stream std string s
C 中经过的时间

include
如何从子窗口中加载的用户控件按钮关闭子窗口？

这是我的 ChildWindow xaml 代码 1
是否可以在三元表达式上只放置一个选项？

我只是好奇这是否可能或者是否有办法使它成为 C 的有效语法 expression value do nothing here or put some empty block like SomeClass SomeMethod Edit 为
GCC 和 -Wconversion

让我们编译以下程序 int main uint16 t data 0 data uint16 t std round 3 14f return 0 with g Wconversion prog cpp 我们会得到warning conve
使用来自不同线程的实时数据更新 QTableView 的最佳策略

我的应用程序现在启动几个线程如 5 10 个来从不同源收集数据它们与主 GUI 线程分离因此我在 GUI 中感觉不到任何缓慢并且我可以在后台线程工作时继续工作一切都很棒但现在我希望能够在我的主 GUI 中的 QTableVie
如何在标准 SQL 中使用 Unicode 规范化删除变音符号（例如重音符号）？

如何使用新功能从 BigQuery 中的字符串中删除变音符号normalize https cloud google com bigquery docs reference standard sql functions and operat
在 C 或 C++ 中使用逗号作为宏名称

我想做这样的事情 define define MAX 10 000 000 undef 有什么技巧可以做到吗编辑我知道 C 14 中的数字分隔符我正在寻找一种技巧来对不兼容的编译器执行相同的操作 EDIT2 请考虑Variadic M
使用 CryptUnprotectData 解密 WEP wlan 配置文件密钥

我正在尝试使用解密 WEP 配置文件的密钥加密解除数据保护 http msdn microsoft com en us library windows desktop aa380882 28v vs 85 29 aspx 我获取配置文件密钥
在 asp.net MVC 控制器中调用异步外部 Web 服务

在 Asp net MVC 控制器 GET 方法中我调用外部 Web 服务用于 IP 地理定位返回 IP 位置的 json 数据如何使调用异步以便堆栈可以在等待服务响应时继续当 GEO IP 请求完成后我希望能够更新数据库
如何在 MVC 5 中设置自定义 ClaimsPrincipal？

我创建了一个自定义主体类 public class FacebookPrincipal ClaimsPrincipal public JObject Data get set 我想用它当用户登录时我尝试设置 var fbP new Fa
Bazel：为 cc_binary/cc_test 设置运行时环境变量和配置文件位置

我正在尝试在 Linux 上的 C 应用程序中使用 odbc 以下构建文件用于将库作为外部依赖项包含在内 licenses notice cc library name lib srcs lib libodbc so lib64 libod

随机推荐

如何获取 ntile() 的间隔

我试图弄清楚是否有一种方法可以获取用于何时的间隔ntile 用来我有一个样本我想将其用作获取较大样本的百分位值的基础并且我希望找到一种方法来获取使用时的间隔值ntile 对此的任何启发将不胜感激我真的很想把这个作为评论但我仍然无法
手动删除 anaconda python 中 pkgs 文件夹中的所有文件是否安全？

我运行这个命令来释放 anaconda 上的磁盘空间 conda clean all 但是仍然有一些大文件残留在pkgsanaconda python 中的文件夹手动删除其中的所有文件是否安全pkgs文件夹有破坏我的 anaconda
Invoke-Restmethod：如何获取返回码？

有没有办法在调用时将返回码存储在某处Invoke RestMethod在 PowerShell 中我的代码如下所示 url http www dictionaryapi com api v1 references collegiate x
如何从字符串中获取size_t？

我需要从用户输入中获取数组大小对我来说将输入存储为很自然size t 但是正在寻找合适的strto 功能我找不到我刚用过strtoull since unsigned long long保证至少是 64 位而且我无论如何都使用 C9
可变值和不可变值重定义有什么区别？

我读到 F 中的值是不可变的然而我也遇到了重新定义价值定义的概念它掩盖了以前的定义这与可变值有何不同我问这不仅是一个理论构造而且还询问是否有关于何时使用可变值以及何时重新定义表达式的建议或者如果有人可以指出后者不是惯用的 f
如何让 GNU Unifont 或 Free Mono 在 gvim windows 上运行？

我正在尝试在 Windows 7 上的 gvim 中获得对符文字符的支持我的 Fonts 目录中安装了 Free Mono 和 GNU Unifont 字体都支持此范围但它们没有出现在字体菜单中 gvim 给出了我收到以下行的无效字体
ASP.NET MVC 4 引用单父实体的多个外键

我正在尝试开发一个 ASP NET MVC 4 应用程序可以根据玩家的进攻防守和助攻技能对他们进行评级进攻防守和助攻是球员表上的外键引用相同的查找表评分我有以下父实体 public class Rating public in
为什么 tzset() 在 Mac OS X 上 fork 后速度变慢了？

Calling tzset fork之后显得很慢如果我第一次打电话我只会看到缓慢的情况tzset 在 fork 之前在父进程中我的TZ环境变量未设置我dtruss我的测试程序显示子进程读取 etc localtime对于每一个tzs
如何将按钮对齐到屏幕中间？

我正在尝试在屏幕中间放置 2 个按钮然而这些按钮与我现在拥有的代码重叠实际上我并没有使用那么多 CSS 所以这可能是一个新手问题这是我的html wrapper text align center button position a
使用 AVMutableComposition 缝合（合并）视频时修复方向

TLDR 查看编辑我正在 Swift 中创建一个测试应用程序我想使用以下命令将应用程序文档目录中的多个视频拼接在一起AVMutableComposition 我在某种程度上成功地做到了这一点我的所有视频都拼接在一起并且所有内容都显
HTTP 请求损坏

在接收大量流量的网站上一小部分请求是这样的 http cheezburger com ScriptResource axd d zaVpgH63ePt90pn br br p a src ScriptResource axd d zaVp
TFS 与 JIRA/Bamboo/SVN [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
如何在 us-central1 以外的网络区域使用 httpsCallable

我部署了一个云函数如下所示 export const publishVersion functions region europe west2 https onCall async data context gt 然后在我的网络客户端中
Golang - ToUpper() 在单个字节上？

我有一个 byte b 我想选择一个字节 b pos 并将其更改为大写然后小写 bytestype 有一个方法叫做ToUpper 我如何将其用于单个字节 Calling ToUpper在单字节上 OneOfOne 给出了最有效的调用数千
柯里化有什么好处？

我认为我不太理解柯里化因为我看不到它可以提供任何巨大的好处也许有人可以用一个例子来启发我证明它为什么如此有用它真的有好处和应用吗还是只是一个被过度重视的概念两者之间有细微差别currying and 部分应用尽管它们密切相关
BigQuery 分区表在 _PARTITIONTIME 上联接

有两个分区表都带有伪列 PARTITIONTIME 我想在 PARTITIONTIME 上加入它们然后我想使用 PARTITIONTIME 过滤器查询结果表但我注意到该过滤器仅传播到 JOIN 语句的第一个表下面是一个例子 WITH
如何在 Sublime Text 2 中解析来自 TypeScript 的错误消息？

我正在尝试为 TypeScript 设置 Sublime Text 2 构建系统我已按照我找到的指示进行操作here https stackoverflow com questions 12779631 how to configure
问题如何使 C# 的 VS IDE 设计器失效/刷新？

I have 定制表格继承自Form它实现了一个名为的布尔属性Prop 我将使用的表单将继承自定制表格此属性将对表单进行一些绘制和更改如果已启用但是这并没有按预期工作设计的 VS IDE 没有刷新以显示更改但是如果我按 Ctr
使用 boost::asio::ip::tcp::iostream 的低带宽性能

我写了一个小测试程序使用boost asio ip tcp iostream传输约 38 MiB 的数据 include
C++ 标准是否强制要求对 wchar_t 进行编码？

以下是我的 2014 年标准草案 N4140 副本的一些摘录 22 5 标准代码转换方面 locale stdcvt 3 对于三个代码转换方面中的每一个codecvt utf8 codecvt utf16 and codecvt utf8

C++ 标准是否强制要求对 wchar_t 进行编码？

C++ 标准是否强制要求对 wchar_t 进行编码？ 的相关文章

随机推荐

热门标签

C++ 标准是否强制要求对 wchar_t 进行编码？的相关文章