C++ 中的十进制到 Unicode Char

2024-01-01

输出时如何将十进制数（例如 225）转换为其对应的 Unicode 字符？我可以将 ASCII 字符从十进制转换为如下字符：

int a = 97;
char b = a;
cout << b << endl;

它输出字母“a”，但当我使用数字 225 或任何非 ascii 字符时，它只输出一个问号。

首先，将写入标准输出的字节字符串转换为可见字符的不是 C++ 程序；而是 C++ 程序。它是您的终端（或者，现在更常见的是您的终端模拟器）。不幸的是，无法询问终端如何对字符进行编码，因此需要将其配置到您的环境中；通常，这是通过设置适当的locale环境变量。

像大多数与终端有关的事情一样，如果没有使用多年的遗留软件和硬件（其中大多数最初设计时没有太多考虑细节），区域设置配置系统可能会以非常不同的方式完成。例如带重音的字母、音节表或表意文字。这就是生活。

Unicode 非常酷，但面对书写系统的计算机表示的特定历史，它也必须被部署，这意味着面对软件工程中各种坚定但完全矛盾的观点，要做出很多妥协dicho sea de paso 社区，在这个社区中，头撞比妥协更为常见。事实上 Unicode 最终或多或少变得the标准证明了其坚实的技术基础以及其推动者和设计者（尤其是马克·戴维斯）的毅力和政治技巧，尽管事实上它基本上花了二十多年才达到这一点，但我还是这么说。

这段协商和妥协历史的一个方面是，将 Unicode 字符串编码为位的方法不止一种。至少有三种方法，其中两种根据字节顺序有两个不同的版本；此外，每种编码系统都有其专门的粉丝（因此也有其教条主义的批评者）。特别是，Windows 很早就决定采用主要为 16 位的编码 UTF-16，而大多数 UNIX（类似）系统则使用可变长度的 8 到 32 位编码 UTF-8。（从技术上讲，UTF-16 也是一种 16 位或 32 位编码，但这超出了本文的范围。）

在 Unicode 出现之前，每个国家/地区/语言都使用自己独特的 8 位编码（或者至少是那些语言使用少于 194 个字符的字母表书写的国家/地区）。因此，将编码配置为本地表示的一般配置的一部分是有意义的，例如月份名称、货币符号以及将数字的整数部分与其小数部分分隔开的字符。既然 Unicode 已经广泛（但还远未达到普遍）融合，那么语言环境包含 Unicode 编码的特定风格似乎很奇怪，因为所有风格都可以表示相同的 Unicode 字符串，并且编码更普遍地特定于特定的特定风格。正在使用的软件比民族特质。但这就是为什么在我的 Ubuntu 机器上，环境变量LANG被设定为es_ES.UTF-8不仅仅是es_ES. (Or es_PE，应该如此，只是我一直遇到该语言环境的小问题。）如果您使用的是 Linux 系统，您可能会发现类似的东西。

理论上，这意味着我的终端模拟器（konsole，碰巧，但有多种）期望看到 UTF-8 序列。而且，确实，konsole足够聪明来检查区域设置并设置其默认编码以匹配，但我可以随意更改编码（或区域设置），并且可能会导致混乱。

因此，我们假设您的区域设置和终端使用的编码实际上是同步的，它们应该位于配置良好的工作站上，然后返回到 C++ 程序。现在，C++ 程序需要弄清楚它应该使用哪种编码，然后从它使用的任何内部表示转换为外部编码。

幸运的是，C++ 标准库should如果您通过以下方式配合，请正确处理：

告诉标准库use配置的区域设置，而不是默认的区域设置C（即仅使用英语中的非重音字符）区域设置；和
使用基于字符串和iostreamswchar_t（或其他一些宽字符格式）。

如果你这样做，理论上你不需要知道什么wchar_t对您的标准库意味着什么，也不对特定位模式对您的终端模拟器意味着什么。那么让我们尝试一下：

#include <iostream>
#include <locale>

int main(int argc, char** argv) {
  // std::locale()   is the "global" locale
  // std::locale("") is the locale configured through the locale system
  // At startup, the global locale is set to std::locale("C"), so we need
  // to change that if we want locale-aware functions to use the configured
  // locale.
  // This sets the global" locale to the default locale. 
  std::locale::global(std::locale(""));

  // The various standard io streams were initialized before main started,
  // so they are all configured with the default global locale, std::locale("C").
  // If we want them to behave in a locale-aware manner, including using the
  // hopefully correct encoding for output, we need to "imbue" each iostream
  // with the default locale.
  // We don't have to do all of these in this simple example,
  // but it's probably a good idea.
  std::cin.imbue(std::locale());
  std::cout.imbue(std::locale());
  std::cerr.imbue(std::locale());
  std::wcin.imbue(std::locale());
  std::wcout.imbue(std::locale());
  std::wcerr.imbue(std::locale());

  // You can't write a wchar_t to cout, because cout only accepts char. wcout, on the
  // other hand, accepts both wchar_t and char; it will "widen" char. So it's
  // convenient to use wcout:
  std::wcout << "a acute: " << wchar_t(225) << std::endl;
  std::wcout << "pi:      " << wchar_t(960) << std::endl;
  return 0;
}

这适用于我的系统。 YMMV。祝你好运。

小旁注：我遇到过很多这样认为的人wcout自动写入“宽字符”，因此使用它会产生 UTF-16 或 UTF-32 或其他内容。事实并非如此。它产生完全相同的编码cout。区别不在于它输出什么，而在于它接受什么作为输入。事实上，它与cout因为它们都连接到同一个操作系统流，该流只能有一种编码（一次）。

您可能会问为什么需要有两个不同的iostreams。为什么不能cout刚刚接受wchar_t and std::wstring价值观？我实际上对此没有答案，但我怀疑这是不为不需要的功能付费的哲学的一部分。或类似的东西。如果你弄清楚了，请告诉我。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

C++ 中的十进制到 Unicode Char 的相关文章

在 C++ 中，当我将值传递给函数时，它是否总是转换为适当的类型？

如果我有一个像这样的函数void func size t x 我称该函数为func 5 5 立即转换为size t类型这通常适用于所有类型吗我问这个问题是因为我发誓我见过人们编写代码他们做类似的事情func 5 0 将 5 作为双精度
为什么不能使用initializer_list来初始化unique_ptr的向量？ [复制]

这个问题在这里已经有答案了我想知道为什么initializer list 不能与unique ptr 一起使用 std vector
函数的不明确的引用/值版本

考虑以下函数原型 void Remove SomeContainer Vec const std size t Index SomeContainer Remove SomeContainer Vec const std size t In
Windows CE 6.0 和运行时链接到调试 DLL /MDd

我在 x86 PC 上使用 Windows CE 6 0 R3 我已经为该平台构建了 NK bin 和 SDK 但我有一些问题需要了解如何使用 MTd 调试 DLL 构建控制台应用程序如果我尝试构建这个 main c with MDd i
ASP.NET Core 中 AsNoTracking 的模拟或更好的解决方法

您如何模拟 AsNoTracking 或者是否有更好的解决方法来解决此问题 Example public class MyContext MyContextBase Constructor public MyContext DbContex
通过 EUSART PIC18F45K80 打印消息

我正在尝试向 Docklight 发送串行消息但始终收到空值我正在使用带有 XC8 MPLAB X 的 PIC18F45K80 我的代码中的所有内容似乎都是正确的但我想我错了我该如何修复它 include
是否返回 std::move (x)？

Are std vector
我可以将特定警告视为错误吗？

以下是我有时在学生代码中看到的模式的简化版本 bool foobar int a int b if a lt b return true 当然真正的代码要复杂得多 Visual Studio 报告警告 C4715 并非所有控制路径都会返回
对无符号 8 位整数进行左移操作 [重复]

这个问题在这里已经有答案了我试图理解 C C 中的移位运算符但它们给我带来了困难我有一个无符号 8 位整数初始化为一个值例如 1 uint8 t x 1 根据我的理解它在内存中的表示方式如下 0 0 0 0 0 0 0 1 现在
如何实现可变虚拟成员函数

所以我有这个功能 virtual void CallRemoteFunction const char pServerGameObjectId const char pFunctionName OVariant arg1 OVariant
Math.Sin、Math.Cos 和 Math.Tan 精度以及正确显示它们的方法

我正在用 C 编写一个计算器 textBoxResult是一个文本框我在其中显示数字 recount是以度为单位获取角度并以弧度为单位返回的函数我的角度是从texBoxInput public double recount int nu
为什么Windsor只能拦截虚方法或接口方法？

我正在阅读文档发现如果不使用接口那么 Windsor 只能拦截虚拟方法这是 Windsor 的限制还是 C 语言的限制我正在寻找深入的答案 C 语言在这里完全无关问题是拦截在运行时级别如何工作一种技术是从类继承实现接口并将其用
如何在 C 预处理器中可靠地检测 Mac OS X、iOS、Linux、Windows？ [复制]

这个问题在这里已经有答案了如果有一些跨平台 C C 代码需要在 Mac OS X iOS Linux Windows 上编译我如何在预处理器过程中可靠地检测到它们大多数编译器都使用预定义的宏您可以找到列表here http sour
C# 或 Windows 相当于 OS X 的 Core Data？

我迟到了现在才开始在 OS X Cocoa 中使用 Core Data 它令人难以置信并且确实改变了我看待事物的方式 C 或现代 Windows 框架中是否有等效的技术即拥有可免费保存数据管理删除搜索的托管数据类型还想知道Li
如何明智地解释这个编译器警告？

当我执行这段代码时question https stackoverflow com a 51056490 2411320 我收到这个警告 warning format d expects argument of type int but a
使用 Node.js 访问用 C++ 编写的 SDK

我有一个用 C 语言编写的 SDK 可以与我的扫描仪设备进行通信我需要开发一个可以访问扫描仪设备的电子应用程序我知道有很多库可用于扫描仪但我想使用这个 SDK 因为它允许我访问设备的完整功能而且它是由设备制造商提供的那么有没有什
C 中函数“fgets”的参数太少

每当我编译这个错误时我都会收到该错误但我不知道为什么我直接从书上抄袭这个有人可以帮忙吗 include
为什么 char 数组需要 strcpy 而 char star 不需要 - 在 C 中使用结构

我对这段代码有一个误解 typedef struct EXP int x char name char lastName 40 XMP main XMP a a name eaaa a lastName strcpy a lastName
使用 QTestLib 时抑制 qDebug

我正在向 Qt 中的项目添加单元测试并希望使用 QTestLib 我已经设置了测试并且它们运行良好问题是在项目中我们重写了 qDebug 以输出到我们自己的日志文件这在运行应用程序时效果很好问题是当我测试类时它有时会开始记录然后
如何在您的网站中连接两个人

有一款名为 Verbosity 的游戏这是一款有目的的游戏位于此链接上www gwap com 在游戏中他们随机连接两个玩家互相玩游戏是玩家1应该向他的搭档玩家2 描述一个单词而玩家2应该猜测这个单词我正在尝试建立一个网站来执

随机推荐

在 R 中将向量彻底划分为对的方法

这是受到另一个标记为复制 https stackoverflow com questions 47197044 partitioning a vector into all possible combinations of paired v
python 嵌入：将列表从 C 传递到 python 函数

尝试从 C 将列表传递给 python 不起作用这是相关代码使用其他相关帖子编写 Py Initialize PyObject sys PyImport ImportModule sys PyObject path PyObject G
类模板的单个成员可以部分特化吗？

我发现了一个有趣的观点但我无法解释或找到解释考虑以下模板定义使用 mingw g 4 6 2 编译 template
即使现在，Objectify 也不会同步存储

我的 servlet 应该执行以下操作当用户在某个场所注册时我检查他当前是否在某个地方注册即使是同一个场所如果是则注销他并再次注册他我有以下代码我对其进行了简化以显示我的问题 Date tempDate new Date Vi
SyntaxError：（unicode错误）'unicodeescape'编解码器无法解码字节[重复]

这个问题在这里已经有答案了我的 python 脚本有问题当我运行它时出现以下错误 ics2owncloud py File ics2owncloud py line 46 if r status code 500 and Sabre
如何在 Ubuntu 10.04 中设置 python IDLE 以使用 pythonpath 变量

我在 bashrc 中设置了一个 pythonpath 变量当从命令行和 bpython 使用 python 解释器时它工作正常但 IDLE 无法识别它如何配置它来加载 pythonpath 变量提前致谢您可以升级 Ubuntu
使用 system() 执行 shell 脚本返回 256。这是什么意思？

我编写了一个 shell 脚本来软重启 HAProxy 反向代理从 shell 中执行脚本是可行的但我想要一个守护进程来执行脚本那是行不通的 system 返回 256 我不知道这意味着什么 bin sh save previous
Oracle 中将 LONG 转换为 varchar

我正在对一堆旧解决方案进行一些清理作为清理工作的一部分我正在考虑从 Oracle 数据库中删除一些旧触发器这些触发器最初是由我的同事设计的并由第三方顾问安装到位我无法直接访问 Oracle 数据库除非通过server link来
Facebook 登录按钮 onclick 时出错

我尝试按照说明为我的应用程序添加 Facebook 登录信息 https developers facebook com docs facebook login android v2 2 https developers facebook
按钮上的多次点击侦听器

我想知道如何向 XML 中定义的按钮添加多个单击事件如之前在 Java 中我们实现的View onClickListener界面并完成其余工作onClick method 例子 Override public void onClick V
以自然（非反向）顺序将函数应用于 std::tuple 中的元素

我需要为任意元组中的每个元素调用模板或重载函数准确地说我需要对元组中指定的元素调用此函数例如我有一个元组std tuple
在 Docker 容器中运行图形进程，分离并重新连接到正在运行的 GUI

假设我在 Python 中进行了一些需要很长时间的计算并且是从 Spyder IDE 运行的因此可以轻松检查结果并用于以后的进一步工作我想在服务器计算机上托管的 Docker 容器内运行 Spyder 进程即与我坐在前面的计算机不同
从 Angular2 应用程序链接到全局节点模块文件夹

我希望有一个集中的 Node 模块文件夹使用 npm update g 保存到 C 盘而不是应用程序中包含的通常的本地文件夹因为 Angular2 CLI 在本地文件夹中安装了 125mb 的 Node 模块因此在打字稿文件中我
Python 3.5 - ssl.SSLEOFError：EOF 发生违反协议（_ssl.c：645）

我在用Keras并尝试加载mnist数据集网站链接为 https s3 amazonaws com img datasets mnist pkl gz https s3 amazonaws com img datasets mnist p
用于安全创建临时目录的 POSIX 函数是什么？

用于创建临时目录的任务 tmp 人们会如何选择mkdtemp mkstemp等等用于可移植代码我认为您需要在其他用户可能具有写入权限的目录中创建一个临时目录作为管理员您应该进行设置以便每个用户都有自己的TMPDIR 例如与pam
C++ std::map 命名要求分配器感知容器

目前我正在尝试将一些 C 的命名需求转换为 C 20 概念 https godbolt org z EdY5d6319 https godbolt org z EdY5d6319仍然处于高度WIP状态然而我遇到了一个问题鉴于最终的 C
使用文件“php.ini”关闭显示错误

我正在尝试关闭我网站上的所有错误我已经遵循了有关如何执行此操作的不同教程但我不断收到阅读和打开错误消息我有什么遗漏的吗我在我的中尝试过以下操作php ini file Error display display startup er
SwiftUI 从另一个视图重新排序列表动态部分

我有一个简单的List与存储在内部的部分ObservableObject 我想从另一个角度重新排序它们这是我的代码 class ViewModel ObservableObject Published var sections S1 S2
基本的 Spring Boot 应用程序无法正常工作，显示：无法从进程 xxxx 刷新实时数据

我是 Spring Boot 的初学者我初始化了一个新项目并尝试运行它但它没有成功运行当我将其作为 Spring Boot 应用程序运行时它就会开始执行在底部编译器状态栏中它显示处理和重试它最多运行 10 次并抛出以下错误
C++ 中的十进制到 Unicode Char

输出时如何将十进制数例如 225 转换为其对应的 Unicode 字符我可以将 ASCII 字符从十进制转换为如下字符 int a 97 char b a cout lt lt b lt lt endl 它输出字母 a 但当我使用数字

C++ 中的十进制到 Unicode Char

C++ 中的十进制到 Unicode Char 的相关文章

随机推荐

热门标签