Windows 上 MBCS 和 UTF-8 的区别

2023-11-23

我正在阅读有关 Windows 上的字符集和编码的信息。我注意到 Visual Studio 编译器（针对 C++）中有两个编译器标志，称为 MBCS 和 UNICODE。它们之间有什么区别？我不明白的是 UTF-8 在概念上与 MBCS 编码有何不同？另外，我在中找到了以下引用MSDN:

Unicode 是一种 16 位字符编码

这否定了我所读到的有关 Unicode 的任何内容。我认为unicode可以用UTF-8和UTF-16等不同的编码进行编码。有人可以进一步阐明这种混乱吗？

我注意到有两个编译器 Visual Studio 编译器中的标志（例如 C++）称为 MBCS 和 UNICODE。什么是他们之间的区别？

Windows API 中的许多函数有两个版本：一种需要char参数（在特定于区域设置的代码页中）和一个需要wchar_t参数（UTF-16 格式）。

int MessageBoxA(HWND hWnd, const char* lpText, const char* lpCaption, unsigned int uType);
int MessageBoxW(HWND hWnd, const wchar_t* lpText, const wchar_t* lpCaption, unsigned int uType);

这些函数对中的每一个都有一个不带后缀的宏，这取决于是否UNICODE宏已定义。

#ifdef UNICODE
   #define MessageBox MessageBoxW
#else
   #define MessageBox MessageBoxA
#endif

为了使这项工作顺利进行，TCHARtype 被定义为抽象 API 函数使用的字符类型。

#ifdef UNICODE
    typedef wchar_t TCHAR;
#else
    typedef char TCHAR;
#endif

然而，这是个坏主意。您应该始终明确指定字符类型。

我不明白的是 UTF-8 是怎样的在概念上与 MBCS 不同编码？

MBCS 代表“多字节字符集”。对于字面意义上的人来说，UTF-8 似乎符合条件。

But in Windows, "MBCS" only refers to character encodings that can be used with the "A" versions of the Windows API functions. This includes code pages 932 (Shift_JIS), 936 (GBK), 949 (KS_C_5601-1987), and 950 (Big5), ~~but NOT UTF-8.~~

To use UTF-8, you have to convert the string to UTF-16 using MultiByteToWideChar, call the "W" version of the function, and call WideCharToMultiByte on the output. This is essentially what the "A" functions actually do, which makes me wonder why Windows doesn't just support UTF-8.

This inability to support the most common character encoding makes the "A" version of the Windows API useless. Therefore, you should always use the "W" functions.

Update：从 Windows 10 build 1903（2019 年 5 月更新）开始，现在支持 UTF-8 作为“ANSI”代码页。因此，我最初（2010 年）建议始终使用“W”函数不再适用，除非您需要支持旧版本的 Windows。看UTF-8 无处不在获取文本处理建议。

Unicode 是一种 16 位字符编码

这否定了我读到的有关统一码。

MSDN 是错误的。 Unicode 是一种 21 位编码字符集，有多种编码，最常见的是 UTF-8、UTF-16 和 UTF-32。（还有其他 Unicode 编码，例如 GB18030、UTF-7 和 UTF-EBCDIC。）

每当 Microsoft 提到“Unicode”时，它们实际上指的是 UTF-16（或 UCS-2）。这是有历史原因的。 Windows NT 是 Unicode 的早期采用者，当时 16 位被认为对每个人来说都足够了，而 UTF-8 仅在 Plan 9 上使用。所以 UCS-2was统一码。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Windows 上 MBCS 和 UTF-8 的区别的相关文章

s60 的 python 希伯来语字符串

我在 S60 上使用 python 我想使用希伯来语字符串在 GUI 上表示它们并以短信形式发送它们看来 PythonScriptShell 不接受这样的表达式例如 u 我能做些什么谢谢事态发展我添加了这一行 coding ut
Windows 上的本机窄字符串编码是什么？

Subversion API 有一个功能数量 http subversion apache org docs api latest svn utf 8h html用于从本机编码字符串转换为以 UTF 8 编码的字符串我的问题是 Win
如何确定某个键是否被按下，只知道它在美国键盘上的位置？

考虑一下对于 Windows 视频游戏我需要确定在美式英语键盘布局上生成和字符的键通常位于 Escape 键下方并保留为 1 是否已被按下这听起来似乎是一个微不足道的问题但对我来说似乎不是一个问题当Windows发送键盘消息
Windows 注册表中的 DefaultConnectionSettings 值的格式是什么？

Windows 注册表项 HKCU Software Microsoft Windows CurrentVersion Internet Settings Connections 包含一个名为的二进制值DefaultConnectionSe
使用 DOMDocument 进行 PHP 编码
从 Windows 批处理文件中检测 ANSI 兼容控制台？

Windows 10 控制台主机 conhost exe has 对 ANSI 转义序列的本机支持 https msdn microsoft com en us library windows desktop mt638032 aspx 旧
是否存在 UTF-8 编码中未使用的字节？

据我了解 UTF 8 是 ASCII 的超集因此包括不用于表示可打印字符的控制字符我的问题是是否有任何字节 256 个不同的字节未被 UTF 8 编码使用我想知道你是否可以转换编码UTF 8 文本转二进制这是我的思考过程我不
alter Windows 文件中的 krb5.ini 文件哪里去了？

至少在 Windows XP 之前如果您加入具有 Kerberos 领域特定设置的域就会有一个 krb5 ini 文件从 Vista 或 7 开始不再需要此文件我试图找到有关此的更多信息但陷入困境 krb5 ini 文件中的设置
从 Get-ChildItem -Path 返回对象数组

从 powershell 开始 ls R txt将按目录递归列出文件或者更好 PS gt Get ChildItem Path C Test Name logs anotherfile txt Command txt CreateTest
Windows 批处理文件：如何启用命令的内联回显

如果在 Windows 批处理文件中默认禁用 echo 是否有办法为特定命令内联启用它我知道可以回显特定命令disabled通过在命令前添加但是有没有办法做相反的事情呢例如假设有一个像这样的批处理文件 echo off cmd1
如何编写对 UTF-8 安全的代码？

我们有一组针对 ASCII 字符集开发的应用程序现在我们正尝试在冰岛安装它但遇到了冰岛字符被搞砸的问题我们正在解决我们的问题但我想知道是否有一个好的指南来编写专为 8 位字符设计的 C 代码并且在提供 UTF 8 数据时可
当工作站锁定然后解锁时，如何防止窗口大小调整？

我们有一个在多显示器环境中运行的应用程序用户通常将应用程序对话框分散到多个监视器上如果用户锁定工作站然后解锁它我们的应用程序就会被告知调整大小我们的用户发现这种行为令人沮丧因为他们随后花了一些时间恢复以前的布局我们还不确定是图
Windows 中“nice”的等效词

Windows 中是否有相当于 Unix 命令的命令 nice 我正在专门寻找可以在命令行中使用的东西并且not任务管理器中的设置优先级菜单我在谷歌上寻找这个的尝试被那些想不出更好形容词的人挫败了如果您想在启动进程时设置优先级您
连接到 VPN 时 HttpClient.GetAsync 超时

当系统不使用 VPN 时 C 4 5 2 框架 HttpClient GetAsync 方法在 Windows 10 上运行良好连接 VPN 后对同一地址的 HttpClient GetAsync 调用只会阻塞直到超时 Edge 和
在C#中，如何检测一个字符是否是非ASCII字符？

我想在 C 中检查 char 是否包含非 ASCII 字符检查特殊字符的最佳方法是什么例如志 or ASCII 范围为 0 127 因此只需检查该范围 char c a or whatever char you have bool is
UTF-8 在 Python 日志记录中，如何？

我正在尝试使用 Python 的日志记录包将 UTF 8 编码的字符串记录到文件中作为一个玩具示例 import logging def logging test handler logging FileHandler home ted
枚举nodejs中的系统驱动器

有没有办法检索计算机上所有逻辑驱动器的驱动器名称我查看了 fs api 但从那里我只能枚举给定目录的文件和目录我不确定驱动器名称是什么意思如果您的意思是以下形式的驱动器 PhysicalDriveN 我遇到了同样的问题并实现了这个
为什么 SetCursorPos 将光标位置重置到显示屏的左侧？

SetCursorPos https learn microsoft com en us windows win32 api winuser nf winuser setcursorpos将光标移动到指定的屏幕坐标然而它似乎有一个错误
如何以编程方式检索“Program Files”文件夹的实际路径？ [复制]

这个问题在这里已经有答案了可能的重复 C 如何在 Windows Vista 64 位上获取程序文件 x86 https stackoverflow com questions 194157 c sharp how to get prog
当IRQL下降时，Windows中如何触发软件中断？

我知道对于硬件中断当 KeAcquireInterruptSpinLock 调用 KeLowerIrql 时 HAL 会调整 LAPIC 中的中断掩码这将允许自动服务排队的中断可能在 IRR 中但是对于软件中断例如 ntdll d

随机推荐

在 Android 中的按钮上写入多行文本

我想知道如何在按钮上编写多行文本
如何在 Laravel 5.4.18 中使用特征？

我需要一个示例来说明在何处准确创建文件写入文件以及如何使用特征中声明的函数我使用 Laravel 框架 5 4 18 我没有更改框架中的任何文件夹所有内容都在其对应的位置已经非常感谢了我在我的目录中创建了一个 Traits 目录H
Promises，如何将变量传递到 .then 函数

您好这是一个帮助我理解 Promise 的问题 then返回工作问题是如何将变量的作用域限定为第二个 then 链函数这是一个jsbinhttp jsbin com xacuna edit js 输出我可以访问全局变量并将作用域
在特定时间设置 Android 闹钟

我在特定时间设置了闹钟但每次我打开应用程序时它都会打开这是我使用的代码 AlarmManager alarmManager AlarmManager getSystemService Context ALARM SERVICE Inte
文章中的交叉引用

该书册为方程图形表格和章节提供了很好的交叉引用选项 https bookdown org yihui bookdown cross references html 但是当我设置为输出 articles elsevier article
Springs @RequestParam 注解的内部工作原理

在 Spring 中如果我没记错的话以下两个语句是相同的 RequestParam type String type RequestParam String type spring如何知道 type 的变量名第二版我当时的印象是该
同一页面上的多个socket.io连接

我可以在客户端连接到同一 IP 和端口上的多个资源吗我有以下代码 var myIP 192 168 1 1 var myPort 8080 A io connect myIP myPort resource A socket io B i
戈多3.2.1。刷新查询时无法更改此状态。使用 call_deferred() 或 set_deferred() 来更改监控状态

在我的 2D 游戏中玩家能够摧毁箱子具有两种碰撞形状的物体当被摧毁时板条箱会产生也具有碰撞形状的物品但是当调用以下函数时 Godot控制台中会显示许多类似的错误 Code func on Crate item dropped co
Laravel 5.2 会话 flash 即使使用 Web 中间件也无法工作

我正在尝试使用会话来实现 Flash 消息传递但无法做到这一点在我的控制器中我有 public function store Request request session gt flash donald duck session gt
C 中的 +(+k--) 表达式

我在测试中看到这个问题我们必须告诉以下代码的输出 include
asp.net mvc3 基于模型检查单选按钮

我有一个看似简单的任务即根据模型的布尔值设置选中单选按钮我的模型 IsSDPDonor 中有一个布尔值我想将它用于是否单选按钮如果 IsSDPDonor 为 true 则应检查 Yes 单选按钮如果为 false 则应检查
Bootstrap Multiselect 获取 HttpPost 上的选定值

我正在用这个引导多选我的问题是我无法在 ASP Net MVC 上的 HttpPost 上获取所选值遇到的问题单击保存后仅显示第一个选定的值该模型 SOLVED 单击保存后仅显示第一个选定的值下拉列表示例 html m
具有不同查询参数的两种 GET 方法

我们可以创建相同的 GET URI 但具有不同的查询参数吗例如我有两个 REST GET URI questions ask type rest questions ask byUser john 现在 REST 服务不会将两个 GET
Camel http4 使用 Https 上的基本身份验证下载文件

我正在尝试从以下位置下载文件Https需要基本身份验证的 url 我正在使用 HTTP4 我正在尝试从网址下载文件下载后我需要将其保存到文件夹中这是我的代码的样子 from xxx to http4 ebc cybersource c
以编程方式在另一个桌面（空间）中打开 NSWindow

在我的 OSX 项目中我想要识别 NSWindow 所在的桌面公开空间之一在确定的 Space 中打开 NSWindow 而不仅仅是在当前 Space 上有没有办法完成这些简单的任务浏览文档 NSWindowController
“void”是函数的有效返回值吗？

private void SaveMoney string id public void DoSthWithMoney string action string id if action save return SaveMoney stri
在WPF DataGrid中通过列标题获取列索引

如何获得Column索引或Column DisplayIndex从它的Column Header in WPF DataGrid 我知道Column Header 想要得到column index 你可以用DisplayIndex 请注意
在 netbeans 中为 .dll/.so 文件提供“java.library.path”

我如何给出路径 dll or sonetbeans 中的文件以使用以下方式加载库 System loadLibrary Foo I read 这在 Netbeans 页面上但无法帮助我因为它给出了不满意的链接错误这是我尝试过的两件事
wymeditor 无法保存插入的 iframe

Wym编辑器 http wymeditor org 总是删除插入的 iframe 的内容所以我无法将 vimeo 播放器块添加到我的页面我怎样才能避免它问候阿列克谢扎哈罗夫 Since 2011 年 5 月 31 日 WYMedi
Windows 上 MBCS 和 UTF-8 的区别

我正在阅读有关 Windows 上的字符集和编码的信息我注意到 Visual Studio 编译器针对 C 中有两个编译器标志称为 MBCS 和 UNICODE 它们之间有什么区别我不明白的是 UTF 8 在概念上与 MBCS 编码

Windows 上 MBCS 和 UTF-8 的区别

Windows 上 MBCS 和 UTF-8 的区别 的相关文章

随机推荐

热门标签

Windows 上 MBCS 和 UTF-8 的区别的相关文章