将 UTF-8 文本转换为 wchar_t

2023-12-21

我知道这个问题已经被问过很多次了，我确实阅读了一些答案，但是有一些建议的解决方案，我试图找出其中最好的解决方案。

我正在编写一个 C99 应用程序，它基本上接收以 UTF-8 编码的 XML 文本。

它的部分工作是复制和操作该字符串（查找子字符串，cat it，例如..）

因为我现在不想使用外部非标准库，所以我尝试使用 wchar_t 来实现它。

目前，我使用 mbstowcs 将其转换为 wchar_t 以便于操作，并且对于某些输入我尝试使用不同的语言 - 它工作得很好。

事实是，我确实读到有些人对 UTF-8 和 mbstowcs 有一些问题，所以我想听听这种使用是否被允许/可接受。

我面临的另一个选择是使用带有 WCHAR_T 参数的 iconv。问题是，我在一个平台（不是 PC）上工作，它的区域设置非常仅限于 ANSI C 区域设置。那个怎么样？

我也遇到过一些非常流行的 C++ 库。但我对 C99 的实现有限制。

另外，我会在另一个平台上编译此代码，其中 wchar_t 的 sizeof 不同（我的机器上为 2 字节与 4 字节）。我怎样才能克服这个问题？使用固定大小的字符容器？但是，我应该使用哪些操作函数呢？

很高兴听到一些想法。谢谢。

C没有定义什么编码char and wchar_t类型是，标准库只要求一些在两者之间转换的函数，而没有说明如何转换。如果依赖于实现的编码char则不是 UTF-8mbstowcs将导致数据损坏。

如中所述C99 标准的基本原理 http://www.open-std.org/jtc1/sc22/wg14/www/docs/C99RationaleV5.10.pdf:

然而，这五个功能往往限制性太强，而且太原始，无法开发管理字符的可移植国际程序。

...

C90 故意选择不发明更完整的多字节和宽字符库，而是选择等待它们的自然发展，因为 C 社区获得了更多关于宽字符的经验。

源自here http://www.open-std.org/jtc1/sc22/wg14/.

因此，如果您的文件中有 UTF-8 数据char没有标准的 API 方法可以将其转换为wchar_ts.

在我看来wchar_t除非必要，否则通常应该避免 - 例如，如果您使用 WIN32 API，则可能需要它。我不相信它会简化字符串操作。wchar_t在 Windows 上始终为 UTF-16LE，因此您可能仍需要多个wchar_t无论如何表示单个 Unicode 代码点。

我建议你调查一下重症监护室项目 http://site.icu-project.org/- 至少从教育的角度来看。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

将 UTF-8 文本转换为 wchar_t 的相关文章

如何让 CMake 为目标安装 PDB 文件

如何让 CMake 安装调试 Visual Studio 生成的 DLL 文件和 EXE 文件所需的配套 PDB 文件我已经挣扎了一段时间试图找到这个问题的一个好的答案我现在认为我找到了一个使用安装文件命令
何时在定义上下文或实例化点中发生非依赖名称的重载解析？

3 4 基本 lookup p1 重载解析 13 3 在名称查找成功后发生 void g long void g int int template
验证码怎么写？

我正在开发一个注册表我想放置验证码我生成一个随机字符串但如何将其转换为图像否则我如何开发验证码或任何参考谢谢 Try out 验证码 http recaptcha net plugins aspnet 或查看博客文章使用 Asp
如何使用 PowerShell 使用 C# DLL 中存在的类的 New-Object

例如我有一个 C 类 public class MyComputer PSObject public string UserName get return userName set userName value private strin
字符串中unicode字符的正则表达式

我正在使用 C 进行一些 OCR 工作并提取了我需要使用的文本现在我需要使用正则表达式解析一行 string checkNum string routingNum string accountNum Regex regEx new Re
无法将方法组分配给 asp.net、linq、c# 中的隐式类型局部变量

public void selectqueryasso CustomerOrderResult cso new CustomerOrderResult var a from as1 in ds orders from as2 in ds o
在 C 中使用另一个结构中的二维结构数组的编码问题

我正在使用一个二维结构数组它是另一个结构的一部分这不是我做过很多事的事情所以我遇到了问题该函数在接近末尾的测试 for 循环后最终失败它在出现段错误之前正确打印出一行我的代码中将数据读入虚拟二维结构数组的部分工作得很好所以它
弹出窗口或弹出窗口显示附加信息

我想在我的应用程序顶部显示带有附加信息的弹出窗口我的信息是Listview大约 500 个项目我都尝试过有问题flyout gt 它里面可能有scrollViewer 所以我的列表视图不能正确虚拟化其他一切都可以有我的代码 Flyo
如何在 Datagridview 中为图像列提供超链接

如何在winforms中超链接到DataGridViewImageColumn OP 评论中的代码示例 DataGridView dgv new DataGridView dgv Name dgv i dgv DataSource dsMa
使用来自不同线程的实时数据更新 QTableView 的最佳策略

我的应用程序现在启动几个线程如 5 10 个来从不同源收集数据它们与主 GUI 线程分离因此我在 GUI 中感觉不到任何缓慢并且我可以在后台线程工作时继续工作一切都很棒但现在我希望能够在我的主 GUI 中的 QTableVie
如果键不是映射中的初始化键，STL map[key] 返回什么？ [复制]

这个问题在这里已经有答案了这是一些示例代码 include
最佳实践：从属性中抛出异常

什么时候适合从属性 getter 或 setter 中抛出异常什么时候不合适呢为什么关于这个主题的外部文档的链接会很有帮助谷歌搜索结果出奇的少 Microsoft 在以下位置提供了有关如何设计属性的建议 http msdn micr
将 KeyUp 作为参数传递 WPF 命令绑定文本框

我有一个文本框 KeyUp 事件触发器连接到 WPF 中的命令我需要将按下的实际键作为命令参数传递该命令执行得很好但处理它的代码需要知道按下的实际键记住这可能是一个回车键或不仅仅是一个字母的任何键所以我无法从 TextBox te
模板是如何实例化的？

这是一个练习来自C 入门第五版练习 16 27 对于每个带标签的语句解释什么如果有实例化发生如果实例化了模板请解释原因如果不请解释为什么不第677页 template
如何在 C# 中读取 Visio 文档内容

我的DLL库代码如下 using System using IVisio Microsoft Office Interop Visio namespace Emix public class Visio protected String p
在C中更改函数内的数组

我正在学习 C 并且很困惑为什么在 main 中创建的数组不会在函数内部更改我假设传递的数组是一个指针并且更改指针应该更改数组对吧有人可以解释这种情况下发生了什么吗谢谢你的帮助 int main int i length 10 i
MSAL.Net 没有帐户或登录提示传递到 AcquireTokenSilent 调用

我见过很多相同或类似的问题并尝试了他们所有的答案如果有的话但这些都不适合我我在用着这个例子 https github com Azure Samples ms identity javascript angular spa aspn
如何在 MVC 5 中设置自定义 ClaimsPrincipal？

我创建了一个自定义主体类 public class FacebookPrincipal ClaimsPrincipal public JObject Data get set 我想用它当用户登录时我尝试设置 var fbP new Fa
提高批量请求的野兽内存使用率

我运行这个boost beast 客户端异步 ssl http www boost org doc libs develop libs beast example http client async ssl http client asy
为什么在嵌套类上调用方法时不调用父类的静态构造函数？

给出以下代码为什么在 Main 的第一行之后没有调用 Outer 的静态构造函数 namespace StaticTester class Program static void Main string args Outer Inner

随机推荐

Angular ng build --target=product 给出错误

我使用 Angular CLI 创建了一个新的 Angular 项目我使用的版本是 Angular Cli 1 0 2 角度 4 0 0 我在其中添加了很多代码但是现在当我使用下面的命令构建我的项目时我收到了一堆错误 ng buil
c 定义多行宏？

define DEBUG BREAK a if a asm int 3 我已经按照上面定义了一个宏并尝试使用它 include test define h int main DEBUG BREAK 1 1 return 0 但该示例无法编
登录 Clojure

对于Java开发我使用Slf4j和Logback Logger logger LoggerFactory getLogger HelloWorld class logger debug Hello world 如何在 Clojure 程序
使用 GDI+ 旋转图像而不剪裁其边缘的最快方法是什么？

有一些非常漫长且饥饿的算法可以做到这一点但到目前为止我还没有想出或发现任何特别快的算法最快的方法是使用不安全调用直接操作图像内存LockBits 听起来很可怕但其实很简单如果您搜索 LockBits 您会发现大量示例例如here
DevPay和Mfa是互斥的授权方式

我尝试使用以下命令通过 AWS cli 将 MFA 删除添加到我的 S3 存储桶 aws s3api put bucket versioning bucket
2D 软体：凝胶状和可塑性？

我正在使用 Matter js 物理学来尝试创建软体我能够创建这样的身体但我不确定这是否是我想要的软体确实这个物体并不完全是刚性的并且在碰撞和被拖动时具有弹性的感觉我一直在寻找与凝胶有相似之处的身体这张图片可能在视觉上有助于
Pandas 分割错误

由于内存不足以下代码行未成功执行 import pandas as pd import datetime as dt u cols remote host dummy1 dummy2 date timezone get status by
PDO 错误：一般错误：2031 [重复]

这个问题在这里已经有答案了当我执行代码时出现此错误我知道这已经在这里讨论过几次了但我无法通过阅读那里提供的解决方案来解决我的问题这是我得到的错误致命错误未捕获异常 PDOException 消息为 SQLSTATE HY000
对于软件开发人员来说，学习如何对微控制器进行编程有多难？

我是一名软件开发人员我使用高级语言进行编程已有几年了我想知道如何迈出硬件编程的第一步不是什么疯狂复杂的东西但也许是一些普通的 CE 设备假设我不需要将 PCB 与各种组件放在一起而只是对微型 cpu 进行编程我要到多低的级别
该算法的复杂度（Big-O）是多少？

我对算法分析相当熟悉并且可以说出我使用的大多数算法的大体但我已经被困了几个小时无法为我编写的这段代码想出 Big O 基本上它是一种生成字符串排列的方法它的工作原理是使字符串中的每个字符成为第一个字符并将其与子字符串减去该字符的
我可以在摘要式身份验证中使用已 MD5 编码的密码吗

我在数据库中有密码的 MD5 哈希值我想将其用于 HTTP AUTH DIGEST 但在阅读文档时摘要哈希看起来包含用户名领域和明文密码的哈希在这种情况下有什么办法可以使用密码的 MD5 哈希吗不如果他们需要的哈希是这样生成的
Spark 结构化流：多个接收器

我们使用结构化流从 Kafka 进行消费并将处理后的数据集写入 s3 我们还想将处理后的数据写入 Kafka 是否可以通过同一个流查询来完成此操作火花版本2 1 1 在日志中我看到流式查询进度输出并且我有来自日志的示例持续时间 JS
分割字符串后将值插入表中

我想将值插入员工表中这些值是字符串格式的分开 E g AA B 123 我使用以下函数分割它 CREATE FUNCTION db owner FN Split String varchar 8000 Delimiter char 1
在异步方法中使用反射获取方法名称不会返回预期结果

以下是我编写的一小段代码用于演示此问题的基础知识 Code private async void Form1 Load object sender EventArgs e var result await TestAsyncMethodN
查找鼠标相对于面板的位置

我试图获取鼠标在面板中的位置如面板左上角 x y 0 0 我目前所拥有的给出了整个屏幕上的位置因此根据面板位于框架中在屏幕上的位置坐标是不同的我想你可以添加 x y 坐标来解决这个问题但这似乎是一个混乱的解决方案有人可以帮忙
错误的身份验证数据 QuickBlox - Android

我正在研究QuickBlox SDK http quickblox com developers SimpleSample users android Sign In 26 Social authorization 使用这个 SDK 我尝试
可以使用 boost::threads 中的 std::this_thread* 函数吗？

可以混合搭配来自的东西吗 boost thread and std thread 或者应该为每个函数使用一组函数我问是因为我的代码使用boost threads 但我发现boost this thread sleep for设置系统时间时
如何检查远程 git 存储库 URL 的有效性？

在 bash 脚本中验证 git URL 是否指向有效的 git 存储库以及脚本是否有权读取它的最简单方法是什么应该支持的协议有git https and git 卷曲失败git 协议 email protected cdn cgi l
如何导致 ldap_simple_bind_s 超时？

最近我们的测试 LDAP 服务器遇到了问题它挂起并且无法响应请求结果我们的应用程序在尝试绑定时永远挂起这仅发生在 Unix 机器上在 Windows 上 ldap simple bind s大约 30 秒后呼叫超时我不知道是不
将 UTF-8 文本转换为 wchar_t

我知道这个问题已经被问过很多次了我确实阅读了一些答案但是有一些建议的解决方案我试图找出其中最好的解决方案我正在编写一个 C99 应用程序它基本上接收以 UTF 8 编码的 XML 文本它的部分工作是复制和操作该字符串查找子字符

将 UTF-8 文本转换为 wchar_t

将 UTF-8 文本转换为 wchar_t 的相关文章

随机推荐

热门标签