在 C 中处理多字节（非 ASCII）字符

2023-12-12

我正在尝试做我自己的 wc（unix 过滤器）版本，但我遇到了非 ASCII 字符的问题。我对一个文本文件进行了十六进制转储，发现这些字符占用了多个字节。所以它们不适合炭化。有什么方法可以从文件中读取这些字符并像 C 中的单个字符一样处理它们（以便计算文件中的字符）？我在谷歌上搜索了一下并发现了一些 wchar_t 类型，但没有任何简单的示例如何将它与文件一起使用。

我一直在谷歌上搜索了一下，发现了一些 wchar_t 类型，但没有任何简单的示例如何将它与文件一起使用。

好遇见。没有任何简单的示例，因为不幸的是，没有适当的字符集支持并不简单.

旁白：在理想的世界中，每个人都会使用 UTF-8（一种内存高效、稳健且向后兼容 ASCII 的 Unicode 编码），标准 C 库将包含 UTF-8 编码解码支持，以及答案这个问题（以及一般的文本处理）将是简单明了的。

问题的答案“C 语言中最好的 unicode 库是什么？“ 是使用ICU图书馆。您可能想看看ustdio.h，因为它有一个u_fgetc函数，并且向您的程序添加 Unicode 支持可能只需要键入u_几次。

另外，如果您能抽出几分钟时间进行一些轻松的阅读，您可能想阅读每个软件开发人员绝对必须了解 Unicode 和字符集的绝对最低限度（没有任何借口！）来自乔尔安软件。

我个人从未使用过 ICU，但从现在起我可能会使用 :-)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在 C 中处理多字节（非 ASCII）字符的相关文章

std::cout 和 std::wcout 有什么区别？

在c 中有什么区别std cout and std wcout 它们都控制流缓冲区的输出或将内容打印到控制台或者它们只是相似吗它们作用于不同的字符类型 std cout uses char作为字符类型 std wcout uses w
如何在 C# 中从 UNIX 纪元时间转换并考虑夏令时？

我有一个从 unix 纪元时间转换为 NET DateTime 值的函数 public static DateTime FromUnixEpochTime double unixTime DateTime d new DateTime 19
如何将 #ifdef DEBUG 添加到 Xcode？

我的项目中有一些代码永远不应该在发布版本中使用但在测试时很有用我想做这样的事情 ifdef DEBUG Run my debugging only code endif 在 Xcode 4 中哪里添加 DEBUG 设置我尝试将其放入
如何修复此错误“GDI+ 中发生一般错误”？

从默认名称打开图像并以默认名称保存覆盖它我需要从 Image Default jpg 制作图形将其放在 picturebox1 image 上并在 picurebox1 上绘制一些图形它有效这不是我的问题但我无法保存 pictu
单元测试一起运行时失败，单独运行时通过

所以我的单元测试遇到了一些问题我不能只是将它们复制并粘贴到这里但我会尽力而为问题似乎是如果我一项一项地运行测试一切都会按预期进行但如果我告诉它一起运行测试则 1 5 将通过 TestMethod public void Obj
用于检查项目文件中的项目变量和引用路径的 api

我正在研究一个 net application VS2010 与 x 没有解和变量号这些解决方案中的项目数量我需要检查项目属性特定于一定数量的项目是否同质并且检查验证构建期间的参考路径有没有一个API是这样的吗如果没有我该
ASP.NET：获取自 1970 年 1 月 1 日以来的毫秒数

我有一个 ASP NET VB NET 日期我试图获取自 1970 年 1 月 1 日以来的毫秒数我尝试在 MSDN 中寻找方法但找不到任何东西有谁知道如何做到这一点从 NET 4 6 开始该方法ToUnixTimeMillis
关于在 Windows 上使用 WiFi Direct Api？

我目前正在开发一个应用程序我需要在其中创建链接阅读无线网络连接在桌面应用程序在 Windows 10 上和平板电脑 Android 但无关紧要之间工作流程按钮 gt 如果需要提升权限 gt 创建类似托管网络的 WiFi 网
单击 form2 上的按钮触发 form 1 中的方法

我对 Windows 窗体很陌生我想知道是否可以通过单击表单 2 中的按钮来触发表单 1 中的方法我的表格 1 有一个组合框我的 Form 2 有一个保存按钮我想要实现的是当用户单击表单 2 中的保存时我需要检查表单 1
Java 不可变对象 [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我正在学习不变性的概念据我了解一旦创建对象不可变对象就无法更改其值但我不明白不可变对象的以下用途 They are 自动是线程
如何将整数转换为 void 指针？

在 C 中使用线程时我面临警告警告从不同大小的整数转换为指针代码如下 include
如何使用 Mongodb C# 驱动程序连接多个集合

我需要将 3 个集合与多个集合合并在一起 lookup我在 C 驱动程序中尝试过它允许我 lookup用户采集但无法执行秒 lookup用于设置集合有人可以帮忙吗 db Transactions aggregate lookup fro
等待线程完成

private void button1 Click object sender EventArgs e for int i 0 i lt 15 i Thread nova new Thread Method nova Start list
私有模板函数

我有一堂课 C h class C private template
如何在按钮单击时模拟按键 - Unity

我对 Unity 中的脚本编写非常陌生我正在尝试创建一个按钮一旦单击它就需要模拟按下 F 键要拾取一个项目这是我当前的代码在编写此代码之前我浏览了所有统一论坛但找不到任何有效的东西 Code using System Colle
有没有办法强制显示工具提示？

我有一个验证字段的方法如果无法验证该字段将被清除并标记为红色我还希望在框上方弹出一个工具提示并向用户显示该值无效的消息有没有办法做到这一点并且可以控制工具提示显示的时间我怎样才能让它自己弹出而不是鼠标悬停时弹出 If the
线程和 fork()。我该如何处理呢？ [复制]

这个问题在这里已经有答案了可能的重复多线程程序中的fork https stackoverflow com questions 1235516 fork in multi threaded program 如果我有一个使用 fork 的
memset 未填充数组

u32 iterations 5 u32 ecx u32 malloc sizeof u32 iterations memset ecx 0xBAADF00D sizeof u32 iterations printf 8X n ecx 0
如何将 Roslyn 语义模型返回的类型符号名称与 Mono.Cecil 返回的类型符号名称相匹配？

我有以下代码 var paramDeclType m semanticModel GetTypeInfo paramDecl Type Type Where paramDeclType ToString returns System Col
当另一个线程可能设置共享布尔标志（最多一次）时，是否可以读取共享布尔标志而不锁定它？

我希望我的线程能够更优雅地关闭因此我尝试实现一个简单的信号机制我不认为我想要一个完全事件驱动的线程所以我有一个工作人员有一种方法可以使用关键部分优雅地停止它Monitor 相当于C lock我相信绘图线程 h class Drawi

随机推荐

如何在不同的分隔符上拆分字符串，但保留某些所述分隔符的输出？（标记字符串）

更具体地说我想在任何非字母数字字符上拆分字符串但如果分隔符不是空格我想保留它也就是说对于输入 my string Hey I m 9 11 7 11 我想得到 Hey I m 9 11 7 11 没有空格作为列表元素我已经尝试过
iOS 中是否可以根据 RGB 值获取颜色名称？

我想根据一些 RGB 值获取颜色名称我怎样才能做到这一点有可能的准备一个用 RGB 名称标记的颜色列表就足够了然后找到按某种度量最接近的颜色欧几里得距离就可以了有一篇文章来自xkcd进行色彩调查他们甚至为您提供调查数据库供您摆
无法获取在 include_once 中运行的参数

当我在没有任何 GET 参数的情况下调用 include 一次时它可以工作但是在trackinglogs php 上设置 GET 参数时没有任何反应请建议我做什么我的 php 代码是 firstfile php include o
如何从 Vaadin/Spring 应用程序提供静态资源？

我有 Vaadin Web 应用程序与 spring security 集成进行身份验证 Vaadin servlet 的配置非常简单
PHP / MySQL 中的简单递归树

我在 MySQL 中有这个表 id name mother 1 grandma 0 2 myuncle 1 3 mymom 1 4 me 3 5 mysister 3 6 myson 4 7 new grandma son 1 我将此信息放
如何在我的代码中使用 Matlab 引擎（用于调用 `engOpenSingleUse()`）？

我正在尝试向 Matlab 引擎发送简单的字符串命令这是我的代码我的代码中其他任何地方都没有与 Matlab API 相关的代码除了 include engine h line void MatlabPlotter DrawInMat
当使用MOV助记符将字符串加载/复制到MASM中的内存寄存器时，字符是否以相反的顺序存储？

我想知道使用 MOV 指令将字符串复制到寄存器中是否会导致字符串以相反的顺序存储我了解到当 MASM 将字符串存储到定义为单词或更高级别 dw 和更大尺寸的变量中时字符串将以相反的顺序存储当我将字符串复制到寄存器时是否会发生同样
将 0 转换为 DATE 和 DATETIME

我只是偶然发现了这一点找不到任何技术解释在 SQL Server 2014 中 SELECT CAST AS DATETIME 1900 01 01 00 00 00 000 SELECT CAST 0 AS DATETIME 1900
通过多处理获取函数的标准输出

我有一个 Python 函数它接受一个参数并将许多文本行打印到标准输出我获取该函数的标准输出并提取相关信息对该函数的调用成本非常高需要几分钟才能完成为了加快计算速度我使用 Python 多处理来并行运行该函数现在的问题是如何区
使用 arrayFilters 更新 MongoDB 中的嵌套子文档

我需要修改另一个数组内的数组内的文档我知道 MongoDB 不支持多个同时迭代多个数组但他们引入了数组过滤器为了那个原因看 https jira mongodb org browse SERVER 831 MongoDB的示例代码
[未处理的承诺拒绝：错误：位置“imageURL”不可读 - Expo React Native

我正在尝试使用 expo FileSystem 将 firebase 图像 URL 转换为 base64 但出现以下错误未处理的承诺拒绝错误位置 https pngimg com uploads birds small birds P
我可以根据另一个关联添加一个关联吗？

我的用户模型如下所示 User habtm Roles Role habtm Users RoleExtension belongs to Role mysql 表 users id roles id roles users user id
通过httpd.conf将http重定向到https

需要把http改成https http myServerName itf sheldon imex ajax share details v1 CH0012221716 issuer contact json Should change t
.NET 到远程 SQL Server 在一台计算机上速度较慢，在另一台计算机上则不然

我正在新设置的 Windows 7 桌面上开发 NET 4 0 应用程序在该应用程序中对远程数据库的查询非常慢相同的应用程序在我到目前为止一直使用的笔记本电脑上运行得非常快我现在使用的台式机比笔记本电脑快很多我正在使用 VPN 连
使用 Apache POI 在受保护的工作表中启用过滤和排序

我创建了一个包含受保护工作表的工作簿因为我只需要极少数可编辑的列虽然我想让用户能够对列进行排序和过滤谷歌搜索到目前为止还没有成功任何形式的帮助将不胜感激如果它是一个XSSFSheet then XSSFSheet lockAuto
eclipse 库包 - 无法从某些库导出包

我在 eclipse 3 5 中创建了一个简单的插件项目它只存储第三方库供 eclipse RCP 应用程序中的其他包使用按预期工作我编辑了清单导出了所需的包并将库添加到构建路径项目构建路径以及清单构建路径几天后我向该项目添
NetBeans 8.1 中没有 Tomcat？

我刚刚安装NetBeans 8 1 RC 我找不到任何阿帕奇雄猫小服务程序容器在以前的版本中它包含在Java EE 下载捆绑包NetBeans IDE 的现在可选 As of NetBeans 8 1 RC NetBeans 安装程
QWebEngineView - Javascript 回调

我最终想要完成的是捕获用户在网站中输入的用户名和密码例如如果用户输入电子邮件受保护作为 Facebook 登录的电子邮件地址然后单击提交我想将该电子邮件地址存储在我的 PyQt 应用程序中我最接近实现这一目标的方法是使用一系列
R：在向量模式下使用mgsub时如何防止内存溢出？

我有一个很长的字符向量例如 Hello World 等 170 万行我需要使用两个向量之间的映射来替换其中的单词并将结果保存在同一个向量中这是一个简单的例子 library qdap line c one two one four
在 C 中处理多字节（非 ASCII）字符

我正在尝试做我自己的 wc unix 过滤器版本但我遇到了非 ASCII 字符的问题我对一个文本文件进行了十六进制转储发现这些字符占用了多个字节所以它们不适合炭化有什么方法可以从文件中读取这些字符并像 C 中的单个字符一样处理它

在 C 中处理多字节（非 ASCII）字符

在 C 中处理多字节（非 ASCII）字符 的相关文章

随机推荐

热门标签

在 C 中处理多字节（非 ASCII）字符的相关文章