C 中的 UTF8 处理

2024-04-24

我对UTF8有基本的了解：码点的长度是可变的，所以一个“字符”可以是8位、16位，甚至更长。

我想知道 C 语言中是否有一些示例代码、库等可以与 UTF8 字符串（如 C 中的标准库）执行类似的操作。告诉字符串的长度等。

Thanks,

GNU 有一个 Unicode 字符串库，称为库尼字符串 http://www.gnu.org/software/libunistring/manual/，但它处理任何事情的效果都不如ICU http://site.icu-project.org/是的。

例如，GNU 库甚至不允许您访问排序规则，这是所有字符串比较的基础。相比之下，ICU 却是这样。 ICU 拥有但 GNU 没有出现的另一件事是 Unicode 正则表达式。为此，您可能想使用Phil Hazel 出色的 C 语言 PCRE 库 http://www.pcre.org，可以使用 UTF-8 支持进行编译。

然而，GNU 库可能足以满足您的需要。我不太喜欢它的 API。很乱。如果你喜欢C语言编程，你可以尝试Go编程语言 http://golang.org，它具有出色的 Unicode 支持。这是一门新语言，但小巧、干净且使用起来很有趣。

另一方面，主要的解释语言——Perl、Python 和 Ruby——都对 Unicode 有不同的支持，这比 C 语言中的支持要好。其中，Perl 的 Unicode 支持是最成熟和最强大的。

请记住：仅支持更多字符是不够的。如果没有相应的规则，就没有 Unicode。最多，您可能拥有 ISO 10646：大量字符库，但没有规则。我的座右铭是“Unicode 不仅仅是更多的字符；而是更多的字符”。更多的角色plus一整套处理它们的规则。”

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

C 中的 UTF8 处理的相关文章

在动态事件处理程序中引用“this”

在我的 myClass 类中我使用 Reflection Emit 为 myClass 类成员之一动态编写事件处理程序我已经成功地做到了这一点现在我想修改事件处理程序以调用 myClass 类中的实例方法之一但是我无法弄清楚如何
起订量要求？违背了目的？

是否需要虚拟化您想要模拟的所有属性访问器就违背了模拟的目的我的意思是如果我必须修改我的对象并虚拟化我想要模拟的每个访问器我难道不能继承我的类并自己模拟它吗你的问题非常有效但如果你仔细想想没有其他方法可以模拟课程如果你采用一个接
如何从RichTextBox中获取显示的文本？

如何获得显示的RichTextBox 中的文本我的意思是如果 RichTextBox 滚动到末尾我只想接收那些对我来说可见的行 P S 获得第一个显示的字符串就足够了您想使用 RichTextBox GetCharIndexFrom
为什么 VB.NET 和 C# 中针对值检查 null 存在差异？

In VB NET http en wikipedia org wiki Visual Basic NET有时候是这样的 Dim x As System Nullable Of Decimal Nothing Dim y As System
C# 中四舍五入到偶数

我没有看到 Math Round 的预期结果 return Math Round 99 96535789 2 MidpointRounding ToEven returning 99 97 据我了解 MidpointRounding ToE
如何在 Asp.net Gridview 列中添加复选框单击事件

我在 asp 中有一个 gridview 其中我添加了第一列作为复选框列现在我想选择此列并获取该行的 id 值但我不知道该怎么做这是我的 Aspx 代码
矩阵向量变换

我正在编写一个代码来制作软件蒙皮器骨骼皮肤动画并且我正处于优化阶段蒙皮器工作得很好并且在 Core 上 1 09 毫秒内对 4900 个三角形网格与 22 个骨骼进行蒙皮Duo 2 Ghz 笔记本我需要知道的是 1 有人可以
有没有办法使用 i387 fsqrt 指令获得正确的舍入？

有没有办法使用 i387 fsqrt 指令获得正确的舍入除了改变精确模式在 x87 控制字中我知道这是可能的但这不是一个合理的解决方案因为它存在令人讨厌的重入型问题如果 sqrt 操作中断精度模式将出错我正在处理的问题如下 x
如何在ggplot2中使用希腊符号？

我的类别需要用希腊字母命名我在用ggplot2 并且它与数据配合得很好不幸的是我无法弄清楚如何将这些希腊符号放在 x 轴上在刻度线处并使它们出现在图例中有什么办法可以做到吗更新我看了一下link https github c
方法“xxx”不能是事件的方法，因为该类派生的类已经定义了该方法

我有一个代码 public class Layout UserControl protected void DisplayX DisplayClicked object sender DisplayEventArgs e CurrentDi
单线程公寓问题

从我的主窗体中我调用以下命令来打开一个新窗体 MyForm sth new MyForm sth show 一切都很好但是这个表单有一个组合框当我将其 AutoCompleteMode 切换为建议和追加时我在显示表单时遇到了这个异常
防止GDB中的PLT（过程链接表）断点

在最新版本的 GDB 中在库函数调用上设置断点会导致多个实际断点调用过程链接表 PLT 实际的函数调用这意味着当调用库函数时我们每次都会经历两次中断在以前的 GDB 版本中只会创建 2 因此您只能得到一次中断那么问题来了是否
在VisualStudio DTE中，如何获取ActiveDocument的内容？

我正在 VisualStudio 中编写脚本并尝试获取当前 ActiveDocument 的内容这是我当前的解决方案 var visualStudio new API VisualStudio 2010 var vsDTE visual
从事务范围调用 WCF 服务方法

我有这样的代码 using TransactionScope scope TransactionScopeFactory CreateTransactionScope some methodes calls for which scope
不兼容的类型 - 是因为数组已经是指针吗？

在下面的代码中我创建一个基于书籍结构的对象并让它保存多个书籍我设置的是一个数组即定义启动的对象然而每当我去测试我对指针的了解实践有帮助并尝试创建一个指向创建的对象的指针时它都会给我错误 C Users Justin D
如何访问窗口？

我正在尝试使用其句柄访问特定窗口即System IntPtr value Getting the process of Visual Studio program var process Process GetProcessesByNam
ASP.NET Core Razor Page 多路径路由

我正在使用 ASP NET Core 2 0 Razor Pages 不是 MVC 构建系统但在为页面添加多个路由时遇到问题例如所有页面都应该能够通过 abc com language 访问segment shop mypage 或
在 C++ 和 Windows 中使用 XmlRpc

我需要在 Windows 平台上使用 C 中的 XmlRpc 尽管我的朋友向我保证 XmlRpc 是一种广泛可用的标准技术但可用的库并不多事实上我只找到一个库可以在 Windows 上执行此操作另外一个库声称您必须做很多工作才能
g++ C++0x 枚举类编译器警告

我一直在将可怕的 C 类型安全伪枚举重构为新的 C 0x 类型安全枚举因为它们是way更具可读性不管怎样我在导出的类中使用它们所以我明确地将它们标记为导出 enum class attribute visibility defaul
新的 .NET 6 控制台模板中的 C# 函数重载不起作用

我在尝试重载该函数时遇到错误Print object in the 新的 NET 6 C 控制台应用程序模板 https learn microsoft com en us dotnet core tutorials top level t

随机推荐

无法使用 Spring 的 WebServiceTemplate 将 Http 标头添加到消息中

我有一个相当简单的情况我尝试将 HTTP 标头不是 SOAP 标头添加到我使用 Spring 发出的请求中WebServiceTemplate 我定义了一个ClientInterceptor我在哪里做 Override public
Numpy 中如何获得向量的大小？

为了与只有一种明显的方法可以做到这一点保持一致如何在 Numpy 中获取向量一维数组的大小 def mag x return math sqrt sum i 2 for i in x 上面的方法有效但是我无法相信我必须自己指定这
Android JNI异常处理

我需要在 JNI 代码中实现异常处理我不擅长 jni 找不到任何好的例子因此请提供完整的示例这就是我正在做的 jint JNI OnLoad JavaVM vm void reserved jint result 1 g JavaV
为什么 nhibernate 3.3 不允许 ICollection 上的私有 setter？

我从 nhibernate 3 2 升级到 nhibernate 3 3 并且在我的域类中定义了很多虚拟成员如下所示 public virtual ICollection
Django Channels - 无法在断开连接时发送消息

我希望能够在用户断开连接时向房间组发送消息以便更新玩家列表似乎一旦断开连接就不可能了这在某种程度上是有意义的但是在断开用户连接之前我如何能够向通道发送消息我有以下代码 async def disconnect self close
不太无用的“yes”bash 命令：如何在每个循环中确认命令

我编写了一个循环来解压缩目录中的所有 zip 文件 for f in zip do unzip f done 但是我必须在每一步确认覆盖 replace file123 txt y es n o A ll N one r ename A
Functions Bot 是否不再是 Azure 中推荐的机器人服务？

我有一个无服务器系统我希望向其中添加 Bot Framework 主要是为了提供与不同聊天渠道的集成我正在考虑尝试在 Bot Service 中创建一个 Functions Bot 但是当我开始创建一个时我收到以下信息消息 Funct
adArray 的 VBScript / ADODB 语法问题？

我希望有人能给我一些关于我的 vb 脚本的新视角该脚本的主要目的是使用一些参数执行存储过程我得到的错误是预计声明结束我没有做过太多的 VB 脚本编写但从目前为止我发现的情况来看这个错误是由于某种语法问题造成的我已经查看这个脚本
如何在asp.net mvc中从https跳出到http模式

我通过在控制器操作上添加属性 RequireSSL 使我的登录页面启用了 Https 并且工作正常但登录成功后仍处于https环境但页面为非https页面谁能给我解决如何从 https 模式退出到 http 模式的问题吗在这方面的任
Django django-location-field 缺少 API 密钥

我正在使用https github com caioariede django location field https github com caioariede django location field使用 Django 构建位置视图
结合阴影误差和实线平均值的图例

我在用此 FEX 条目 http www mathworks com matlabcentral fileexchange 27485 boundedline line plots with shaded errorconfidence i
如何避免c#中windows窗体的多个实例

如何避免在 C 中出现多个 Windows 窗体实例我只想运行该表单的一个实例因为有机会从我的申请的许多页面打开相同的表格是的它有单例模式创建单例对象的代码 public partial class Form2 Form priv
如何使用 javafx 隐藏或停用 TextField 和 Label

我想隐藏或停用TextField和它的Label在我的 JavaFX 应用程序中这就是我尝试过的 myTextField setVisible false 但它不起作用我在 Windows 7 上使用 Eclipse V4 5 0 和
基于字符串创建ViewBag属性

有没有办法基于字符串创建和使用 ViewBag 的动态属性就像是 ViewBag CreateProperty MyProperty ViewBag Property MyProperty Myvalue 谢谢我刚刚发现 ViewDat
使用表达式时ggplot右对齐轴文本

我正在制作一个带有长轴标签的条形图我需要将其换行并右对齐唯一的复杂之处是我需要添加一个表达式来具有上标 library ggplot2 library scales df lt data frame levs c a long labe
在 Mac OS X 10.6.3 下保存 PDF 时应用 Quartz 滤镜

使用 Mac OS X API 我尝试保存应用了 Quartz 过滤器的 PDF 文件就像在预览应用程序中的另存为对话框中一样到目前为止我已经编写了以下代码使用Python和pyObjC 但这对我来说并不重要 filter pd
使用 amplify ui React 配置状态时，AuthStatus 不会发生变化

我正在使用 AWS amplify UI React 在 React 应用程序中创建身份验证流程我按照该文档并使用下面的文档制作了导航流程 https ui docs amplify aws react guides auth prote
没有合适的用户定义转换

我正在尝试编写一个包装数值的 C 程序我通过编写一个超类来做到这一点它将处理两个简单函数和一个运算符重载函数这是我的代码 include
.NET 4 中的 TaskCreationOptions.DenyChildAttach

我在 NET 4 5 中看到Task Run 相当于 Task Factory StartNew someAction CancellationToken None TaskCreationOptions DenyChildAttach T
C 中的 UTF8 处理

我对UTF8有基本的了解码点的长度是可变的所以一个字符可以是8位 16位甚至更长我想知道 C 语言中是否有一些示例代码库等可以与 UTF8 字符串如 C 中的标准库执行类似的操作告诉字符串的长度等 Thanks GNU

C 中的 UTF8 处理

C 中的 UTF8 处理 的相关文章

随机推荐

热门标签

C 中的 UTF8 处理的相关文章