linux c字符串转utf-8,linux C 语言如何遍历 utf-8字符

2023-05-16

加入文件是utf-8编码，内容如下：

我是来自上海的互联网程序员，主要从事Web/游戏/手机服务器开发.

下面C代码可以一个一个的读入这些中文字符():

#define UTF8_CHAR_LEN( byte ) ((( 0xE5000000 >> (( byte >> 3 ) & 0x1e )) & 3 ) + 1)

char content[255]; //一行一行的读入文件，255的话大概满足需求了；这个代码片段也只是测试用.

FILE *data_file = fopen("path/to/file", "r");

if (!data_file) {

fprintf(stderr, "error happened when read file: %s","path/to/file");

return -1;

}

fgets(content, 255, data_file);

int i;

for (i = 0; content[i] != '\0'; i++) {

int utf8_char_len = UTF8_CHAR_LEN(content[i]);

if (utf8_char_len > 1) {

char word[4]; // utf-8占位最大字节也就是4个字节

memcpy(word, (content + i), utf8_char_len);

i += utf8_char_len - 1;

printf("%s\t", word);

}

else {

printf("%c\t", content[i]);

}

fclose(data_file);

输入：

我是来自上海的互联网程序员，主要从事 W e b / 游戏 / 手机服务器开发 .

这里我觉得主要问题是字符指针它不标识出编码字符的大小，如果单纯的用 (p + 1)的话会把编码混乱掉，所以要先判断字符编码的所占字节数，然后再 (p + sizeofword) 输出;

上面的代码满足我现在的需求，不过还有一些疑问；

utf-8编码的字符在Linux c 下面怎么处理的呢？一般模式我还在寻找，有机会帖在这里.

这里还帖一个用宽字符库遍历utf-8字符串的代码片段:

wchar_t wstr[] = L"你好";

// en_US.UTF-8 是我本地的locale

setlocale(LC_ALL, "en_US.UTF-8");

int i;

for (i = 9; i < wcslen(wstr); i++) {

wprintf(L"%lc\n", wstr[i]);

}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

linux c字符串转utf-8,linux C 语言如何遍历 utf-8字符的相关文章

AD绘制四层板

原理图导入PCB后默认是双层板可以Design gt Layer Stack Manager 点击Top Layer 然后点击Add Plane 负片层电脑上在此层走线表示把铜挖空这里把一整层都当作GND 非GND的过孔打到这一层
群晖(Synology)配置 NAS + 软路由

文章目录背景结论软路由配置背景老板上周兴致勃勃的找到我说Macbook存储不够用了帮他找个存东西的不是移动硬盘我也很懵逼我搞活动捡便宜充的百度网盘超级会员觉得自己很是尾巴翘上天的土豪了但想到老板的身价又不太清楚macb
各种类型的Writable

各种类型的Writable xff08 Text ByteWritable NullWritable ObjectWritable GenericWritable ArrayWritable MapWritable SortedMapWri
C++ strtok的用法

size 61 large align 61 center strtok的用法 align size 函数原型 xff1a char strtok char s char delim 函数功能 xff1a 把字符串s按照字符串delim进行
读《遇见未知的自己》笔记

为什么我不快乐 xff1f 为什么我不能拥有自己想要的生活 xff1f 此刻屏幕前的你是否想过 xff0c 自己为什么会出现这种情况呢 xff1f 张德芬在遇见未知的自己一书给出了解释 xff1a 我们人类所有受苦的根源就是来自不清楚
PX4飞控问题汇总

接触PX4飞控代码一年多了 xff0c 代码都是模块化开发起来比APM的方便 xff0c 使用过程中也出现过各种怪异问题 xff0c 用的硬件是V5 nano 和V5 43 xff0c 测试的代码版本是1 9和1 10 今天总结一下遇到过
Sumo 搭建交叉路口交通流仿真平台

Sumo安装注意事项 xff1a 需要工具的使用需要环境变量的设置需要包含文件Sumo安装路径下的bin和tools Sumo配置文件 Sumo中项目的配置文件的组成如下所示节点文件图 1 节点及边的拓扑图 Node的属性主要有id
OpenWRT 各种烧录方式及量产（三）

界面烧录不更新uboot 电脑连接WIFI xff08 或者通过网线连接电脑与路由器 xff09 通过浏览器访问路由器管理界面 xff0c 进行升级注意不要断电 xff01 xff01 xff01 xff08 断电只能通过tftp方式恢
华为手机root

首先手机已解锁 xff42 xff4c 此方法针对华为手机可使用 xff0c 其他手机没有测试 xff0c 但应该也可以官方的twrp没有对mate xff19 进行配适 xff0c 可以使用奇兔 twrp 提取码 ax6d 如果你没
阿里云ubuntu 16.04 Server配置方案 2 远程控制桌面

通过远程控制 xff0c 更好的管理服务器 1 XRDP远程控制为了更好的远程管理 xff0c linux一般情况都用VNC进行远程连接 xff0c 如 TightVNC X11VNC ReadVNC等 Xrdp 是开放原始码的远端桌面通
自顶向下（top down）简介

无论是在实际生活中还是在学术问题上 xff0c 复杂的问题比比皆是 xff0c 当我们对此类问题毫无头绪的时候 xff0c 自顶向下 xff08 top down xff09 为我们提供了一种可靠的解决方法自顶向下法将复杂的大问题分解为相
SecureCRT图形界面(通过设置调用Xmanager - Passive程序)

首先 xff0c 在服务器进行设置如果服务器是图形化界面启动的 xff0c xhost 43 命令可以不用执行 root 64 test xhost 43 xhost unable to open display 34 34 设置disp
一种GPS辅助的多方位相机的VIO——Slam论文阅读

34 A GPS aided Omnidirectional Visual Inertial State Estimator in Ubiquitous Environments 34 论文阅读这里写目录标题 34 A GPS aided
docker & LXC

目录一 LXC1 了解Docker的前生LXC2 LXC与docker的关系3 与传统虚拟化对比4 LXC部署4 1 安装LXC软件包和依赖包4 2 启动服务4 3 创建虚拟机 5 LXC常用命令二 doker1 什么是docker2
curl命令总结

curl no cache d Users Administrator Desktop curl 7 73 0 3 win64 mingw bin gt curl Iv http abc gkmang cn 8081 index php l
使用FastJSON 对Map/JSON/String 进行互转

前言 Fastjson是一个Java语言编写的高性能功能完善的JSON库 xff0c 由阿里巴巴公司团队开发的 1 主要特性高性能 fastjson采用独创的算法 xff0c 将parse的速度提升到极致 xff0c 超过所有json库
ai面向分析_2020年面向企业的顶级人工智能平台

ai面向分析 In the long term artificial intelligence and automation are going to be taking over so much of what gives humans
回答问题人工智能源码_回答21个最受欢迎的人工智能问题

回答问题人工智能源码 Artificial intelligence sets the stage for a new era of solutions to be made with computers It allows us to s
人工智能药物设计_用AI革新药物安全

人工智能药物设计介绍 Introduction Advances in the life sciences have brought about a transformative impact on healthcare with lif
数据集分为训练验证测试_将数据集分为训练集，验证集和测试集

数据集分为训练验证测试测试我们的模型 Testing Our Model Supervised machine learning algorithms are amazing tools capable of making predict

随机推荐

深度学习场景识别_使用深度学习进行自然场景识别

深度学习场景识别 Recognizing the environment in one glance is one of the human brain s most accomplished deeds While the tremen
使用Pytorch的LSTM文本分类

Photo by Christopher Gower on Unsplash Christopher Gower在 Unsplash上的照片介绍 Intro Welcome to this tutorial This t
识别图片地点_地点识别

识别图片地点 Imagine this scenario you catch up with a friend who s returned from a trip to India You ve traveled extensively
ai人工智能让女神_让女孩进入人工智能管道

ai人工智能让女神缩小女孩的想象力差距 Closing the Imagination Gap for Girls The term artificial intelligence AI was coined 64 years ago a
vs2010最佳配色选择_2010年代35部最佳电影

vs2010最佳配色选择 WHAT WAS THE BEST MOVIE YOU SAW IN THE LAST DECADE Best is subjective of course Only you can decide what be
vs代码编码格式_为什么vs编码员使用vs代码

vs代码编码格式 Knowing the syntax and concepts of a programming language or technology is not the only thing that is part of a
Linux下的ip命令

前言 linux的ip命令和ifconfig类似 xff0c 但前者功能更强大 xff0c 并旨在取代后者功能介绍 1 查看ip地址 root 64 localhost ip addr 1 lo lt LOOPBACK UP LOWER
忽视警告_忽视针对神经网络的网络攻击

忽视警告 Artificial neural networks can be thought of as computed biological neural networks Is it possible to perceive an o
docker github_带有GitHub操作的Docker部署

docker github There are plenty of continuous integration and delivery tools that can be used to run CI CD pipelines such
黑群晖docker清理缓存_群晖NAS下自动更新docker镜像

群晖NAS下自动更新docker镜像 2020 03 02 16 10 21 2点赞 29收藏 15评论你是AMD Yes党 xff1f 还是intel和NVIDIA的忠实簇拥呢 xff1f 最新一届装机大师赛开始啦 xff01 本次
xmanager6能登陆Linux7吗,Vmware之XManager6连接CentOS7的操作教程

本文将带你了解Vmware之XManager6连接CentOS7的操作教程 xff0c 希望对大家学Vmware有所帮助 XManager5连接CentOS6的方法已经行不通了 xff0c 那么如何用XManager5连接CentOS7 从
cmake中添加引用动态链接_CMake 添加头文件目录，链接动态、静态库（添加子文件夹）...

CMake支持大写小写混合大小写的命令当编译一个需要第三方库的项目时 xff0c 需要知道 xff1a 去哪找头文件 h xff0c I GCC INCLUDE DIRECTORIES 去哪找库文件 so dll lib dylib
linux的kvm技术,虚拟化技术KVM的搭建

KVM 是基于虚拟化扩展 Intel VT 或者 AMD V 的 X86 硬件的开源的 Linux 原生的全虚拟化解决方案 KVM 中 xff0c 虚拟机被实现为常规的 Linux 进程 xff0c 由标准 Linux 调度程序进行调度 x
linux服务器openssh怎么安装,Ubuntu下手动安装OpenSSH Server

本例以Ubuntu 9 10为例 xff0c 由于系统版本旧了 xff0c 失去了在线下载安装的支持 xff0c 所以只能手工安装了这里我们需要这几个安装包下载里面都有 xff1a zlib 1 2 5 1 tar gz openssl
总线带宽计算公式_「计算机组成原理」：总线概述

计算机系统的五大部件之间连接的方式有两种 xff0c 一种是各部件之间使用单独的连线 xff0c 称为分散连接一种是将各部件连到一组公共信息传输线上 xff0c 称为总线连接总线的基本概念计算机系统的五大部件之间连接的方式有两种 xf
linux lvm uuid绑定,LVM：“找不到具有uuid的设备”但是blkid找到了UUID

我有一个SLES 11 2 PPC 3 0 58 0 6 6 ppc64 系统它失去了对其卷组的跟踪包含数据并不重要的LV 但回来会很好磁盘通过SAN的两条光纤路径连接当我在上周五计划停电之前重新启动它时问题就出现了我没有时间进
系统突然访问变慢，如何排查和解决？

第一步 xff1a 登录后台服务器监控平台 xff0c 查看系统资源是否达到上限 xff0c 例如 xff1a CPU 内存磁盘 I O 网络带宽等 xff0c 如果是这些问题 xff0c 先将这些问题逐一解决 xff1a 如果是CPU
qt样式表设置边框_QT 样式风格 & 样式表 (QStyleSheet)

QT Style的机制和GTK的Style机制很类似 xff0c 基本上就是定义了一个基础的Style类 xff0c 在Style类里面定义一系列的绘图相关函数接口 xff0c 具体风格的Style类实现了这些函数接口在控件的实现中 x
html5绘制小鱼,HTML5 Canvas 深海游弋的鱼群

JavaScript 语言 xff1a JaveScriptBabelCoffeeScript 确定 FISH 34 CLASS 34 START var FOLLOW DISTANCE 61 100 var Fish 61 functio
linux c字符串转utf-8,linux C 语言如何遍历 utf-8字符

加入文件是utf 8编码 xff0c 内容如下 xff1a 我是来自上海的互联网程序员 xff0c 主要从事Web 游戏手机服务器开发下面C代码可以一个一个的读入这些中文字符 define UTF8 CHAR LEN byte 0xE5

linux c字符串转utf-8,linux C 语言如何遍历 utf-8字符

linux c字符串转utf-8,linux C 语言如何遍历 utf-8字符 的相关文章

随机推荐

热门标签

linux c字符串转utf-8,linux C 语言如何遍历 utf-8字符的相关文章