C++的中英文字符串表示(string,wstring)

2023-05-16

在C++中字符串类的string的模板原型是basic_string

template < class _Elem, class traits = char_traits < _Elem > , class _Ax = allocator < _Elem >>
class basic_string{

};

第一个参数_Elem表示类型。第二个参数traits的缺省值使用char_traits类型，定义了类型和字符操作的函数，如比较、等价、分配等。第三个参数_Ax的默认值是allocator类，表示了内存模式，不同的内存结构将操作指针的不同行为，例如栈、堆或段内存模式等。

在C++标准里定义了两个字符串string和wstring

typedef basic_string < char > string ;
typedef basic_string < wchar_t > wstring;

前者string是常用类型，可以看作char[]，其实这正是与string定义中的_Elem=char相一致。而wstring，使用的是wchar_t类型，这是宽字符，用于满足非ASCII字符的要求，例如Unicode编码，中文，日文，韩文什么的。对于wchar_t类型，实际上C++中都用与char函数相对应的wchar_t的函数，因为他们都是从同一个模板类似于上面的方式定义的。因此也有wcout, wcin, werr等函数。

实际上string也可以使用中文，但是它将一个汉字写在2个char中。而如果将一个汉字看作一个单位wchar_t的话，那么在wstring中就只占用一个单元，其它的非英文文字和编码也是如此。这样才真正的满足字符串操作的要求，尤其是国际化等工作。

看一下下面的程序，就会理解两者的差别。

#include < iostream >
#include < string >
using namespace std;

#define tab "\t"

int main()
{
    locale def;
    cout << def.name() << endl;
    locale current = cout.getloc();
    cout << current.name() << endl;

     float val = 1234.56 ;
    cout << val << endl;

     // chage to french/france
    cout.imbue(locale( " chs " ));
    current = cout.getloc();
    cout << current.name() << endl;
    cout << val << endl;

     // 上面是说明locale的用法，下面才是本例的内容，因为其中用到了imbue函数
    cout << " ********************************* " << endl;

     // 为了保证本地化输出（文字/时间/货币等），chs表示中国，wcout必须使用本地化解析编码
    wcout.imbue(std::locale( " chs " ));

     // string 英文，正确颠倒位置，显示第二个字符正确
     string str1( " ABCabc " );
     string str11(str1.rbegin(),str1.rend());
    cout << " UK\ts1\t: " << str1 << tab << str1[ 1 ] << tab << str11 << endl;

     // wstring 英文，正确颠倒位置，显示第二个字符正确
    wstring str2 = L " ABCabc " ;
    wstring str22(str2.rbegin(),str2.rend());
    wcout << " UK\tws4\t: " << str2 << tab << str2[ 1 ] << tab << str22 << endl;

     // string 中文，颠倒后，变成乱码，第二个字符读取也错误
     string str3( " 你好么？ " );
     string str33(str3.rbegin(),str3.rend());
    cout << " CHN\ts3\t: " << str3 << tab << str3[ 1 ] << tab << str33 << endl;

     // 正确的打印第二个字符的方法
    cout << " CHN\ts3\t:RIGHT\t " << str3[ 2 ] << str3[ 3 ] << endl;

     // 中文，正确颠倒位置，显示第二个字符正确
    wstring str4 = L " 你好么？ " ;
    wstring str44(str4.rbegin(),str4.rend());
    wcout << " CHN\tws4\t: " << str4 << tab << str4[ 1 ] << tab << str44 << endl;

    wstring str5(str1.begin(),str1.end()); // 只有char类型的string时才可以如此构造
    wstring str55(str5.rbegin(),str5.rend());
    wcout << " CHN\tws5\t: " << str5 << tab << str5[ 1 ] << tab << str55 << endl;

    wstring str6(str3.begin(),str3.end()); // 如此构造将失败!!!!
    wstring str66(str6.rbegin(),str6.rend());
    wcout << " CHN\tws6\t: " << str6 << tab << str6[ 1 ] << tab << str66 << endl;

     return 0 ;
}

结果如下：

上面显示了本地化的作用，是在数字中每三位加一个逗号，其实对时间/文字等都是用影响的。

下面的输出说明了，如何正确使用string和wstring的方法。第三个因为使用string来表示汉字，出现了一些错误。最后一行也是错误，导致了输出也受到了影响，没有空格与回车。（最后两个就不要管中英文了，仅仅说明一下中文构造方法是错误的）

《掌握标准C++类》在第十二章《语言支持》中专门讲C++的国际化和本地化问题，C++提供了I18N的标准处理，软件开发者可以参考。

C++标准库还是非常博大精深的，功能比较齐全的。继续学习。

转载于:https://www.cnblogs.com/xiaoyz/archive/2008/10/11/1308860.html

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

C++的中英文字符串表示(string,wstring) 的相关文章

如何从 PHP 中的字符串创建可能的字符串组合？

如何从 PHP 中的字符串创建可能的字符串组合 Exp input abc output array 0 gt a 1 gt ab 2 gt abc 3 gt ac 4 gt acb 5 gt b 6 gt ba 7 gt bac 8 gt
为什么 Java 11 中对于空白字符串 String.strip() 比 String.trim() 快 5 倍

我遇到过一个有趣的场景因为某些原因strip 针对空白字符串仅包含空格明显快于trim 在Java 11中基准 public class Test public static final String TEST STRING 3 w
更改特定字符串的颜色

有谁知道如果将特定单词输入文本区域我如何更改它的颜色例如如果用户输入你好我的朋友它会动态地将你好更改为绿色在google上花了很多时间找不到任何相关的东西谢谢 textareas 的设计目的不是选择性着色
清理 .txt 并计算最常见的单词

我需要 1 从停用词列表中清除 txt 我将其放在单独的 txt中 2 之后我需要统计最常见的 25 个单词这是我为第一部分想到的 usr bin python coding iso 8859 15 import re from coll
Swift：检查 UISearchBar.text 是否包含 url

如何检查 UISearchBar text 是否包含 URL 我想做这样的事情 if searchBar text NSTextCheckingType Link 但我收到错误 String is not convertible to NS
toUpperCase() 方法什么时候创建一个新对象？

public class Child public static void main String args String x new String ABC String y x toUpperCase System out println
生成逗号分隔值

假设我有一个字符串集合 foo bar xyz 我想从列表中生成一个逗号分隔的值如下所示 foo bar xyz 请注意末尾缺少我知道有多种方法可以生成此内容使用 for 循环和 string Format 或 StringBuild
char 数组声明中字符串文字周围的大括号有效吗？（例如 char s[] = {"Hello World"}）

偶然间我发现这条线char s Hello World 已正确编译并且似乎被视为相同char s Hello World 不是第一个 Hello World 一个包含一个 char 数组元素的数组因此 s 的声明应为char s 事实上如
字符串列表，获取n个元素的公共子串，Python

我的问题可能类似于this https stackoverflow com questions 37514193 count the number of occurrences of n length not given string in
C 中的指针、数组、字符串和 Malloc

我目前正在学习 C 语言中的字符串指针和数组我尝试编写一个程序其中数组保存三个指向字符串地址的指针这一切似乎都有效但程序的行为很奇怪这是代码 char getUserDetails char host localhost cha
用于字数计算的 Swift String 中的字数

我想做一个程序来找出字符串中有多少个单词用空格逗号或其他字符分隔然后把总数加起来我正在制作一个平均计算器所以我想要数据总数然后将所有单词相加 update Xcode 10 2 x Swift 5 或更高版本使用基础方法enu
用于开始和/或包含搜索的最快字符串集合结构/算法是什么

我有以下情况我有一个大的字符串集合比如说 250 000 平均长度可能是 30 我要做的就是在这些搜索中进行许多搜索大多数搜索都是 StartsWith 和 Contains 类型的该集合在运行时是静态的这意味着选择的集合的初始读
Golang中按长度分割字符串

有谁知道如何在 Golang 中按长度分割字符串例如每 3 个字符分割 helloworld 那么理想情况下它应该返回一个 hel low orl d 数组或者一个可能的解决方案是在每 3 个字符后附加一个换行符所有的想法都非常感
将 time.Time 转换为字符串

我正在尝试将数据库中的一些值添加到 string在围棋中其中一些是时间戳我收到错误无法在数组元素中使用 U Created date 类型 time Time 作为类型字符串我可以转换吗time Time to string typ
将 Excel 范围转换为 VBA 字符串

我想将给定范围内的值转换为 VBA 字符串其中原始单元格值由任何选定的列分隔符和行分隔符分隔分隔符可以是一个字符或更长的字符串行分隔符是行末尾的字符串该字符串应该像我们从左上角从左到右到右下角读取文本一样完成以下是范围 A1
在FLUTTER/DART中，为什么我们有时在声明变量时要在“String”后面加一个问号？

在演示应用程序中我们找到一个实例最终字符串标题 gt 为什么要加这个在 String 类型之后 class MyHomePage extends StatefulWidget MyHomePage Key key this titl
如何衡量两个字符串之间的相似度？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案给定两个字符串text1 and text2 public SOMEUSABLERETURNTYPE Compare string t
执行 Boyer-Moore 模式匹配时是否必须考虑编码？

我即将实现 Boyer Moore 模式匹配算法的变体具体来说是星期日算法我问自己我的字母表大小是多少它是否取决于编码可能的字符数或者我可以假设我的字母表由 256 个符号组成一个字节可以表示的符号数在许多其他情况下将字符
case_when 与部分字符串匹配和 contains()

我正在使用一个数据集其中有许多名为 status1 status2 等的列在这些列中它表示某人是否豁免完整注册等不幸的是豁免投入并不一致这是一个示例 library dplyr problem lt tibble perso
C# 是否有像 Java 那样的字符串分词器？

我正在做简单的字符串输入解析我需要一个字符串标记器我是 C 新手但已经编写过 Java 程序因此 C 应该有一个字符串标记生成器似乎很自然可以它在哪里我该如何使用它你可以使用String Split 方法 http msdn

随机推荐

[bash] 查找替换文件

bash 查找替换文件写这个脚本也加深了对 bash 数组的理解 bin bash 2015 11 23 echo e 34 说明 n将文件放在 app tmp class目录下 xff0c 保证该目录下没有其他文件 n备份目录在 app
Mac M1芯片安装Homebrew

MacBook M1芯片安装代码如下 xff0c 打开终端输入 bin bash c 34 curl fsSL https cdn jsdelivr net gh ineo6 homebrew install install sh 34 看
1.学习大纲

1 朱有鹏嵌入式Linux核心课程 xff1a https item taobao com item htm spm 61 a230r 1 14 1 1fca1869rWwNpJ amp id 61 45153106151 amp ns 6
[工具整理] Debain（KDE）下常用工具

前言 xff1a Debian安装了KDE桌面环境后 xff0c 发现好多有用的功能没有集成 xff0c 需要自己安装这里主要介绍 xff1a 截图工具云盘工具以及KDE上的网络管理工具 0x01 截图工具 xff1a 推荐使用 fla
【转】汽车CAN总线

概述 CAN xff08 Controller Area Network xff09 总线协议是由 BOSCH 发明的一种基于消息广播模式的串行通信总线 xff0c 它起初用于实现汽车内ECU之间可靠的通信 xff0c 后因其简单实用可靠等
轻松搭建CAS 5.x系列(1)-使用cas overlay搭建SSO SERVER服务端

概要说明 cas的服务端搭建有两种常用的方式 xff1a 1 基于源码的基础上构建出来的 2 使用WAR overlay的方式来安装官方推荐使用第二种 xff0c 配置管理方便 xff0c 以后升级也容易本文就是使用第二种方式安装步骤
vnc连接报错“connection refused （10061）”

排除防火墙等等 xff0c 网络设置的错误外 xff0c 登录putty exe 使用以下命令来启动 vnc server 共两行 xff1a service vncserver start vncserver 之后弹出两个warning
ST-LINK V2 DIY笔记（一）

最近一段时间调试STM32板子的时候 xff0c 都是用JLINK 43 杜邦线 xff0c 或者拿官方板子当STLINK用 xff0c 可以用 xff0c 但是体积比较大 xff0c 有时候觉得比较麻烦正好前一阵手头项目少 xff0c
驱动级键盘模拟（C#）（高手请飘过）

游戏外挂一般分为三个级别 xff1a 初级是鼠标键盘模拟 xff0c 中级是Call游戏内部函数 xff0c 读写内存 xff0c 高级是抓包 xff0c 封包的脱机挂 xff08 完全模拟客户端网络数据 xff0c 不用运行游戏 xf
CentOS7安装配置VNCServer

一安装图形界面 1 安装X Window图形界面 shell gt yum y groupinstall 34 X Window System 34 shell gt yum y install gnome classic session
【计算机本科补全计划】NFV/SDN初识（为了避免保研复试被电话面试）

正文之前所有的通信应用无非就是两部分组成 xff1a 计算和网络这两者关系密不可分 xff0c 但两者关系严重缺乏对称性 xff0c 网络一直拖累着计算就好像是发快递 xff0c 你打个包 xff08 计算 xff09 只需要几分钟
[!] CDN: trunk - Cannot perform full-text search because Algolia returned an error: 0: Cannot reach

pod search XXXX 时报错 xff1a CDN trunk Cannot perform full text search because Algolia returned an error 0 Cannot reach any
北大青鸟消防设备说明书_北大青鸟火灾报警控制器JB-TG/T-JBF-11S厂家使用说明书...

北大青鸟火灾报警控制器JB TG T JBF 11S厂家使用说明书一 JB TG T JBF 11S火灾报警控制器主要技术指标 xff1a 型号JB TG T JBF 11S 供电主电AC220V 10 50Hz 巡检周期3秒备电DC
linux测试音量,在Linux中获取C中的主音量

我正试图在Linux中检索可能稍后设置主音量我正在使用PulseAudio 但理想情况下它也适用于ALSA 我找到了关于如何设置音量的this非常有用的帖子从中我能够推断出snd mixer selem get playback v
Linux之apt命令详解

一 apt的简介 apt命令可以说是Linux系统下最为重要的命令 xff0c 安装更新卸载软件 xff0c 升级系统内核都离不开apt命令 apt的全称是Advanced Packaging Tool是Linux系统下的一款安装包管理
cas服务器作用,CAS服务器搭建

CAS服务器搭建目的 xff1a 搭建以jdbc方式连接数据库并认证用户信息服务器源码下载地址 https github com apereo cas releases tag v4 2 1 解压后 xff0c 项目目录如下 xff1a
prometheus 最全面的书籍推荐

https yunlzheng gitbook io prometheus book 转载于 https www cnblogs com kevincaptain p 10709575 html
使用ubuntu搭建时间机器备份服务

如何在ubuntu下搭建时间备份服务折腾了很久终于可以了请严格按照下面的方式来操作真正明白问题的可以按照自己的思路来我用的是ubnutu 16 04 安装配置netatalk sudo apt get install netat
sqlalchemy源代码阅读随笔（1）

今天看的 xff0c 是url py模块 xff0c 这个在create engine中 xff0c 起到的最用很大 xff0c 其本质 xff0c 就是对访问数据库的url xff0c 进行操作管里我们可以直接访问这个类看一个简单的代
C++的中英文字符串表示(string,wstring)

在C 43 43 中字符串类的string的模板原型是basic string template lt class Elem class traits 61 char traits lt Elem gt class Ax 61 alloca

C++的中英文字符串表示(string,wstring)

C++的中英文字符串表示(string,wstring) 的相关文章

随机推荐

热门标签