ANSI是个啥？？？

2023-11-09

来自：

https://blog.csdn.net/imxiangzi/article/details/77370160

http://www.cnblogs.com/malecrab/p/5300486.html

用Notepad++创建一个文本文件text.txt，其默认编码格式为ANSI（乍看之下，还以为是ASCII呢），输入汉字居然不是乱码：

保存为test.txt，发送给你美国的同事Bob。他也用Notepad++，不幸的是，却发现你的文件内容是这样的：

也许你会认为：你用的是中文系统，能正常显示中文；他用的是英文系统，不能显示中文！

这么想，好像很有道理呢！

但是再细想一下：一个系统显示乱码，说明它不支持这种编码格式（或者解码方式不对）。难道英文系统不支持ANSI？难道ANSI是一种中文编码？

如果你身边有一个韩文系统，也装一个Notepad++，默认还是ANSI编码，你可以输入“한국어”，发现也能正常显示：

但是你要输入“汉字”可能就会发现是乱码了...

通过这个反例，就可以说明ANSI不是一种中文编码。那么，ANSI到底是什么编码？

用十六进制编辑器打开内容为“汉字”的test.txt文件：

你会发现：其中baba和d7d6正好是“汉”和“字”两个字的GBK编码值。

同样，用十六进制编辑器打开内容为“한국어”的test.txt文件：

你会发现：其中c7d1、b1b9和beee正好是“한”、“국”和“어”三个字符的EUC-KR编码值。

由此可以看出：其实ANSI并不是某一种特定的字符编码，而是在不同的系统中，ANSI表示不同的编码。你的美国同事Bob的系统中ANSI编码其实是ASCII编码（ASCII编码不能表示汉字，所以汉字为乱码），而你的系统中（“汉字”正常显示）ANSI编码其实是GBK编码，而韩文系统中（“한국어”正常显示）ANSI编码其实是EUC-KR编码。

话说计算机是由美国佬搞出来的嘛，他们觉得一个字节（可以表示256个编码）表示英语世界里所有的字母、数字和常用特殊符号已经绰绰有余了（其实ASCII只用了前127个编码）。后来欧洲人不干了，法国人说：我需要在小写字母加上变音符号（如：é），德国人说：我也要加几个字母（Ä ä、Ö ö、Ü ü、ß）。于是，欧洲人就将ASCII没用完的编码（128-255）为自己特有的符号编码（后来称之为“扩展字符集”）。等到我们中国人开始使用计算机的时候，尼玛，256个编码哪够？我泱泱大中华，汉字起码也得N多万吧，就连小学生都得要求掌握两三千字。国标局最后拍板：一个字节不够，那我们就用多个字节来为汉字编码吧，但是，国情那么穷，字节那么贵，三个字节伤不起，那就用俩字节吧，先给常用的几千汉字编个码，等以后国家强盛了人民富裕了，咱再扩展呗---于是GB2312就产生了。台湾同胞一看，尼玛，全是简体字，还让不让我们写繁体字的活了，于是台湾同胞也自己弄了个繁体字编码---大五码（Big-5）。同时，其它国家也在为自己的文字编码。最后，微软苦逼了：顾客就是上帝啊，你们的编码我都得满足啊，这样吧，卖给美国国内的系统默认就用ASCII编码吧，卖给中国人的系统默认就用GBK编码吧，卖给韩国人的系统默认就用EUC-KR编码，...但是为了避免你们误会我卖给你们的系统功能有差异，我就统一把你们的默认编码都显示成ANSI吧。---本故事纯属虚构，但“ANSI编码”确实只存在于Windows系统。

那么Windows系统是如何区分ANSI背后的真实编码的呢？

微软用一个叫“Windows code pages”（在命令行下执行chcp命令可以查看当前code page的值）的值来判断系统默认编码，比如：简体中文的code page值为936（它表示GBK编码，win95之前表示GB2312，详见：Microsoft Windows' Code Page 936），繁体中文的code page值为950（表示Big-5编码）。

我们能否通过修改Windows code pages的值来改变“ANSI编码”呢？

命令提示符下，我们可以通过chcp命令来修改当前终端的active code page，例如：
(1) 执行：chcp 437，code page改为437，当前终端的默认编码就为ASCII编码了（汉字就成乱码了）；
(2) 执行：chcp 936，code page改为936，当前终端的默认编码就为GBK编码了（汉字又能正常显示了）。
上面的操作只在当前终端起作用，并不会影响系统默认的“ANSI编码”。（更改命令行默认codepage参看：设置cmd的codepage的方法）。

Windows下code page是根据当前系统区域（locale）来设置的，要想修改系统默认的“ANSI编码”，我们可以通过修改系统区域来实现（“控制面板” =>“时钟、语言和区域”=>“区域和语言”=>“管理”=>“更改系统区域设置...”）：

图中的系统locale为简体中文，意味着当前“ANSI编码”实际是GBK编码。当你把它改成Korean(Korea)时，“ANSI编码”实际是EUC-KR编码，“한국어”就能正常显示了；当你把它改成English(US)时，“ANSI编码”实际是ASCII编码，“汉字”和“한국어”都成乱码了。（改了之后需要重启系统的。。。）

说明：locale是国际化与本地化中重要的概念，本文不深入讲解该内容。

你上面说的都是windows的情形吧，Linux呢？

将前述内容为“汉字”的文件test.txt拷贝至Linux下，用Emacs打开：

也是乱码！原因也是locale的问题：

更改locale后再打开：

正常显示了。。。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

编码

ANSI是个啥？？？的相关文章

【机器学习】编码、创造和筛选特征

在机器学习和数据科学领域中特征工程是提取转换和选择原始数据以创建更具信息价值的特征的过程假设拿到一份数据集之后如何逐步完成特征工程呢文章目录一特性类型分析 1 1 数值型特征 1 2 类别型特征 1 3 时间型特征 1 4 文
哈夫曼编码

哈夫曼编码 Huffman Coding 又称霍夫曼编码是一种编码方式哈夫曼编码是可变字长编码 VLC 的一种 Huffman于1952年提出一种编码方法该方法完全依据字符出现概率来构造异字头的平均长度最短的码字有时称之为最佳编码
编码-小数

C语言中对于小数采用float 单精度浮点型和double 双精度浮点型来存储 Float 不管是float还是double 在存储中都分为三部分第一位s代表符号位 1代表负数 0代表正数第二个域是指数域e 对于单精度float类
Eclipse使用技巧

1 Eclipse简介与安装 l 简介 Eclipse是著名的跨平台的自由集成开发环境 IDE Eclipse是IBM制作的一个免费开放源代码的软件开发项目专注于为高度集成的工具开发提供一个全功能的具有商业品质的工业平台最初主要用来J
pickle读文件解码问题

运行 Revisiting Semi Supervised Learning with Graph Embeddings 的代码 kimiyoung planetoid 其中用 pickle 读数据文件出现问题它本身是用 python 2
计算机编码发展历史和编码方式

编码是信息从一种形式或格式转换为另一种形式的过程也称为计算机编程语言的代码简称编码用预先规定的方法将文字数字或其它对象编成数码或将信息数据转换成规定的电脉冲信号编码在电子计算机电视遥控和通讯等方面广泛使用解码是编码的逆过
python3中编码转化

1 编码解码概念首先要明白一些概念调用函数的时候就不会出错了编码把数据变为01比特网络通信中的编码也是这个意思解码从01比特恢复为有意义的表示形式在python3中字符串是str类型而bytes类型表示的是一个字节串从
本原多项式/PRBS编码

Pseudo Random Binary Sequence伪随机二进制序列前言 PRBS N 其中N代表阶数伪随机序列以2 N 1数据长度为周期其他基础原理见百度或其他博主在此不赘述一常用的本原多项式 PRBS3 X3 X2 1
【通信原理】数字基带传输的线路码型

数字基带传输的线路码型简单介绍数字基带传输的线路码型的信号波形的特点以及生成方法注意观察频谱文末附Matlab代码以下包括双极性NRZ 单极型NRZ 双极型RZ 单极型RZ 差分码曼切斯特码数字双相码密勒码 CMI码 AMI
ffmpeg实战教程（四）格式转换如MP4转MKV等

知识延伸 I P B帧和PTS DTS的关系基本概念 I frame 帧内编码帧又称intra picture I 帧通常是每个 GOP MPEG 所使用的一种视频压缩技术的第一个帧经过适度地压缩做为随机访问的参考点可以当成图象
oracle导出后 ascii编码转utf-8问题

1 在设置如下环境变量后从oracle中导出的中文字符为乱码 export NLS LANG AMERICAN AMERICA ZHS16GBK 2 在Linux上用file i命令查看编码格式如下 xy w2 backimage tx
TensorFlow在MNIST中的应用-无监督学习-自编码器（autoencoder）和encoder

参考 TensorFlow技术解析与实战 TensorFlow上实现AutoEncoder自编码器前面讲到的都是有监督学习他的重要特征是数据都是有标记的无标记的数据应该用什么样的网络模型来学习呢这里用一个叫做自编码网络的网络模型
如何将TXT文本编码变为GB2312

如果你用记事本另存为选择ansi就是gb2312 另外如果你不确认文件是什么编码推荐用Replace Pioneer 首先用Replace Pioneer检测出一个文件是什么编码 1 选择Tools gt Encoding Detec
什么是Base64

一什么是Base64 百度百科中对Base64有一个很好的解释 Base64是网络上最常见的用于传输8Bit字节码的编码方式之一 Base64就是一种基于64个可打印字符来表示二进制数据的方法什么是可打印字符呢为什么要用它来传输8
git 拉取上游仓库tag并同步

git remote add upstream https github com xxxx xxxx git git fetch upstream tag vX X git tag git push origin refs tags vX
mysql [42000][1071] Specified key was too long; max key length is 767 bytes

今天在MySQL中建立表的时候报了一个错误说是key太长了超戳了767个字节但是建表语句并有超过指定的长度啊 CREATE TABLE XXL JOB QRTZ JOB DETAILS SCHED NAME VARCHAR 120
遗传算法之二进制编码

遗传算法的基本步骤遗传算法 GA 的流程如图所示 Created with Rapha l 2 2 0 编码把所需要选择的特征进行编号每一个特征就是一个基因一个解就是一串基因的组合为了减少组合数量在图像中进行分块然后把每一块看
按指定条件从C++11 map中删除元素

问题无法使用remove if配合map容器的erase操作按指定条件从map容器删除元素 C 11 解决方案可以使用一下函数实现这个需求 template
【PDF】PDF无法注释的一种解决方案

PDF无法注释需要检查 1 权限问题 2 文档规范问题 PDF A 拓展阅读浏览器打开PDF调整亮度和颜色的小技巧处理pdf 文档的相关功能包总结 1 pdf文档不能注释下载的一篇pdf文档在阅读时不能注释高亮和打字机等选项都是灰
多媒体开发计算机颜色相关知识

颜色模式颜色模式颜色模型和颜色空间计算机中的颜色格式常用的颜色模型分类 RGB颜色模型介绍 RGB模型的颜色空间 RGB555 RGB565 RGB24 RGB32 FFMPEG中定义的RGB色彩空间显示器的颜色空间

随机推荐

【Docker仓库】使用华为云SWR容器镜像仓库服务

Docker仓库使用华为云SWR容器镜像仓库服务一容器镜像服务SWR介绍 1 1 SWR服务简介 1 2 SWR服务特点二本次实践介绍 2 1 本次实践简介 2 2 本次实践环境介绍 2 3 检查本地docker环境三生成do
linux内存管理

原文链接 https blog csdn net wwwlyj123321 article details 128241134 一内存管理简述在Linux内核中 RAM会将其中一部分永远分配给内核用来存放Linux内核源码以及一些静态
解决ES6.6.0开启锁定内存后不能重新，报错“memory locking requested for elasticsearch process but memory is not locked”

错误原因就是我们在配置文件里开启了 bootstrap memory lock true 不需要次需求的话改成false就好如果需要开启按照下面来亲测可行 root localhost 234 grep Ev etc elastic
【云原生】Kubeadmin安装k8s集群

目录前言一环境部署 1 1 服务器部署功能 1 2 环境准备所有节点二安装docker 所有节点三所有节点安装kubeadm kubelet和kubectl 3 1 定义kubernetes源 3 2 开机自启kubelet
【蓝桥杯每日一练：递归算法求两个数的最大公约数】

问题描述求最大公约数问题输入格式输入一行包含两个正整数 lt 1 000 000 000 输出格式输出一个正整数即这两个正整数的最大公约数输入样例 6 9 输出样例 3 代码 n m map int input split i
idea导入Web项目并配置tomcat运行

文章目录一导入项目二配置tomcat 三配置Web项目在tomcat下的运行包一导入项目 File gt Open 然后选择要导入的web项目路径二配置tomcat 第一步单机右上角的Edit Configuration
面试题：海量数据去重、Top-k、BitMap问题整理

问题引入首先直接进入正题 40亿QQ号如何设计算法去重相同的QQ号码仅保留一个内存限制为1个G 腾讯的QQ号都是4字节正整数所以QQ号码的个数是43亿左右理论值2 32 1个又因为是无符号的翻倍了一下所以43亿左右方法1
交错级数如何判断收敛_11种常数项级数敛散性判别法(审敛法)的粗糙总结&11道好玩的小题...

追不上的上古玄武告诉我们无穷个正数加在一起不一定是正无穷以此为开端有了极限的观念还有了级数的观念很多数列的Sn很难求这篇文章只讨论极其片面的判断常数项级数是否收敛的十一个方法 PART 1 对于十一种级数敛散性判别法的粗糙总
STATA：缩尾、截尾的概念和命令
Python字符串地常规操作：取值，切片，查找，替换，分割，拼接，转义

字符串操作字符串取值字符串取单个值举例从零开始每个字符对应的索引 h 0 e 1 l 3 s hell0 a tong print s 0 print s 5 在这里符号也是一个字符 print s 7 索引为7 对应的是空
eclipse 配置 Tomcat 遇到的问题以及解决办法

Eclipse是一个开发JSP的很好的工具而笔者在配置Tomcat服务器的时候遇到了一些小问题在这里给大家总结一些经验希望能帮助同样遇到这些问题的广大同行们能够简单轻松地解决这些问题笔者在以前自学JSP的时候曾经用过Tomcat E
Android ,java.io.IOException: Failed to instantiate extractor.

mediaExtractor new MediaExtractor mediaExtractor setDataSource mFilePath mFilePath 为 sd 上路径 sdcard 月亮代表我的心萨克斯2 mp3 1 检查
【Java】环境配置以及快速切换环境的技巧和方法

前言前几天想用 burp 抓包来着发现 burp 突然不能用了重装了 burp 发现还是不能用意识到是 java 环境出了问题在之前有段时间没玩 CTF 去搞开发了于是java环境糊里糊涂改成了 JAVA 18 结果之前的 bu
Android项目JNI层C/C++文件中添加LOG信息

第一步在项目的mk文件中加入 LOCAL LDLIBS llog 第二步在要添加LOG的cpp文件中引入一个头文件和添加一个定义 include
M - Mountaineers （MST+树上倍增）

将原图中点每个点四连通方向的点建边权值为两点权值中较大者的值对这个图建立最小生成树那么最小生成树上任意两点之间路径上的最大点权即为答案因为是树所以任意两点间的简单路径唯一通过树上倍增维护维护树上区间最值求出最大值即可 pragm
pid算法控制

一先来彻底搞懂PID到底是啥啥是PID PID 就是比例 proportional 积分 integral 微分 derivative 是一种很常见的控制算法在工程实际中应用最为广泛的调节器控制规律为比例积分微分控制简称PI
数据结构_串的匹配（BF和KMP算法）

数据结构串的匹配 BF和KMP算法 BF brute force 算法算法定义代码实现算法分析 KMP算法算法详解代码实现算法分析子串的定位运算通常被称为串的模式匹配或串匹配 BF brute force 算法算法定义一
cmd pc如何开多个微信_多个合伙人开公司，股权应该如何分配

伴随着互联网发展的越来越快不少的创业型的公司在这快节奏的时代以惊人的速度展现在世人面前但是这个同时创业的道路也是艰辛的不过有着志同道合的小伙伴或许能够在成功的道路上又多了几分把握有句俗话说的好你能走多远将取决于是谁与你同行虽然说
【已成功解决】使用vpn/代理后无法正常上网/无法正常访问网站

文章目录一问题描述二解决步骤三原因分析一问题描述很多同学在学习访问学校提供的资源时或者一些小伙伴在公司办公时需要使用VPN 但是当我们关闭VPN后却发现没有办法正常连接到互联网了可以尝试以下方法解决至于导致这种情况发
ANSI是个啥？？？

来自 https blog csdn net imxiangzi article details 77370160 http www cnblogs com malecrab p 5300486 html 用Notepad 创建一个文本文件

ANSI是个啥？？？

ANSI是个啥？？？ 的相关文章

随机推荐

热门标签

ANSI是个啥？？？的相关文章