由<meta charset=“UTF-8“>引发的血案--常见字符编码解析

2023-05-16

<meta charset="UTF-8">是什么意思?


最近要找实习,时间有限,以后一定把底层原理写个明白

首先解释一下这句代码的意义:

<meta charset="UTF-8">
  • meta为标签head中的子标签

  • 设置网页文件展示时使用的字符集

     

常见字符编码一览


编码名

解释

备注

ASCII

1、ASCII编码每个字母或符号占1byte(8bits),并且8bits的最高位是0,因此ASCII能编码的字母和符号只有128个。有一些编码把8bits最高位为1的后128个值也编码上,使得1byte可以表示256个值,但是这属于扩展的ASCII,并非标准ASCII。通常所说的标准ASCII只有前128个值。

2、ASCII编码几乎被世界上所有编码所兼容(UTF16和UTF32是个例外),因此如果一个文本文档里面的内容全都由ASCII里面的字母或符号构成,那么不管你如何展示该文档的内容,都不可能出现乱码的情况。

3、半角->一个字节(英文)->ASCII->是编译器认识的

Unicode

万国码

1、国际标准字符集,它将世界各种语言的每个字符定义一个唯一的编码,以满足跨语言、跨平台的文本信息转换。

2、UTF8解决字符间分隔的方式是数二进制中最高位连续1的个数来决定这个字是几字节编码。0开头的属于单字节,和ASCII码重合,做到了兼容。

UTF-8(16/32)

UTF-8是使用最广的一种 Unicode 的实现方式

将Unicode字符集的抽象代码位映射为8(16/32)位长整数(即代码位)进行数据存储或传输的序列。

GB2312

1、GB全称GuoBiao国标,GBK全称GuoBiaoKuozhan国标扩展。GB18030编码兼容GBK,GBK兼容GB2312,这三种编码有着非常深厚的渊源。

2、最早的简体中文汉字编码国家标准,采用双字节编码,收录7445个图形字符,其中包括6763个汉字。

3、GB2312:全角->两个字节->是编译器不认识的

BIG5

台湾地区繁体中文标准字符集,采用双字节编码,共收录13053个中文字

GBK

是对GB2312编码的扩充,对汉字采用双字节编码。GBK字符集共收录21003个汉字,包含国家标准GB13000-1中的全部中日韩汉字,和BIG5编码中的所有汉字。

GB18030编码

是对GBK编码的扩充,覆盖中文、日文、朝鲜语和中国少数民族文字,其中收录27484个汉字。GB18030字符集采用单字节、双字节和四字节三种方式对字符编码。兼容GBK和GB2312字符集

表1 常见字符编码表

兼容性一栏


                         

图1 常见字符编码兼容性一览

  图中我们可以看出,ASCII被所有编码兼容,而最常见的UTF8与GBK之间除了ASCII部分之外没有交集这也是平时业务中最常见的导致乱码场景,使用UTF8去读取GBK编码的文字,可能会看到各种乱码。而GB系列的几种编码,GB18030兼容GBK,GBK又兼容GB2312

引用:

1、https://zhuanlan.zhihu.com/p/46216008

2、https://www.qqxiuzi.cn/bianma/zifuji.php

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

由<meta charset=“UTF-8“>引发的血案--常见字符编码解析 的相关文章

  • Ant Design table 自动对齐表头

    在table的属性中加入 xff1a scroll 61 34 x 39 max content 39 34 即可不用设置列宽度 xff0c 自适应全表内容为一行显示 xff0c 自动对齐表头
  • Python pip 源设置成国内源,阿里云源,清华大学源,最方便的方式,都在这里了

    文章目录 背景代码替换设置阿里源 推荐这个 设置清华大学的 手动替换windows 替换Mac 替换 国内源列表 xff08 推荐用阿里云的 xff09 推荐阅读 背景 由于 python 自带的源下载速度非常慢 xff0c 特别是安装一些
  • Linux 休眠和挂起

    Linux休眠和挂起 xff08 2008新版 xff09 Linux2 6内核已经有了非常多的变化 xff0c 配置也要相应的改变 The only thing that not changes is Change xff1a xff09
  • 使用dpkg命令安装deb文件包

    1 使用dpkg命令进行安装 sudo dpkg i deb文件名 2 根据经验 xff0c 通常情况下会报依赖关系的错误 xff0c 我们可以使用以下的命令修复安装 sudo apt get install f 3 如果要卸载安装的应用我
  • UITableViewController (列表视图控制器)

    tableview里Cell的小对勾颜色改成别的颜色 xff1f mTableView tintColor 61 UIColor redColor 怎么在不新建一个Cell的情况下调整separaLine的位置 xff1f 一 myTabl
  • Python零代码小游戏 · FreeGames

    Python在日常的办公或者其他领域都有涉及 xff0c 如网站开发 数据分析 爬虫 可视化等等 我们其实还可以选择用Python开发小游戏 xff0c 回忆童年的美好时光 这次并非用PyGame制作的 xff0c 而是一个很有趣的库 Fr
  • Linux 系统使用 git 提交代码-- git 的安装及使用(简明教学指南)

    序 2023 02 09 晚 鉴于本篇文章收藏量比较多 xff0c 那就给大家分享点在实际工作中使用频率最高的工作流命令吧 场景如下 多人共同开发一个项目 xff1a 我叫小明 xff0c 参与了一个名为 chatGPT 的项目 xff0c
  • pyperclip 粘贴失效

    最近在pyautogui自动化输入时 xff0c 发现英文数字都可以 xff0c 中文比较麻烦 xff0c 而且还牵扯到输入法切换问题 xff0c pyautogui typewrite 这是相当于键盘输入 xff0c 如果现在是中文 xf
  • mac 安装问题汇总

    1 问题 xff1a 应用程序添加到登陆项后需要输入密码 xff0c 怎么才能不让它提示输入密码 xff0c 直接运行 xff1f 回答 xff1a 终端内输入 sudo s 输入密码 chown root Applications Gen
  • 如何在Java中加密和解密zip文件?

    在本文中 xff0c 我们来学习如何用Zip4j库创建受密码保护的压缩文件并将其解压 依赖 让我们先把 zip4j 依赖关系添加到我们的 pom xml 文件中 lt dependency gt lt groupId gt net ling
  • Alibaba技术大牛丢给我一份Spring Cloud笔记,在GitHub的热度居然高达81.6k标星,太强了!

    前言 阿里巴巴 xff0c 作为国内互联网公司的Top xff0c 算是业界的标杆 xff0c 有阿里背景的程序员 xff0c 也更具有权威性 作为程序员 xff0c 都清楚阿里对于员工要求有多高 xff0c 技术人员掌握的技术水平更是望尘
  • VNC安装教程

    服务器远程访问工具 xff0c 图形化界面 xff0c VNC安装 需要先在服务器安装sever xff0c 然后在本地安装客户端进行访问 一 首先在服务器安装vncserver span class token comment 以root
  • Debian11安装Docker稳定版

    1 安装依赖包 apt get update amp amp apt get install ca certificates curl gnupg lsb release apt transport https software prope
  • 程序员成神之路,一年挖坑,五年扛旗,十年成神

    自人类社会诞生以来 xff0c 等级就一直存在 xff0c 有人指点江山 xff0c 称之为 大神 有人卸瓦搬砖 xff0c 称之为 小白 在程序员的世界里 xff0c 等级同样森严 特别是在1年 5年 10年时会有大不同 据说到达上面每一
  • [安装fastfds中的nginx执行make命令报错]src/core/ngx_murmurhash.c:37:11: error

    问题 在nginx文件夹里执行make命令报错 src core ngx murmurhash c 37 11 error this statement may fall through Werror 61 implicit fallthr
  • 七牛云融合CDN到底怎么配置?

    人生如戏 xff0c 你得先有故事 老李 由于来年头一个月公司产品接入了一个旅游项目 xff0c 为了保证系统的稳定性 xff0c 必须要对现有架构进行改进以应对大流量的冲击 那么问题来了 xff1f 怎么改 xff1f 首先 xff0c
  • 【二、Arm平台直接安装QT】

    在目标开发平台空间资源不紧张的情况下 xff0c 可直接安装QT常规库 xff0c 省去交叉编译QT源码的时间 span class token function sudo span span class token function ap
  • ubuntu sudo apt-get update时执行失败应该怎么办

    命中 1 http security ubuntu com ubuntu focal security InRelease 命中 2 http us archive ubuntu com ubuntu focal InRelease 命中
  • 不吹不黑,逛GitHub没看过这10个开源项目,绝对血亏

    今天的分享 xff0c 也算是一次简单的复盘 xff0c 我们花了点时间梳理了一下 xff0c 以便诸位在空余时间可以研究学习 下面开始进入正题 xff1a 1 Build Your Own X GitHub Star xff1a 61 3
  • 快速精准的人头检测,代码已开源

    昨天arXiv一篇新上论文 FCHD A fast and accurate head detector xff0c 来自江森自控 xff08 Johnson Controls Inc xff09 的软件工程师Aditya Vora分享了一

随机推荐

  • UDP 用户数据报协议

    UDP 用户数据报协议 引言 UDP是一种保留消息边界 xff08 不合并 xff0c 不拆分 xff09 的简单的面向数据报的传输层协议 使用UDP协议的时候 xff0c 一般来说 xff0c 每个被应用程序请求的UDP输出操作只生产一个
  • 有新家了

    我在CSDN有个小窝了 我是一个JAVA初学者 虽然不是从事IT业 但对计算机有着浓厚的兴趣 希望在CSDN这个大家庭里 能得到朋友们的帮助 当然 我也会力所能及的帮助其它初学者解决一些简单问题的 以后我会把每天学习的内容 来这里发表一下
  • 动态绑定和多态

    class Animal private String name Animal String name this name 61 name public void enjoy System out println 34 叫声 34 clas
  • 离线安装gitlab

    1 下载跟Linux版本相关的 rpm包 地址 xff1a https packages gitlab com gitlab gitlab ce 2 将下载的rpm包上传到机器 3 解压 rpm ivh gitlab ce 15 6 2 c
  • windows子系统 WSL 的根目录位置

    根目录对应位置 我安装的子系统是 Ubuntu18 04 xff0c 根目录对应的位置是 xff1a C Users Administrator AppData Local Packages CanonicalGroupLimited Ub
  • 2020阿里云学生服务器操作步骤!

    前言 年龄在12岁 24岁之间的大陆个人实名认证用户 和 大陆全日制在校大学生在学生认证有效期内 xff0c 满足上述任一条件即可享受优惠价格 xff0c 同一用户只能保有一台学生优惠弹性计算产品 xff0c 一台数据库RDS产品 xff0
  • python用Selenium爬取携程网机票信息

    一 问题说明 1 selenium库是爬虫过程中比较讨巧的一个第三方库 xff0c 它能够跳过js ajax等交互 xff0c 上手比较容易 2 基础代码是根据其他博主参考而来 xff0c 但携程网站不断变化 xff0c 除ID等不变的信息
  • Docker---Docker-compose安装部署Samba服务

    Docker compose安装部署Samba服务 目录 Docker compose安装部署Samba服务一 环境准备二 创建docker compose yaml文件三 测试服务 一 环境准备 1 拉取samba镜像 xff1a doc
  • 金山词霸2005专业版序列号,绝对正确 JQ7M7-XCD38-834H2-TRTWJ-J7BG4

    金山词霸2005专业版序列号 xff0c 绝对正确 JQ7M7 XCD38 834H2 TRTWJ J7BG4
  • Java数据结构——用顺序表编写一个简易通讯录

    Java数据结构 用顺序表编写一个简易通讯录 1 定义线性表的抽象数据类型 xff08 接口 xff09 2 编写顺序表 xff08 类 xff09 3 编写测试程序 xff08 main方法所在的可运行类 xff09 Java数据结构 用
  • sprintf和snprintf用法

    1 sprintf 函数 sprintf 函数原型为 intsprintf char str const char format 其中的格式控制字符串与 printf 的格式控制字符串的作用是一样的 xff0c 表示的是参数的格式 xff0
  • 官网的订阅发布节点

    发布话题 1 usr bin env python 2 license removed for brevity 3 import rospy 4 from std msgs msg import String 5 6 def talker
  • Tkinter教程之Pack篇

    39 39 39 Tkinter教程之Pack篇 39 39 39 Pack为一布局管理器 xff0c 可将它视为一个弹性的容器 39 39 39 1 一个空的widget 39 39 39 不使用pack coding cp936 fro
  • Sqlserver中解析JSON

    参考 xff1a https www red gate com simple talk sql t sql programming consuming json strings in sql server 主要的过程代码单独贴出来 xff1
  • 解决逃离塔科夫0.12.9离线版修改商人可回收所有物品的问题

    复制这里的代码替换 xff0c 不会出现问题 span class token string property property 34 sell category 34 span span class token operator span
  • 手把手教你一套完善且高效的k8s离线部署方案

    作者 xff1a 郝建伟 背景 面对更多项目现场交付 xff0c 偶而会遇到客户环境不具备公网条件 xff0c 完全内网部署 xff0c 这就需要有一套完善且高效的离线部署方案 系统资源 编号主机名称IP资源类型CPU内存磁盘01k8s m
  • 好日子1/6啦啦啦

    今天我直接开搞把作业搞定 xff0c 上题目 题目背景 小明在 A 公司工作 xff0c 小红在 B 公司工作 题目描述 这两个公司的员工有一个特点 xff1a 一个公司的员工都是同性 A 公司有 NN 名员工 xff0c 其中有 PP 对
  • 树莓派4B安装PHP7.3 Nginx MySQL 教程

    非原创 感谢作者 https web security cn rapberry pi 4b install php7 3 nginx mysql 在树莓派4B上搭建Web服务器环境 xff1a PHP7 3 43 Nginx 43 Mari
  • 只需几步,U盘就能变“光驱”

    从07年开始 xff0c 移动存储市场就开始猛刮降价风 到现在 xff0c 大容量U盘的价格更是降到了难以想象的地步 xff0c 连8GB产品的价格都到了300元以内 不过虽然容量上去了 xff0c 一般U盘的功能却并没有太多的改变和延伸
  • 由<meta charset=“UTF-8“>引发的血案--常见字符编码解析

    lt meta charset 61 34 UTF 8 34 gt 是什么意思 xff1f 最近要找实习 xff0c 时间有限 xff0c 以后一定把底层原理写个明白 首先解释一下这句代码的意义 xff1a lt meta charset