维基百科上的汉字编码是什么?

2024-01-18

我在维基百科上查看中文字符的编码,但无法弄清楚它们正在使用什么。例如“的”被编码为“%E7%9A%84”(see here http://upload.wikimedia.org/wikipedia/commons/thumb/a/ae/%E7%9A%84-order.gif/24px-%E7%9A%84-order.gif)。这是三个字节,但是没有描述任何编码在本页 http://www.khngai.com/chinese/charmap/使用三个字节来表示汉字。例如,UTF-8 使用 2 个字节。

我基本上试图将这三个字节与实际字符匹配。关于它可能是什么编码有什么建议吗?



>>> c='\xe7\x9a\x84'.decode('utf8')
>>> c
u'\u7684'
>>> print c
的

though Unicode encodes it in 16 bits, utf8 breaks it down to 3 bytes.
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

维基百科上的汉字编码是什么? 的相关文章

  • 如何确定 OS X 中的文件编码?

    我正在尝试将一些 UTF 8 字符输入到 LaTeX 文件中TextMate http en wikipedia org wiki TextMate 它说它的默认编码是UTF 8 但LaTeX似乎不理解它们 Running cat my f
  • Express URIError:无法解码参数

    当请求的参数包含时 我将 next js 与自定义 Express 服务器一起使用 它会导致此错误 URIError Failed to decode param faker at decodeURIComponent
  • 将 url 从 utf-8 编码重新编码为 iso-8859-1 编码

    我有 file 链接 其中包含非英语字符 这些字符以 UTF 8 进行 UrlEncoded 为了使这些链接在浏览器中工作 我必须对它们重新编码 file development H C3 A5ndplukket doc becomes f
  • PowerShell 中的 SVN 输出编码

    我正在尝试在 PowerShell 脚本内的字符串中捕获 SVN 日志 在命令行上 输出的编码是正确的 但是当我将其捕获到字符串中时 它就不是正确的 PS C sandbox gt svn log r1804 https myserver
  • UTF-8 解码如何知道字节边界?

    我一直在阅读大量有关 unicode 编码的文章 尤其是有关 Python 的文章 我想我现在对此已经有了相当深入的了解 但仍有一个小细节我有点不确定 解码如何知道字节边界 例如 假设我有一个带有两个 unicode 字符的 unicode
  • .NET:如何判断编码是否支持字符串中的所有字符?

    我需要输出大量文本 其中包括多种语言的各种字符 有时我需要以 Unicode 以外的字符编码 例如 Shift JIS 或 ISO 8859 2 输出文本 以便匹配它要访问的页面 如果文本中包含编码无法处理的字符 例如 ISO 8859 2
  • pyodbc 无法正确处理 unicode 数据

    我确实使用 pyodbc 成功连接了 MySQL 数据库 并且它可以很好地处理 ascii 编码的数据 但是当我打印使用 unicode utf8 编码的数据时 它引发了错误 UnicodeEncodeError ascii codec c
  • 使用 Python 2.7 和 MySQLdb 将二进制数据插入 MySQL 中的 blob 列时如何避免编码警告

    我在将二进制数据插入到longblob使用 Python 2 7 中的 MySQLdb 在 MySQL 中的列 但我收到一个编码警告 我不知道如何解决 test py 11 Warning Invalid utf8 character st
  • R 的 read.csv 在第一列名称前面加上垃圾文本[重复]

    这个问题在这里已经有答案了 我已将数据从 SQL Server Management Studio 中的结果网格导出到 csv 文件 csv 文件看起来正确 但是当我使用 read csv 将数据读入 R 数据帧时 第一个列名称前面带有 如
  • PHP中特殊字符的转换

    我已经尝试了很多功能 但我根本无法弄清楚这一点 无论如何 正确的方法 在称为描述的表单字段中 我可以期待各种字符 在将它们提交到数据库之前 需要将它们格式化为 HTML 实体 现在 我的代码 formdesc htmlentities PO
  • 如何在 Eclipse 中用阿拉伯语读写

    我在 eclipse 中编写了这段代码来获取一些阿拉伯语单词 然后打印它们 public class getString public static void main String args throws Exception PrintS
  • 如何在Vim中正确显示UTF-8字符

    我想要 需要编辑包含 UTF 8 字符的文件 并且我想使用 Vim 在我被指责问以前问过的问题之前 我已经阅读了有关编码 文件编码 s 术语编码等的 Vim 文档 用 google 搜索了该主题 并阅读这个问题 https stackove
  • 如何将unicode文本转换为可读的utf8文本?

    我遇到了关于 Unicode 和 utf8 的严重问题 我将一段阿拉伯语 波斯语文本文件保存到记事本中并保存 现在我看到我的信息如下 我的问题是如何取回我的数据 取回这些数据对我来说很重要 提前致谢 该段落通过另存为代码页 1256 阿拉伯
  • PHP 函数 iconv 字符编码从 iso-8859-1 到 utf-8

    我正在尝试将字符串从 iso 8859 1 转换为 utf 8 但是当我找到这两个字符 和 时 函数返回 一个字符 是一个里面有两个数字的正方形 我该如何解决这个问题 我认为您正在寻找的编码是Windows 代码页 1252 http en
  • 在网络浏览器上显示 UTF-16 字符

    我打印了一些 UTF 16 编码的字符并尝试在 Firefox 中显示它 它显示为 所以我进入 工具 gt 编码 并将编码从 UTF 8 更改为 UTF 16 我也尝试直接在 HTML 中更改字符集 但是 当我这样做时 我的页面完全被符号淹
  • Java字符串中的字符数[重复]

    这个问题在这里已经有答案了 可能的重复 Java 使用unicode上划线显示平方根时字符串的长度 https stackoverflow com questions 7704426 java length of string when u
  • 在 grails 中编写代理

    我正在使用 Gralis 1 3 7 我正在编写一个控制器 需要从另一台服务器获取 PDF 文件并将其返回给客户端 我想以某种相当有效的方式来做到这一点 例如 class DocController def view URL source
  • Spring/Rest @PathVariable 字符编码

    在我使用的环境 Tomcat 6 中 路径段中的百分比序列在映射到 PathVariable 时显然是使用 ISO 8859 1 进行解码的 我希望它是 UTF 8 我已经将 Tomcat 配置为使用 UTF 8 使用 server xml
  • 运行源代码中包含 Unicode 字符的 Python 2.7 代码

    我想运行一个在源代码中包含 unicode utf 8 字符的 Python 源文件 我知道这可以通过添加评论来完成 coding utf 8 在一开始的时候 但是 我希望不使用这种方法来做到这一点 我能想到的一种方法是以转义形式编写 un
  • 如何读取数据库文件并应用不同的解码?

    我有一个 dbf 文件结束编码为 866 代码页 DOS 使用下面的代码 我正在尝试阅读它 问题是我得到的字符串的形成方式就好像文件位于代码页 1252 中一样 我已经检查过 SO 和其他论坛上的其他问题 到目前为止还没有运气 寻找有关热门

随机推荐

  • 有没有办法将 app/web.config 分成 2 个文件?

    我目前使用 app web config 来存储数据库的连接字符串 这意味着在升级时我们不会触及配置文件来保留这些字符串 然而 我们现在想要迁移到 MVC5 这样做需要在 app web config 中更新所有库定义 我们有一个具有类似配
  • 使用 CanCan 进行上下文感知授权

    我想使用 CanCan 来处理我的权限 我的网站有许多不同的权限级别 其中大多数都是上下文感知的 例如 以下是我的 3 个主要模型中的关系 class User lt ActiveRecord Base has many league re
  • 如何从 PHP 中的 URL 中去掉域名?

    我正在寻找一种方法 或函数 来删除输入到函数中的任何 URL 的 domain ext 部分 域名扩展名可以是任何内容 com co uk nl whatever 输入的 URL 可以是以下任何内容 http www domain com
  • Web.config URL 重写 - HTTPS 和非 WWW

    我需要两者兼而有之https and non www重写 同时也不对域进行硬编码 因为我们有很多服务器 这需要在web config 不在IIS 我读过很多文章 http www iis net learn extensions url r
  • 如何使用 Javascript 将查询参数附加到我的 URL?

    我正在构建一个 Web 应用程序 并使用 Firebase 将用户数据存储在 Cloud Firestore 中 我的网络应用程序上有一个页面 允许用户从 Cloud Firestore 查看他们的文档 我想在我的 URL 末尾添加一个查询
  • Wamp 图标为绿色,但点击时没有反应

    我面临的问题是 我新安装的 WAMP 3 0 正在运行 图标为绿色 apache 和 MYSQL 已启动并运行 本地主机页面可访问 但如果我单击 WAMP 图标来更改任何设置 图标没有反应根本不 鼠标左键或右键单击均不起作用 即使我想关闭
  • Backbone.js 在视图中获取渲染回调

    我有一个 Backbone 应用程序 我们有这样的东西 render function this el html template id plugin return this The id来自正在渲染的元素 这仅有时有效 因为它实际插入到
  • 注销后无法使用 Facebook 凭据登录

    我有一个 Android 应用程序 允许用户使用 Facebook 凭据登录 一旦他们第一次注销 他们就无法再次登录 清除应用程序的权限后用户设置中的应用程序页面 https www facebook com settings tab ap
  • FromHeader Asp.NET Core 绑定到默认值

    我正在使用以下基本控制器测试 Asp Net core WebApi Route test public class TestController Route mult HttpGet public int Multiply int x i
  • 对 python 源文件中的类定义进行排序的最佳方法是什么?

    我有一个包含许多类定义的 py 源 如下所示 class C code c class A code a class B code b 我想把它变成 class A code a class B code b class C code c
  • 数字矩阵 javascript

    我需要 JS 中一个函数的帮助 该函数按给定整数 N 打印矩阵 如下所示 N 2 Matrix 1 2 2 3 N 3 Matrix 1 2 3 2 3 4 3 4 5 我需要用两个循环来完成 但我不知道如何做 function solve
  • 如何禁用 JSpinner 的键盘和鼠标输入?

    当我尝试使 JSpinner 无法通过键盘或鼠标编辑时 如下所示 DefaultEditor mySpinner getEditor getTextField setEditable false mySpinner setEnabled f
  • 我无法解决“为标识符注册的笔尖无效(BNRItemCell)”

    正在阅读 Big Nerd Ranch iOS 书 我在第二天尝试解决这个问题 我快要疯了 有人能帮忙吗 我收到以下错误消息 2014 06 20 11 37 18 764 Homepwner 10388 60b 由于未捕获的异常 NSIn
  • 当底层表发生变化时更新物化视图

    我有一个这样定义的物化视图 CREATE MATERIALIZED VIEW M FOO REFRESH COMPLETE ON COMMIT AS SELECT FOO ID BAR FROM FOO WHERE BAR IS NOT N
  • 是什么 ?关于常规变量?

    我在一些常规代码中看到了这样的内容 trip id encodeAsHTML 使用或不使用 id 有什么区别 它检查对象是否为空 使用它 可以防止空指针异常 如果您使用它 则应该将其用于整个对象 例如 trip id otherstuff
  • Quartus初始化RAM

    我制作了一个实体 其中 quartus 成功识别 RAM 并为其实例化 RAM 宏功能 如果我可以从文件初始化 RAM 那就太好了 我找到了制作此类文件 mif 文件 的教程 现在我已经创建了该文件 我不知道如何让 quartus 初始化该
  • Django 和具有多个外键的模型

    我是 Django 的新手 到目前为止 它的功能给我留下了深刻的印象 我正在使用更复杂的模型 但无法正确使用它们 使用 Django 1 3 我尝试编写一个摘要页面 该页面将使用以下结构呈现下面的三个模型 换句话说 就是包含目的地和活动的旅
  • open_basedir 的影响和子域限制

    出于安全原因 我已将我的yiihtml 根目录下的文件夹 所以我的结构如下所示 conf httpdocs httpsdocs yii 运行该网站时 我收到错误 open basedir 限制yii php这是由index php out
  • AppBar Material UI 问题

    我对 Material UI 库还很陌生 但到目前为止我真的很喜欢它 但是 我遇到了 AppBar 组件覆盖在我的其他内容上的问题 我目前有
  • 维基百科上的汉字编码是什么?

    我在维基百科上查看中文字符的编码 但无法弄清楚它们正在使用什么 例如 的 被编码为 E7 9A 84 see here http upload wikimedia org wikipedia commons thumb a ae E7 9A