简体中文Unicode表

2023-12-28

在哪里可以找到仅显示简体中文字符的 Unicode 表? 我到处寻找但什么也没找到。

UPDATE :
我发现还有另一种编码,称为 GB 2312 -
http://en.wikipedia.org/wiki/GB_2312 http://en.wikipedia.org/wiki/GB_2312
- 其中包含only简化的字符。
我当然可以用它来得到我需要的东西吗?

我还发现了这个将 GB2312 映射到 Unicode 的文件 -
http://cpansearch.perl.org/src/GUS/Unicode-UTF8simple-1.06/gb2312.txt http://cpansearch.perl.org/src/GUS/Unicode-UTF8simple-1.06/gb2312.txt
- 但我不确定它是否准确。

如果该表不正确,也许有人可以向我指出一个正确的表,或者只是一张 GB2312 字符表以及某种转换它们的方法?

更新2:
该网站还提供了 GB/Unicode 表,甚至还提供了用于生成文件的 Java 程序 包含所有 GB 字符以及 Unicode 等效字符:
http://www.herongyang.com/gb2312/ http://www.herongyang.com/gb2312/


The 统一汉数据库 http://unicode.org/charts/unihan.html文件中包含此信息Unihan_Variants.txt。例如,一对繁体/简体字符是:

U+673A  kTraditionalVariant     U+6A5F
U+6A5F  kSimplifiedVariant      U+673A

在上面的例子中,U+6A5F是机,机的传统形式(U+673A)。

另一种方法是使用CC-CEDICT http://cc-cedict.org/wiki/项目,出版汉字和合成词词典(繁体和简体)。每个条目看起来都是这样的:

宕机 宕机 [dang4 ji1] /(计算机)崩溃/台语当机|当机[dang4 ji1]/

第一列是繁体字,第二列是简体字。

To get all简化字符,阅读此文本文件并列出第二列中出现的每个字符。请注意,某些字符可能不会单独出现(仅在复合词中出现),因此仅查看单字符条目是不够的。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

简体中文Unicode表 的相关文章

随机推荐