在哪里可以找到仅显示简体中文字符的 Unicode 表?
我到处寻找但什么也没找到。
UPDATE :
我发现还有另一种编码,称为 GB 2312 -
http://en.wikipedia.org/wiki/GB_2312 http://en.wikipedia.org/wiki/GB_2312
- 其中包含only简化的字符。
我当然可以用它来得到我需要的东西吗?
我还发现了这个将 GB2312 映射到 Unicode 的文件 -
http://cpansearch.perl.org/src/GUS/Unicode-UTF8simple-1.06/gb2312.txt http://cpansearch.perl.org/src/GUS/Unicode-UTF8simple-1.06/gb2312.txt
- 但我不确定它是否准确。
如果该表不正确,也许有人可以向我指出一个正确的表,或者只是一张 GB2312 字符表以及某种转换它们的方法?
更新2:
该网站还提供了 GB/Unicode 表,甚至还提供了用于生成文件的 Java 程序
包含所有 GB 字符以及 Unicode 等效字符:
http://www.herongyang.com/gb2312/ http://www.herongyang.com/gb2312/
The 统一汉数据库 http://unicode.org/charts/unihan.html文件中包含此信息Unihan_Variants.txt
。例如,一对繁体/简体字符是:
U+673A kTraditionalVariant U+6A5F
U+6A5F kSimplifiedVariant U+673A
在上面的例子中,U+6A5F是机,机的传统形式(U+673A)。
另一种方法是使用CC-CEDICT http://cc-cedict.org/wiki/项目,出版汉字和合成词词典(繁体和简体)。每个条目看起来都是这样的:
宕机 宕机 [dang4 ji1] /(计算机)崩溃/台语当机|当机[dang4 ji1]/
第一列是繁体字,第二列是简体字。
To get all简化字符,阅读此文本文件并列出第二列中出现的每个字符。请注意,某些字符可能不会单独出现(仅在复合词中出现),因此仅查看单字符条目是不够的。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)