根据您的经验,到目前为止,哪些 Unicode 字符、代码点、BMP(基本多语言平面)之外的范围是最常见的?这些是需要 UTF-8 中的 4 个字节或 UTF-16 中的代理项。
我本以为答案是名称中使用的中文和日文字符,但不包含在最广泛的 CJK 多字节字符集中,但在我大部分工作的项目(英语维基词典)中,我们发现哥特字母到目前为止更为常见。
UPDATE
我编写了几个软件工具来扫描整个维基百科中的非 BMP 字符,令我惊讶的是,即使在日语维基百科中,哥特字母也是最常见的。中文维基百科也是如此,但其中也有许多汉字被使用了50或70次,包括“
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)