正在阅读关于 UTF-8 的维基百科文章 http://en.wikipedia.org/wiki/UTF-8,我一直想知道这个词overlong。该术语多次使用,但本文没有提供其含义的定义或参考。
我想知道是否有人可以解释该术语及其目的。
它是一种代码点的编码,需要比需要的更多的代码单元。
例如,U+0020 在 UTF-8 中用单字节表示0x20
。如果解码这两个字节0xc0 0xa0
以正常方式,您仍然会返回 U+0020,但这是无效的表示。
The Unicode 勘误#1 http://www.unicode.org/versions/corrigendum1.html有更多信息,特别是表 3.1B 附近的信息。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)