我正在寻找一种简单有效的方法来以 ASCII-7 存储 UTF-8 字符串。我所说的高效是指:
- 输入中的所有 ASCII 字母数字字符应与输出中的 ASCII 字母数字字符保持相同
- 结果字符串应尽可能短
- 该操作需要可逆且不会丢失任何数据
- 生成的 ASCII 字符串应不区分大小写
- 输入长度不应受到限制
- 应允许整个 UTF-8 范围
我的第一个想法是使用 Punycode (IDNA),因为它符合前四个要求,但在后两个要求上失败了。
谁能推荐一种替代编码方案?如果有一些代码可供查看就更好了。
UTF-7 http://en.wikipedia.org/wiki/UTF-7,或者,稍微不那么透明但更广泛,引用可打印 http://en.wikipedia.org/wiki/Quoted-printable.
输入中的所有 ASCII 字符应在输出中保留 ASCII 字符
(显然不完全可能,因为你至少需要one角色作为逃避。)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)