编码/解码的用例是什么?
我的理解是,编码用于将字符串转换为字节字符串,以便能够在程序中传递非 ascii 数据。而decode就是将这个字节串转换回字符串。
有点遵循。示例显示即使未编码/解码,非 ascii 字符也能成功打印。例子:
val1="À È Ì Ò Ù Ỳ Ǹ Ẁ"
val2 = val1
print('val1 is: ',val2)
encoded_val1=val1.encode()
print('encoded_val1 is: ',encoded_val1)
decoded_encoded_val1=encoded_val1.decode()
print('decoded_encoded_val1 is: ',decoded_encoded_val1)
Output:
那么 python 中的编码和解码的用例是什么?
您正在使用的环境可能支持这些字符,此外您的终端(或您用来查看输出的任何设备)可能支持显示这些字符。某些终端/命令行或文本编辑器可能不支持它们。除了显示问题之外,以下是一些实际原因和示例:
1- 当您通过互联网/网络(例如使用套接字)传输数据时,信息将作为原始字节传输。非ascii字符不能用单个字节表示,因此我们需要一种特殊的表示方式(utf-16或utf-8,具有多个字节)。这是我遇到的最常见的原因。
2- 某些文本编辑器仅支持 utf-8。例如,您需要代表您的Ẁ https://www.compart.com/en/unicode/U+1E80utf-8 格式的字符以便使用它们。原因是在处理文本时,人们大多使用 ASCII 字符,它们只是一个字节。当某些系统需要与非 ASCII 字符集成时,人们将它们转换为 utf-8。一些对文本编辑器有更深入了解的人可能会对这一点给出更好的解释。
3-您可能有一段用 unicode 字符编写的文本,其中包含一些中文/俄语字母,并且出于某种原因将其存储在远程 Linux 服务器中。但您的服务器不支持这些语言的字母。您需要将文本转换为某种严格的格式(utf-8 或 utf-16)并将其存储在服务器中,以便以后可以恢复它们。
这里有一个小解释UTF-8 格式 https://www.fileformat.info/info/unicode/utf8.htm。如果您有兴趣,还有有关该主题的其他文章。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)