我正在尝试将 CSV 文件读入 Pandas 中的 Dataframe 中。当我尝试这样做时,出现以下错误:
UnicodeDecodeError:“utf-8”编解码器无法解码位置 55 中的字节 0x96:无效的起始字节
这是来自代码:
import pandas as pd
location = r"C:\Users\khtad\Documents\test.csv"
df = pd.read_csv(location, header=0, quotechar='"')
这是在 Windows 7 Enterprise Service Pack 1 计算机上,它似乎适用于我创建的每个 CSV 文件。在这种特殊情况下,位置 55 的二进制文件是 00101001,位置 54 的二进制文件是 01110011(如果有的话)。
使用文本编辑器将文件另存为 UTF-8 似乎也没有帮助。同样,添加参数“encoding='utf-8'”也不起作用——它会返回相同的错误。
导致此错误的最可能原因是什么?除了暂时放弃 DataFrame 构造并使用 csv 模块逐行读取 CSV 之外,还有其他解决方法吗?
尝试打电话read_csv
with encoding='latin1'
, encoding='iso-8859-1'
or encoding='cp1252'
(这些是 Windows 上发现的各种编码中的一些)。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)