Panda read_csv 中的编码错误[重复]

2023-11-24

我正在尝试将 CSV 文件读入 Pandas 中的 Dataframe 中。当我尝试这样做时，出现以下错误：

UnicodeDecodeError：“utf-8”编解码器无法解码位置 55 中的字节 0x96：无效的起始字节

这是来自代码：

import pandas as pd

location = r"C:\Users\khtad\Documents\test.csv"

df = pd.read_csv(location, header=0, quotechar='"')

这是在 Windows 7 Enterprise Service Pack 1 计算机上，它似乎适用于我创建的每个 CSV 文件。在这种特殊情况下，位置 55 的二进制文件是 00101001，位置 54 的二进制文件是 01110011（如果有的话）。

使用文本编辑器将文件另存为 UTF-8 似乎也没有帮助。同样，添加参数“encoding='utf-8'”也不起作用——它会返回相同的错误。

导致此错误的最可能原因是什么？除了暂时放弃 DataFrame 构造并使用 csv 模块逐行读取 CSV 之外，还有其他解决方法吗？

尝试打电话read_csv with encoding='latin1', encoding='iso-8859-1' or encoding='cp1252'（这些是 Windows 上发现的各种编码中的一些）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

csv

pandas

UTF8

Panda read_csv 中的编码错误[重复] 的相关文章

Pandas 和 Matplotlib - 需要按国家/地区划分的疫苗接种百分比以及使用下拉菜单的特定国家/地区首选疫苗的条形图

这是数据集 location date vaccine total vaccinations 0 Austria 2021 01 08 Johnson Johnson 0 1 Austria 2021 01 08 Moderna 0 2 A
如何获取 pandas 数据框并覆盖 Excel 工作簿中的特定工作表

我想获取一个数据框并让它替换特定工作表中的现有数据假设为sheet1 然后我想获取另一个数据框并将其附加到另一张工作表上的数据比如说同一工作簿中的sheet2 目前我必须将数据写入新的 Excel 工作簿我无法在线找到如何实际替换我
R 的 read.csv 在第一列名称前面加上垃圾文本[重复]

这个问题在这里已经有答案了我已将数据从 SQL Server Management Studio 中的结果网格导出到 csv 文件 csv 文件看起来正确但是当我使用 read csv 将数据读入 R 数据帧时第一个列名称前面带有如
如何搜索一列并用找到的内容填充另一列？

我有一个带有虚构人物数据的大熊猫数据框下面是一个小例子每个人都由一个数字定义 import pandas as pd import numpy as np df pd DataFrame Number 5569 3385 9832 64
matplotlib - 将文本包装在图例中

我目前正在尝试绘制一些pandas数据通过matplotlib seaborn 然而我的一个专栏标题特别长拉长了情节考虑以下示例 import random import pandas as pd import matplotlib p
使用最新值进行采样

考虑以下系列 created at 2014 01 27 21 50 05 040961 80000 00 2014 03 12 18 46 45 517968 79900 00 2014 09 05 20 54 17 991260 636
Pandas 根据条件替换数据框值

我有一个主数据框 df Colour Item Price Blue Car 40 Red Car 30 Green Truck 50 Green Bike 30 然后我有一个价格修正数据框 df pc Colour Item Price
处理错误“TypeError: Expected tuple, got str”将 CSV 加载到 pandas 多级和多索引 (pandas)

我正在尝试加载 CSV 文件这个文件 https drive google com file d 13a eVeSzy6HkhffQw32S57U hm5YCj0 view usp sharing 创建一个多索引多级数据帧它有5 五指
根据Python中的百分位数替换列值

我已经对一个数据框进行了分组并且我希望每组替换某些列中的值如果它们小于某个百分位因此组中大于 0 95 百分位数的所有值均应替换为 0 95 百分位数所有小于 0 05 百分位数的值均应替换为 0 05 百分位数数据框可能看起来
在 Python 中绘制 Excel 中的数据

我必须从 Excel 文件中读取和绘制数据的代码是这样的 import pandas as pd import matplotlib pyplot as plt excel file file1 xlsx file1 pd read exc
如何在 Python 2.4 CSV 阅读器中禁用引用？

我正在编写一个 Python 实用程序需要解析一个我无法控制的大型且定期更新的 CSV 文件该实用程序必须在仅提供 Python 2 4 的服务器上运行 CSV 文件根本不引用字段值但Python 2 4版本的csv库 http ww
读取不同文件夹深度的多个 csv 文件

我想递归地将给定文件夹中的所有 csv 文件读入 Spark SQLDataFrame如果可能的话使用单一路径我的文件夹结构如下所示我想包含具有一个路径的所有文件 resources first csv resources subfo
国际化和非 US-ASCII、Latin1 或 Win1252 的密码

当用户输入最能以 Unicode 或其他非拉丁字符编码表示的内容时您如何处理服务密码具体来说可以使用西里尔字母密码作为Oracle的密码吗如果密码以 UTF 8 形式提供您如何根据 Windows 身份验证机制验证用户的密码我对
按字符串子字符串的列过滤 Pandas 数据框

我正在尝试使用列中的字符串值是数据框外部字符串的子字符串的条件来过滤数据框下面的例子 df a b c hello bye hello reference str hello there output a c 一种方法可能是使用正则表达式
真实值与预测值的降维可视化

我有一个数据框如下所示 label predicted F1 F2 F3 F40 major minor 2 1 4 major major 1 0 10 minor patch 4 3 23 major patch 2 1 11 min
番石榴表到 CSV

我正在尝试将 Guava 表导出到 CSV 下面的代码有效但它跳过了我也想在输出中看到的第一列你能提出什么建议吗编辑显然使用values and keySet 单独工作 final RowSortedTable
在 python 2 或 python 3 中编写 csv 文件的便携式方法

在我的 Windows 机器上我通常在 python 2 中这样做来编写 csv 文件 import csv f open out csv wb cr csv writer f delimiter cr writerow a b c f
删除pandas中某个字符串之后的行

我想删除包含字符串 End of the 4th Quarter 的行之后的所有行目前这是第 474 行但它会根据游戏而变化 from bs4 import BeautifulSoup import requests import p
将 pandas 数据帧压缩到新的数据帧中

我有 2 个数据框 df A country codes 0 4 1 8 2 12 3 16 4 24 and df B continent codes 0 4 1 3 2 5 3 6 4 5 两个数据帧具有相同的长度但没有公共列我想将
在 Pandas 中按日期获取有效合约

我在检测 pandas DataFrame 中的活动合约方面遇到了一些困难假设每一行都是一个协商对于每一行我有两列 initial date 和 end date 我想知道的是按日期划分的活跃合约数量到目前为止我做了一个非常低效的方

随机推荐

错误：stdio.h：make期间没有这样的文件或目录错误

我正在尝试在 Ubuntu 中编译以下程序但我不断收到错误 stdio h 没有这样的文件或目录错误 include
在 pull --rebase 之后执行 git-hook

我想在完成后运行一个钩子git pull rebase为了检查某个文件是否被更改类似的东西this hook 我最初想到使用post rewrite钩子但是只有在重写提交时才有效并且在pull操作只是快进分支这很常见任何想法将不胜
Spring 类EnvironmentCapable

我收到字符串的运行时错误 ApplicationContext context new ClassPathXmlApplicationContext Beans xml java lang NoClassDefFoundError org
如何在 AngularJS 中使用 $http GET 获取一些数据？

我想向我的后端发出 Get 请求但我想在发送响应对象之前验证一些用户凭据这是我的代码 scope getEverything function http get http localhost 1234 things success fu
简单的嵌入式 Tomcat 10 示例

我正在尝试获得一个简单的嵌入式 tomcat10 1 0 M11示例工作但我不断得到localhost refused to connect当我去http localhost 8080 aa 这是我的代码 import jakarta se
mysqldump版本从MySQL导出数据时出错

我在导出数据时遇到错误mysql 5 5 29 winx 64 我在用mysql workbench gpl 5 2 45 win 32 错误信息是 WARNING Error checking mysqldump version Erro
Spark Dataframe：如何添加索引列：又名分布式数据索引

我从 csv 文件读取数据但没有索引我想将一列从 1 添加到行号我该怎么办谢谢 scala 通过 Scala 您可以使用 import org apache spark sql functions df withColumn id
如何使用 jQuery Mobile 显示全屏谷歌地图？

以下代码显示奇怪的输出我应该看到全屏移动地图但由于某种原因它仅显示在屏幕的一部分上我在用jquery ui map用于映射
在 C# 中将 Soap XML 解析为对象

我有以下 SOAP XML string soap
在 iPhone 之间传输数据的最佳选择

我想设置一个客户端服务器架构用于在多个 iPhone 之间传输数据例如服务器 iPhone 托管着一份动物主列表任意数量的客户端 iPhone 可以连接到服务器 iPhone 然后读取和编辑列表我尝试过的一些方法多点连接最多
当重载相等运算符==时，是否应该首先检查引用相等性？

当重载operator 时我目前这样做 bool operator const X lhs const X rhs return lhs rhs member comparisons 这意味着我首先检查对象的引用相等性然后检查所有成员的
CLR/Fastcall：大值类型如何在内部传递给被调用函数？

只是出于好奇值类型通常是复制的并且 JIT 编译器在调用方法时似乎使用 Microsoft 的 Fastcall 调用约定这会将前几个参数放入寄存器中以便快速访问但是大值类型即大于寄存器的大小或堆栈的宽度如何传递给被调用的函数
如何让 USB 控制器/游戏手柄与 python 一起工作

我有一个 USB 控制器我正在尝试从 Microsoft SideWinder 即插即用游戏手柄获取输入我在尝试弄清楚如何正确接收其输入时遇到困难不幸的是我无法使用 pygame 因为它需要一个窗口来接收输入但我必须生成一个 py
反向代理的 nginx url 重写

我在端口 80 上有一个 nginx 在端口 8080 上有一个 tomcat 配置为上游 tomcat中的war应用程序监听 pwm 我想将nginx配置为tomcat的反向代理并将url 重写为 pwm 例子用户在浏览器中输入 web
访问默认电子邮件地址

我在 3 0 中使用 MFMailComposeViewController 在我的应用程序中发送带有附件等的电子邮件我希望收件人地址默认为设备上的默认帐户地址如何访问此地址并将其放入 setToRecipients 的字符串中
dart 中构造函数后面的冒号

该代码来自 flutter gallery 我正在尝试理解和调整它我想知道这个语法的含义 class DemoItem
如何表达两个值不相等？

有没有类似的方法equals 表示不等于我想要完成的示例如下 if secondaryPassword equals initialPassword JOptionPane showMessageDialog null You ve s
zsh Git 信息中的星号

我用我的终端来运行类似的东西npm run start当我在 VSCode 中使用终端时git命令在我的笔记本电脑上这工作得很好但是在我的其他设备上设置 zsh 后有一些我从未注意到的事情在我的终端上 Desktop master
PHP中的内存映射文件，php://temp 和 php://memory 有什么区别

我需要一种在 PHP 中非常简单地在内存中存储文件的方法该文件正在构建然后立即发送到另一个 Web 服务我看到从 PHP 5 1 开始php temp and php memory流是可用的但两者之间似乎没有太大区别 php tem
Panda read_csv 中的编码错误[重复]

这个问题在这里已经有答案了我正在尝试将 CSV 文件读入 Pandas 中的 Dataframe 中当我尝试这样做时出现以下错误 UnicodeDecodeError utf 8 编解码器无法解码位置 55 中的字节 0x96 无效的

Panda read_csv 中的编码错误[重复]

Panda read_csv 中的编码错误[重复] 的相关文章

随机推荐

热门标签