Pandas TypeError：无法转换为数字

2024-01-24

我正在开发一个项目，将数据从 SQL 导入到 pandas DataFrame 中。这似乎进行得很顺利，但是当我采取pandas.mean()它抛出一个 TypeError ，指出串联的值列表无法转换为数字（见下文）：

示例数据框：

  ProductSKU OverallHeight
0   AAI2185           74.5
1   AAI2275             47
2   AAI2686           56.5
3  AASA1002          73.23

函数调用：

avgValue = df["OverallHeight"].dropna().mean()             <--- Breaks here

控制台输出：

    Traceback (most recent call last):

  File "C:\Program Files\Anaconda\lib\site-packages\pandas\core\generic.py", line 5310, in stat_func
    numeric_only=numeric_only)

  ... 

  File "C:\Program Files\Anaconda\lib\site-packages\pandas\core\nanops.py", line 293, in nanmean
    the_sum = _ensure_numeric(values.sum(axis, dtype=dtype_sum))

  File "C:\Program Files\Anaconda\lib\site-packages\pandas\core\nanops.py", line 743, in _ensure_numeric
    raise TypeError('Could not convert %s to numeric' % str(x))

TypeError: Could not convert 74.54756.573.23 to numeric

最奇怪的是，当我通过 CSV 导入相同的数据时，它工作得非常好。只有当我通过 SQL 加载它时它才会中断，是否有什么地方我做错了？

如果您在 groupby 操作后遇到类似的 TypeError （例如TypeError: Could not convert ace to numeric），那么你的 pandas 可能>=2.0。

groupby.mean() has numeric_only=过去默认值为 True 的参数，但从 pandas 2.0 开始，其默认值为 False。这意味着当统计方法（例如）时，字符串列不会被删除mean or std在 groupby 对象上调用（就像过去所做的那样）。要解决该问题，请通过numeric_only=True.

显示问题和解决方案的示例。

import pandas as pd
df = pd.DataFrame({
    "Grouper": ["A", "B", "A", "B", "A"],
    "Name": ["a", "b", "c", "d", "e"],
    "Value": [0.95, 0.25, 0.25, 0.10, 1.00]
})

grouped = df.groupby("Grouper").mean()                    # <---- TypeError: Could not convert ace to numeric

grouped = df.groupby("Grouper").mean(numeric_only=True)   # <---- OK

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Pandas TypeError：无法转换为数字的相关文章

Python daysBetweenDate

我想我可能有一个无限循环因为每当我运行代码时我都会收到一条错误消息它说程序因使用 13 CPU 秒而关闭整个代码应该以日期作为输入并输出第二天此代码假设所有月份都是 30 天除了daysBetweenDates功能正常其他
在自定义 Dask 图中包含关键字参数 (kwargs)

我正在使用 Dask 为一项操作构建自定义图表熟悉如何将参数传递给 Dask 图中的函数并阅读了docs http dask pydata org en latest custom graphs html 然而似乎还是缺少了一些东西 D
Boost Python：多态容器？

我有一个方法或函数它返回对多态对象列表的引用 class A class B public A std list
python-click：添加修改其他参数行为的选项

这个问题是关于click http click pocoo org 5 包裹 Click 是一个用于创建漂亮命令行的 Python 包使用尽可能少的代码以可组合的方式进行接口它是命令行界面创建工具包它具有高度可配置性但带有开箱即用
Python OO程序结构规划

我是 OOP 的初学者我想创建一个包含三个类 A B 和 C 的程序该类的每个实例都由一组特征 Achar1 Achar2 等定义该程序应该创建uses由 A 元素 B 元素和 C 元素以及开始日期和结束日期组成 A 和 B 都有子类
按共同日期对数组数据进行排序

我有一个包含许多行和 3 列的 csv 文件日期代表和销售额我想使用 Python 生成一个新数组该数组按日期对数据进行分组并且对于给定日期按销售额对代表进行排序例如我的输入数据如下所示 salesData 201703 B
如何从包含许多表的 Excel 工作表中解析数据帧（使用 Python，可能使用 Pandas）

我正在处理布局糟糕的 Excel 工作表我正在尝试解析这些工作表并将其写入数据库每个工作表可以有多个表尽管这些可能的表格的标题是已知的但哪些表格将位于任何给定的工作表上它们在工作表上的确切位置也不是已知的表格不以一致的方式对齐
如何使用 Anaconda Python 执行 .py 文件？

我刚刚在我的 Windows 计算机上下载并安装了 Anaconda 但是我在使用命令提示符执行 py 文件时遇到问题如何让我的计算机了解 python exe 应用程序位于 Anaconda 文件夹中以便它可以执行我的 py 文件
如何在Python中将字符串转换为包含一个元素的列表[重复]

这个问题在这里已经有答案了我有一个字符串我想将其转换为其中只有一个元素的列表 a abc print list a output a b c Expected o p abc 正确的做法是什么只需使用 a abc b a print
在Python中寻找坐标系中某些点之间的最短路径

我编写了一个代码可以在坐标系中的特定宽度和长度范围内生成所需数量的点它计算并列出我使用欧几里德方法生成的这些点的距离矩阵我的代码在这里 import pandas as pd from scipy spatial import dis
在此异步设置中，我在哪里捕获 KeyboardInterrupt 异常

我正在开发一个使用ccxt异步库它要求通过显式调用该类的资源来释放某个类使用的所有资源 close 协程我想退出程序ctrl c并等待异常中的关闭协程然而它永远不会被等待该应用程序由模块组成harvesters strategie
使用不同的 CMD 名称同时运行多个 python 脚本

我尝试通过 multiprocessing Process 在 test py 中同时调用 a py 和 b py 它起作用了但过程CMDa py b py 和 test py 的名称相同均为 usr bin python tmp te
使 ArrayField 的 base_field 对于 Django 中的表来说是唯一的

Goal 下面应该提出一个ValidationError gt gt gt m1 MyModel names name1 gt gt gt m2 MyModel names name1 name2 gt gt gt m1 save gt g
识别左侧由 delta 链接的簇，右侧由不同 delta 链接的簇

考虑排序后的数组a a np array 0 2 3 4 5 10 11 11 14 19 20 20 如果我指定了左增量和右增量 delta left delta right 1 1 这就是我期望的集群分配方式 a 0 2 3 4 5 1
Python记录多个模块记录器在主程序之外不起作用

我的目标是从多个模块进行日志记录同时仅在一个位置主程序中配置记录器如图所示这个答案 https stackoverflow com questions 15727420 using python logging in multipl
在 django 视图中执行阻塞请求

在我的 django 应用程序的一个视图中我需要执行相对较长的网络 IO 操作问题是其他请求必须等待该请求完成即使它们与该请求无关我做了一些研究并偶然发现了 Celery 但据我了解它用于执行独立于请求的后台任务所以我不能使用任
在python中读取证书（.crt）和密钥（.key）文件

因此我使用 JIRA Python 模块连接到我公司的 JIRA 实例它要求我为此传递证书和密钥但是使用 OpenSSL 模块我无法读取本地证书和密钥来将其传递给请求阅读代码如下 import OpenSSL crypto c
xts 函数不将我的 POSIXct 日期视为适当的基于时间的对象

我创建了一个包含两列的数据框 gt head data frame Date Rainfall 1 1992 01 06 14 00 00 0 3 2 1992 01 06 15 00 00 0 2 3 1992 01 06 16 00 0
选择 matplotlib xticks 频率

我正在用字符串作为 x 标签绘制数据我想控制标签频率以免文本使轴过载在下面的示例中我只想每 3 个刻度看到一个标签 a d g j 我可以做到这一点的一种方法是每 n 个元素用 2 个空字符串替换 my xticks 元素但我确信
Python FFmpeg查询rtsp太慢

目前我正在尝试使用 python 和 FFmpeg 来查询原始格式为 h264 的 rtsp 数据直播流视频的信息为 fps 29 分辨率 1280 720 我希望我可以以相同的格式 h264 查询数据并将其放入python队列中以便将

随机推荐

使用 Paramiko 进行递归目录下载？

我想通过 SSH 递归下载一个包含未知内容的目录并一直在尝试 Paramiko 我看过几个如何上传目录的示例但没有一个示例涵盖递归下载我可以列出目录中的所有项目但无法找到一种方法来了解该项目是文件要下载还是目录要递归调用 tr
如何在 Mac OS X 10.5 中处理 Finder 中的多个文件拖放操作？

我需要获取从 Finder 拖放到我的应用程序中的所有文件的 URL 我有一个在 10 6 上运行的 Cocoa 应用程序它通过使用新的 10 6 NSPasteboard API 来处理粘贴板上的多个项目我正在尝试将此应用程序向后移
Windows Phone 7、登录屏幕重定向和 .exit 案例？

我知道这个问题已经被讨论得令人作呕但我想介绍一下我的情况我的应用程序中的起始页是login xaml 用户登录用户名和密码通过我的WCF服务进行身份验证用户名保存在独立存储中然后用户被重定向到mainpage xaml 当用户启动
NSTableColumn 大小适合内容

我正在 Mac OS X 10 6 Snow Leopard 中进行开发当我在 NSTableView 的两个列标题之间双击时左侧的列会自动调整大小就像您所期望的那样我也想在上下文菜单中提供此功能但似乎没有可公开访问的功能来执行此
将具有 is-inactive 类的元素的光标设置为默认值

客观的一旦选择了每个类别的最大球员人数两名守门员六名后卫十二名前锋剩余的球员picked与班级is inactive应设置为cursor default 问题的澄清所有球员都有班级is inactive作为默认值我想做的是尝试
从浏览器地址栏执行 Javascript 方法 - GWT

我试图通过在浏览器 URL 地址栏上执行以下命令来在我的 Web 应用程序上执行 Javascript javascript window alert test void 0 但是什么也没有发生警报框也没有出现原因可能是应用程序在 D
在 Firestore (NodeJS) 上的文档中设置文档引用

我正在尝试使用 NodeJS v8 6 0 创建一个包含 Firestore 参考的文档像这样 const admin require firebase admin admin initializeApp credential MY CR
2D 和 3D 数组的动态分配/释放

我知道动态分配取消分配 2D 数组的算法但是我不太确定 3D 数组的算法利用这些知识和一点对称性我想出了以下代码在编码过程中我很难以 3D 形式进行可视化请评论正确性并建议任何更好的替代方案效率或直观如果有另外我认为这些
iOS的睡眠功能是什么

我正在寻找一个函数可以让 iOS 上的 C 代码甚至 Objective C 代码的线程进入休眠状态我的编译器无法识别 sleep 0 Thanks 阻止 0 5 秒 NSThread sleepForTimeInterval 5
从 R 中的大型 .CSV 导入和提取随机样本

我正在 R 中进行一些分析需要处理一些大型数据集 10 20GB 存储在 csv 中并使用 read csv 函数由于我还需要将大型 csv 文件与其他数据帧合并和转换因此我没有计算能力或内存来导入整个文件我想知道是否有人知道导入
使用 C# 驱动程序将 UDT 元素添加到 Cassandra 中的列表集合的正确方法是什么？

我有一个 UDT 列表例如 create table MyTable stuff list
将嵌入的 Pod 打印为带 termcap 转义的格式化文本

我正在尝试将嵌入式 Pod 作为 ANSI 文本输出到终端在 Perl 5 中我可以使用Pod Text Termcap https metacpan org pod Pod Text Termcap use strict use war
如何中止来自 Observable 的 Ajax 请求？

我的代码包含这个简单的函数我用它来将文件上传到我的 PHP 服务器有一个xhr请求嵌套在RxJS Observable fileUpload file File Observable
VB.NET 中从另一个线程挂起一个线程

我有一个从线程我们称之为 MainThread 运行的窗口以及一个执行其他非图形任务的后台线程有时后台线程会调用MessageBox Show 方法即modal并停止后台线程在此调用之前我想挂起 MainThread 并在之后恢
Html 选取框标签

html marquee 标签是否已弃用如果是现代浏览器上有哪些替代方案我想在我的 joomla 页面上创建一个简单的字幕效果 html marquee 标签是否已弃用不它首先必须成为语言的一部分才能被弃用它只是专有的如果是
生成 macOS 框架时如何保留公共标头的目录布局

我有一个 C 库的 CMake 项目当前版本为 CMake v3 21 我正在将其移植到 macOS 并且我正在考虑将该库生成为操作系统框架 https developer apple com library archive docume
如何使用 Automapper 映射复杂对象？

我有几门课 public class Customer public string FirstName get set public string LastName get set public Product Product get se
如何沿着时间线创建事件的可视化？

我正在用 Python 构建可视化我想在那里可视化加油站和我的汽车的燃油成本此外洗车及其成本以及维修都应该可视化根据成本的不同燃料成本和洗衣成本应该有更高的标准我创建了下面的可视化来描述这些概念如何使用 matplotlib
在 virtualenv 中找不到 Python 模块

我无法让模块在我的虚拟环境中运行以熊猫为例随着虚拟环境的开启我运行yolk l并返回缩短版 basicpython xxxx LinuxBox pythonprojects basicpython yolk l Python 2 7
Pandas TypeError：无法转换为数字

我正在开发一个项目将数据从 SQL 导入到 pandas DataFrame 中这似乎进行得很顺利但是当我采取pandas mean 它抛出一个 TypeError 指出串联的值列表无法转换为数字见下文示例数据框 ProductS

Pandas TypeError：无法转换为数字

Pandas TypeError：无法转换为数字 的相关文章

随机推荐

热门标签

Pandas TypeError：无法转换为数字的相关文章