将函数应用于 pandas Python 中的每一行时出现数据转换错误

2023-11-23

我在 python 的 pandas 中有一个数据框，类似于这样的东西 -

    contest_login_count  contest_participation_count  ipn_ratio
0                    1                            1   0.000000
1                    3                            3   0.083333
2                    3                            3   0.000000
3                    3                            3   0.066667
4                    5                           13   0.102804
5                    2                            3   0.407407
6                    1                            3   0.000000
7                    1                            2   0.000000
8                   53                           91   0.264151
9                    1                            2   0.000000

现在我想对该数据帧的每一行应用一个函数该函数写成这样 -

def findCluster(clusterModel,data):
    return clusterModel.predict(data)

我以这种方式将此函数应用于每一行 -

df_fil.apply(lambda x : findCluster(cluster_all,x.reshape(1,-1)),axis=1)

当我运行此代码时，我收到一条警告：

DataConversionWarning：具有输入 dtype 对象的数据已转换为 float64。

warnings.warn(msg, DataConversionWarning)

该警告每行打印一次。因为我的数据框中有大约 450K 行，所以我的计算机在 ipython 笔记本上打印所有这些警告消息时挂起。

但为了测试我的函数，我创建了一个虚拟数据框，并尝试对其应用相同的函数，效果很好。这是代码 -

t = pd.DataFrame([[10.35,100.93,0.15],[10.35,100.93,0.15]])
t.apply(lambda x:findCluster(cluster_all,x.reshape(1,-1)),axis=1)

其输出是 -

   0  1  2
0  4  4  4
1  4  4  4

谁能建议我做错了什么或者我可以改变什么来消除这个错误？

我认为有问题dtype某些列不是float.

你需要通过astype:

df['colname'] = df['colname'].astype(float)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

function

pandas

DataFrame

apply

将函数应用于 pandas Python 中的每一行时出现数据转换错误的相关文章

Pyqt-如何因另一个组合框数据而更改组合框数据？

我有一个表有 4 列这 4 列中的两列是关于功能的一个是特征另一个是子特征在每一列中所有单元格都有组合框我可以在这些单元格中打开txt 我想当我选择电影院作为功能时我只想看到子功能组合框中的电影名称而不是我的数据中的
Python中列表中两个连续元素的平均值

我有一个偶数个浮点数的列表 2 34 3 45 4 56 1 23 2 34 7 89 我的任务是计算 1 和 2 个元素 3 和 4 5 和 6 等元素的平均值在 Python 中执行此操作的快捷方法是什么 data 2 34 3 45
根据 Pandas 中的列表对多列进行排序

感谢有关如何根据 pandas 中的倍数列表对给定多列进行排序的任何提示如下所示 import pandas as pd sort a a d e sort b s1 s3 s6 sort c t1 t2 t3 df pd DataFra
编辑 Jupyter Notebook 时 VS Code 中缺少“在选择中查找”

使用 Jupyter Notebook 时 VSCode 中缺少在选择中查找按钮它会减慢开发速度所以我想请问有人知道如何激活它吗第一张图显示了在 python 文件中的搜索替换第二张图显示了笔记本电脑中缺少的按钮 Python
如何使用正则表达式在 pandas 数据框中选择一行以及包含特定子字符串的行后面的固定行数

Problem 我有一个 pandas 数据框我试图从中提取特定行我感兴趣的行是包含日期的行以及紧随日期行之后的行重要的是我想将信息从日期后面的行移动到包含日期的行中的新列通过这样做我将在同一行上获得一个人的信息需要明确
ValueError：不支持连续[重复]

这个问题在这里已经有答案了我正在使用 GridSearchCV 进行线性回归的交叉验证不是分类器也不是逻辑回归我还使用 StandardScaler 对 X 进行标准化我的数据框有 17 个特征 X 和 5 个目标 y 观察约11
如何使用 javascript/jquery/AJAX 调用 Django REST API？

我想使用 Javascript jQuery AJAX 在前端调用 Django Rest API 请求方法是 POST 但当我看到 API 调用它的调用 OPTIONS 方法时所以我开始了解access control allow o
在相同任务上，Keras 比 TensorFlow 慢

我正在使用 Python 运行斩首 DCNN 本例中为 Inception V3 来获取图像特征我使用的是 Anaconda Py3 6 和 Windows7 使用 TensorFlow 时我将会话保存在变量中感谢 jdehesa 并
对使用 importlib.util 导入的对象进行酸洗

我在使用Python的pickle时遇到了一个问题我需要通过将文件路径提供给 importlib util 来加载一些 Python 模块如下所示 import importlib util spec importlib util sp
如何从 JSON 响应重定向？

所以我尝试使用 Flask 和 Javascript 上传器 Dropzone 上传文件并在上传完成后重定向文件上传正常但在烧瓶中使用传统的重定向 return redirect http somesite com 不执行任何操作页面
迭代列表的奇怪速度差异

我创建了两个重复两个不同值的长列表在第一个列表中值交替出现在第二个列表中一个值出现在另一个值之前 a1 object object 10 6 a2 a1 2 a1 1 2 然后我迭代它们不对它们执行任何操作 for in a1 p
JavaScript 测验在提出所有问题之前结束

我现在正在学习 JavaScript 并且正在创建一个测验我的测验运行正常控制台中没有任何错误但它会跳过问题有时会在回答所有问题之前结束测验即使给出正确答案也会减少时间我不太确定为什么它会这样做因为在我看来它的编码是正确的
在 Windows 上使用带有对数刻度的 matplotlib 时出现 Unicode 错误

我正在使用 python 2 6 和 matplotlib 如果我运行 matplotlib 库页面中提供的示例 histogram demo py 它工作正常我已经大大简化了这个脚本 import numpy as np import
字符串列表，获取n个元素的公共子串，Python

我的问题可能类似于this https stackoverflow com questions 37514193 count the number of occurrences of n length not given string in
OSX 上的 locale.getlocale() 问题

我需要获取系统区域设置来执行许多操作最终我想使用 gettext 翻译我的应用程序我打算在 Linux 和 OSX 上分发它但我在 OSX Snow Leopard 上遇到了问题 python Python 2 5 2 r252 60
导入错误：无法导入名称“时间戳”

我使用以下代码在 python 3 6 3 中成功安装了 ggplot conda install c conda forge ggplot 但是当我使用下面的代码将其导入笔记本时出现错误 from ggplot import Impor
Python问题：打开和关闭文件返回语法错误

大家好我发现了这个有用的 python 脚本它允许我从网站获取一些天气数据我将创建一个文件和其中的数据集有些东西不起作用它返回此错误 File
如何绘制堆积比例图？

我有一个数据框 x lt data frame id letters 1 3 val0 1 3 val1 4 6 val2 7 9 id val0 val1 val2 1 a 1 4 7 2 b 2 5 8 3 c 3 6 9 我想绘制一个
bs4 `next_sibling` VS `find_next_sibling`

我在使用时遇到困难next sibling 并且类似地与next element 如果用作属性我不会得到任何返回但如果用作find next sibling or find next 然后就可以了来自doc https www cru
tkinter：打开一个带有按钮提示的新窗口[关闭]

Closed 这个问题需要调试细节 help minimal reproducible example 目前不接受答案用户如何按下 tkinter GUI 中的按钮来打开新窗口我只需要非常简单的解决方案如果代码也能被解释那就太好了这

随机推荐

在 Xcode 5 上使用 Boost - Apple LLVM 5.0

由于只有一个编译器 LLVM 5 0 我在构建 Xcode 5 的 Boost 时遇到了问题我尝试过使用 c 11 使用 clang 来使用 Homebrew 我尝试过各种想法和脚本但到目前为止没有一个有效要为使用 clang llv
在 Django Rest Framework 选项请求中显示过滤器和排序

我正在使用 Django Rest Framework 我注意到 API 的 Web 可浏览部分有一个名为选项的按钮单击它会显示以下内容 HTTP 200 OK Vary Accept Content Type text html A
ASP.NET MVC 4 缩小和背景图像

我目前正在使用 ASP NET MVC 4 CSS JavaScript 优化器它与我自己的 CSS JavaScript 配合得很好但我也想将它与插件一起使用每个插件都有自己的文件夹 Content css my own css o
上个月的最后一天 - BigQuery

我正在尝试选择其中时间戳字段 recdate 的日期值高达并包含该月最后完成日期的行例如由于现在是 2016 年 7 月我希望所有行的日期值在 2016 年 6 月 31 日含之前这曾经在 T SQL 中工作得很好我会使用以下
无法连接到 mySQL 数据库

所以我在使用 Java 连接 MySQL 时遇到问题这是我的代码 import java sql Connection import java sql DriverManager import java sql SQLException
JQuery 延迟立即拒绝

使用JQuery Deferred时可以直接调用reject 吗没有调用异步函数也许我想在异步函数的开头进行某种测试如果测试失败我想立即拒绝请参阅下面的第一个 if 块 function doSomethingAsync Test
用于选择的 Angular 2 RouterLink

我想使用页面上的选择元素创建导航在锚标记上使用 RouterLink 指令很简单但是选择下拉菜单是否有等效的指令或者我是否需要在我的组件上创建自己的导航方法以便在我的选择发生更改时调用 a Location a
计时器刻度不增加时间间隔的值

我想增加计时器滴答事件的值但它没有增加不知道我忘记了什么它只显示1
异步任务“堵塞”

最近我开始尝试大规模抓取网站以进行存档我认为让多个 Web 请求异步工作以加快速度是一个好主意 10 000 000 个页面绝对需要存档因此我冒险进入并行性的严厉女主人三分钟后我开始想知道为什么我正在创建的任务通过Task Fac
在不使用 EF 的情况下在 appsettings.json 中获取多个连接字符串

刚刚通过迁移我开发的当前 MVC Net 应用程序开始使用 Net Core RC2 在我看来由于 appsettings json 处理配置的方式如果我有多个连接字符串我要么必须使用 EF 来检索连接字符串要么必须创建为每个连接字
为什么 Promise 的“then()”处理程序会立即执行？

我想更彻底地了解 Promise 在 JavaScript 中的工作原理我尝试了以下代码 function delay timeout return new Promise function resolve reject setTimeo
如何在Flutter gridview中从右向左填充数据

我试图从右到左填充网格视图数据因为应用程序是阿拉伯语并且一切都是 RTL Here is what I want 我正在使用 Stream 生成器来填充数据和以下 Gridview 小部件 Widget productGrid List
MySQL - 将两列拆分为两个不同的行

如果这是一个愚蠢的问题我不知道要创建这个抱歉我有一个表两个团队和总观察稍后我将在不同的地方使用此信息所以我的想法是将这两列连接在一列中但两个不同的行 HomeTeam AwayTeam Totalwatch A B 100 A
反序列化包含字典的对象列表

我见过很多例子似乎表明我所做的事情应该有效但无论出于何种原因它都不起作用我正在尝试反序列化对象的集合其中一个属性是字典如下所示 class Program static void Main string args var jso
min - 子项设置为位置的高度：绝对

我有一个容器 div 其中一个子 div 设置为相对于其父级的绝对位置容器 div 有其最小高度设置但是当子 div 的高度超出父级的高度时父级不会拉伸这是由于孩子的绝对定位所致有什么想法可以让父母随着孩子身高的增加而伸展身体吗
使用命令行工具将 JSON 数组拆分为多个文件

假设我们有一个长度为 5 的 JSON 数组我们想使用 Linux 命令行工具将该数组拆分为多个长度为 2 的数组并将分组的项保存到不同的文件中我尝试使用jq and split工具我对任何可以从 bash 脚本执行的方法都很满意
仅从 Twitter API 请求地理标记状态

我如何要求 twitter API 只提供地理标记状态我目前正在过滤但更加友好会更有意义似乎你应该能够用流 API 和位置过滤器只需将边界框设置为覆盖整个地球即可正如跟踪参数一样查询受跟踪限制如跟踪限制中所述和访问角色
如何使用 BigQuery 补丁？

BigQuery API 文档中有一个名为 patch 的方法我希望我可以使用它来更改现有表的架构不幸的是 bq 不支持它但根据他们的网站你可以尝试一下https developers google com bigquery doc
在活动之间从列表视图传递数据到另一个活动

我正在尝试将数据从这个主要活动传递到另一个活动我成功地在活动之间发送数据就像从编辑文本到下一个活动的数据一样putExtra and GetExtra方法并作为意图传递但我在这项特定任务中面临挑战将数据从列表视图发送到普通活动数据
将函数应用于 pandas Python 中的每一行时出现数据转换错误

我在 python 的 pandas 中有一个数据框类似于这样的东西 contest login count contest participation count ipn ratio 0 1 1 0 000000 1 3 3 0 083

将函数应用于 pandas Python 中的每一行时出现数据转换错误

将函数应用于 pandas Python 中的每一行时出现数据转换错误 的相关文章

随机推荐

热门标签

将函数应用于 pandas Python 中的每一行时出现数据转换错误的相关文章