类型错误：fit_transform() 需要 2 个位置参数，但给出了 3 个

2024-05-01

我有熊猫数据框df。我想对连续和分类特征进行编码df使用不同的编码器。我觉得用起来很舒服make_column_transformer，但是下面显示的代码失败了LabelEncoder()，但可以很好地与OneHotEncoder(handle_unknown='ignore'))。错误信息是：

类型错误：fit_transform() 需要 2 个位置参数，但 3 个是给定

我不清楚如何解决这个问题。

代码：

from sklearn.compose import make_column_transformer
from sklearn.preprocessing import RobustScaler, OneHotEncoder, LabelEncoder

continuous_features = ['COL1','COL2']       
categorical_features = ['COL3','COL4']

column_trans = make_column_transformer(
    (categorical_features,LabelEncoder()),
    (continuous_features, RobustScaler()))

X_enc = column_trans.fit_transform(df)

根据https://scikit-learn.org/stable/modules/ generated/sklearn.compose.make_column_transformer.html https://scikit-learn.org/stable/modules/generated/sklearn.compose.make_column_transformer.html.

make_column_transformer(
...     (StandardScaler(), ['numerical_column']),
...     (OneHotEncoder(), ['categorical_column']))

所以对于你的情况：

from sklearn.compose import make_column_transformer
from sklearn.preprocessing import RobustScaler, OneHotEncoder, LabelEncoder

continuous_features = ['COL1','COL2']       
categorical_features = ['COL3','COL4']

column_trans = make_column_transformer(
    (OneHotEncoder(), categorical_features),
    (RobustScaler(), continuous_features))

X_enc = column_trans.fit_transform(df)

如果你想使用LabelEncoder()，你只能通过一列，不能通过两列！

希望这可以帮助。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

scikitlearn

类型错误：fit_transform() 需要 2 个位置参数，但给出了 3 个的相关文章

使用 python 中的公式函数使从 Excel 中提取的值的百分比相等

import xlrd numpy excel Users Bob Desktop wb1 xlrd open workbook excel assignment3 xlsx sh1 wb1 sheet by index 0 colA co
补丁 - 为什么相对补丁目标名称不起作用？

我已经从模块导入了一个类但是当我尝试修补类名而不使用模块作为前缀时出现类型错误 TypeError Need a valid target to patch You supplied MyClass 例如以下代码给出了上述错误 imp
删除 Django 1.7 中的应用程序（和关联的数据库表）

是否可以使用 Django 1 7 迁移来完全删除卸载应用程序及其所有跟踪主要是其所有数据库表如果没有在 Django 1 7 中执行此操作的适当方法是什么 python manage py migrate
搜索多个字段

我想我没有正确理解 django haystack 我有一个包含多个字段的数据模型我希望搜索其中两个字段 class UserProfile models Model user models ForeignKey User unique
Keras：如何保存模型或权重？

如果这个问题看起来很简单我很抱歉但是阅读 Keras 保存和恢复帮助页面 https www tensorflow org beta tutorials keras save and restore models https www t
在 Windows 上使用 apache mod_wsgi 运行 Flask 应用程序时导入冲突

我允许您询问我在 Windows 上使用您的 mod wsgi portage 托管 Flask 应用程序时遇到的问题我有两个烧瓶应用程序由于导入冲突只有一个可以同时存在 IE 如果请求申请 1 我有回复然后如果我请求应用程序 2
使用 python 绘制正值小提琴图

我发现小提琴图信息丰富且有用我使用 python 库 seaborn 然而当应用于正值时它们几乎总是在低端显示负值我发现这确实具有误导性尤其是在处理现实数据集时在seaborn的官方文档中https seaborn pydata
Tensorflow 与 Keras 的兼容性

我正在使用 Python 3 6 和 Tensorflow 2 0 并且有一些 Keras 代码 import keras from keras models import Sequential from keras layers impo
使用Python计算目录的大小？

在我重新发明这个特殊的轮子之前有没有人有一个很好的例程来使用 Python 计算目录的大小如果例程能够很好地以 Mb Gb 等格式格式化大小那就太好了这会遍历所有子目录总结文件大小 import os def get size s
SMTP_SSL SSLError: [SSL: UNKNOWN_PROTOCOL] 未知协议 (_ssl.c:590)

此问题与 smtplib 的 SMTP SSL 连接有关当与 SMTP 无 ssl 连接时它正在工作在 SMTP SSL 中尝试相同的主机和端口时出现错误该错误仅基于主机 gmail 设置也工作正常请检查下面的示例如果 Out
Matplotlib 中 x 轴标签的频率和旋转

我在下面编写了一个简单的脚本来使用 matplotlib 生成图形我想将 x tick 频率从每月增加到每周并轮换标签我不知道从哪里开始 x 轴频率我的旋转线产生错误 TypeError set xticks got an unexp
使用 Keras np_utils.to_categorical 的问题

我正在尝试将整数的 one hot 向量数组制作为 keras 将能够使用的 one hot 向量数组来拟合我的模型这是代码的相关部分 Y train np hstack np asarray dataframe output vecto
Mac OSX 10.6 上的 Python mysqldb 不工作

我正在使用 Python 2 7 并尝试让 Django 项目在 MySQL 后端运行我已经下载了 mysqldb 并按照此处的指南进行操作 http cd34 com blog programming python mysql pyth
从 NumPy 数组到 Mat 的 C++ 转换 (OpenCV)

我正在围绕 ArUco 增强现实库基于 OpenCV 编写一个薄包装器我试图构建的界面非常简单 Python 将图像传递给 C 代码 C 代码检测标记并将其位置和其他信息作为字典元组返回给 Python 但是我不知道如何在 Pytho
当数据库不是 Django 模型时，是否可以使用数据库中的表？

是否可以从应用程序数据库中的表获取查询集该表不是应用程序中的模型如果我有一个不是名为 cartable 的模型的表从概念上讲我想这样做 myqueryset cartable objects all 有没有相对简单的方法来做到这一点
python 线程安全可变对象复制

Is 蟒蛇的copy http docs python org 2 library copy html模块线程安全吗如果不是我应该如何在 python 中以线程安全的方式复制 deepcopy 可变对象蟒蛇的GIL http en w
从 pandas DataFrame 中删除少于 K 个连续 NaN

我正在处理时间序列数据我在从数据帧列中删除小于或等于阈值的连续 NaN 时遇到问题我尝试查看一些链接例如标识连续 NaN 出现的位置以及计数 Pandas NaN 孔的游程长度 https stackoverflow com que
多个对象以某种方式相互干扰[原始版本]

我有一个神经网络 NN 当应用于单个数据集时它可以完美地工作但是如果我想在一组数据上运行神经网络然后创建一个新的神经网络实例以在不同的数据集甚至再次同一组数据上运行那么新实例将产生完全错误的预测例如对 XOR 模式进行训练
使用ssl和socket的python客户端身份验证

我有一个 python 服务器需要客户端使用证书进行身份验证我如何制作一个客户端脚本使用客户端证书由 python 中的服务器使用 ssl 和套接字模块进行身份验证有没有仅使用套接字和 ssl 而不扭曲的示例 from OpenSS
查找总和为给定数字的值组合的函数

这个帖子查找提供的 Sum 值的组合 https stackoverflow com a 20194023 1561176呈现函数subsets with sum 它在数组中查找总和等于给定值的值的组合但由于这个帖子已经有6年多了我发这

随机推荐

“publish_actions”扩展权限是否可用于测试？

我一直在尝试使用 publish actions 扩展权限来测试分数和成就但是当我添加它时它不会显示在权限请求页面中就好像它被忽略了一样我尝试了几种不同的方法 loginUrl facebook gt getLoginUrl a
如何正确设置 100% DIV 高度以匹配文档/窗口高度？

我有一个包装器位于中心位置并带有 y 重复的背景图像 div some content div wrapper width 900px margin 0 auto 0 auto background image url image jp
删除并加入同一个表

是否可以执行连接同一个表的删除查询语句我尝试过各种连接内部左侧但没有运气 mysql 返回错误我需要的例子 DELETE a FROM t1 AS a INNER JOIN t1 AS b USING some field b W
Docker容器总是显示ssl连接错误

我正在开始使用 docker compose 并一直在研究简单的演示 Flask 应用程序问题是我在一个组织内部运行这个程序该组织以左右抛出 SSL 错误的方式拦截所有通信他们为我们提供了需要安装的三个根证书我通常已经让这些证书在
Android NDK r5b外部构建和supc++链接问题

我正在尝试在 Ubuntu 10 10 上使用 r5b NDK 为 Android 平台交叉编译我们的 C 代码库使用 CMake 编译阶段成功但是在 so 的最终链接阶段有许多对 libsupc a 文件我指定链接到的文件中的符
是否可以通过服务类型的实例实例化 WebServiceHost，而无需无参数构造函数？

我正在尝试创建自托管System ServiceModel Web WebServiceHost NET 4 但是我遇到了构造函数的问题有以下三种选择 WebServiceHost 一个无参数的构造函数似乎毫无意义因为无法指定服务的类型
HashSet 中的并行流不并行运行

我有想要并行处理的元素集合当我使用List 并行性有效但是当我使用Set 它不并行运行我编写了一个代码示例来显示该问题 public static void main String args ParallelTest test ne
PHP foreach 和 glob() 函数

PHP 版本 5 2 我的功能不起作用服务器中的图像位于文件夹 public html gallery images 有什么帮助吗我做错了什么我得到的错误是警告第 2 行 home a9773555 public html ga
将命名参数传递给调用非 mutate 函数的函数

我正在尝试做一些非常类似的事情here https community rstudio com t passing named list to mutate and probably other dplyr verbs 2553 11 本质
处理 Kotlin 协程中自定义 okhttp 拦截器抛出的异常

我正在使用自定义Interceptor与我的 Android 应用程序中的 Retrofit 客户端一起在某些特定情况下会引发异常我正在尝试使用 Kotlin 协程使其工作问题是我无法处理前面提到的错误因为在拦截器实例中抛出异常的那
运行 py.test 时出现错误 ImportMismatchError

当我在本地运行测试时它工作正常但是在创建 docker 并在容器内运行后我收到以下错误 usr local lib python3 5 site packages pytest config py 325 in getconftest
如何加入数据框（来自数据集的集合）？

我正在寻找并找出最好的加入方式nSpark 数据帧 Example List df1 df2 df3 dfN 哪里都df有一个我可以参加的约会递归像这样 List df1 df2 df3 dfN reduce a b gt a join
Lua userdata：无法同时进行数组访问和方法

我遇到了这个人的问题 Lua userdata数组访问及方法 https stackoverflow com questions 26970316 lua userdata array access and methods 其中当我设置用
Oracle 求两个时间戳的平均值

我不明白这有多难但我似乎无法在任何地方找到解决方案它是针对日期完成的但我看不到让它适用于时间戳我正在尝试做 select avg last timestmp ref timestmp as average from param 它一
查找椭圆或贝塞尔曲线上的等距点

目前我正在编写 JavaScript 代码将对象放置在屏幕上的椭圆上我试图找到能够解决这个问题之一的算法椭圆将是完美的但如果它太昂贵贝塞尔曲线也可以抱歉但不幸的是我的数学不允许我使用我找到的答案 https mathoverf
ffmpeg通过添加框或边框来扩展（而不是调整大小）视频大小

假设我有一个特殊分辨率的视频例如 1280x718 我想将其更改为 1280x720 但我宁愿只在顶部和底部添加一行而不是将 718 像素垂直插值到 720 所以基本上我正在寻找一种方法告诉 ffmpeg 创建 1280x720 的输
二维高斯函数不能产生正确的结果

我想写一个返回一个的函数np array尺寸的nx x ny包含具有均值的中心高斯分布mu and sd sig 下面的代码在某些情况下有效但在许多情况下无效有什么问题或者我还应该写什么来获得我需要的东西 import matplotl
PHP 按值对数组进行分组

我有一个像这样的数组 Array 0 gt ing 1 ing 1 gt ing 1 amount 2 gt ing 1 det 3 gt ing 1 meas 4 gt ing 2 ing 5 gt ing 2 amount 6 gt i
如何在Linux中为特定程序设置进程ID

我想知道是否有某种方法可以在运行某些应用程序之前强制使用 Linux 的某些特定进程 ID 我需要提前知道进程ID 实际上有一种方法可以做到这一点自内核 3 3 设置了 CONFIG CHECKPOINT RESTORE 在大多数发行版
类型错误：fit_transform() 需要 2 个位置参数，但给出了 3 个

我有熊猫数据框df 我想对连续和分类特征进行编码df使用不同的编码器我觉得用起来很舒服make column transformer 但是下面显示的代码失败了LabelEncoder 但可以很好地与OneHotEncoder handle

类型错误：fit_transform() 需要 2 个位置参数，但给出了 3 个

类型错误：fit_transform() 需要 2 个位置参数，但给出了 3 个 的相关文章

随机推荐

热门标签

类型错误：fit_transform() 需要 2 个位置参数，但给出了 3 个的相关文章