使用 OrdinalEncoder 转换分类值

2024-03-12

我有一个数据集，其中包含以下列：

No  Name  Sex  Blood  Grade  Height  Study
1   Tom   M    O      56     160     Math
2   Harry M    A      76     192     Math
3   John  M    A      45     178     English
4   Nancy F    B      78     157     Biology
5   Mike  M    O      79     167     Math
6   Kate  F    AB     66     156     English
7   Mary  F    O      99     166     Science

我想把它改成这样：

No  Name  Sex  Blood  Grade  Height  Study
1   Tom   0    0      56     160     0
2   Harry 0    1      76     192     0
3   John  0    1      45     178     1
4   Nancy 1    2      78     157     2
5   Mike  0    0      79     167     0
6   Kate  1    3      66     156     1
7   Mary  0    0      99     166     3

我知道有一个图书馆可以做到这一点

from sklearn.preprocessing import OrdinalEncoder

我已经尝试过但没有成功

enc = OrdinalEncoder()
enc.fit(df[["Sex","Blood", "Study"]])

谁能帮我找出我做错了什么以及如何做？

你就快到了！

基本上是fit方法，准备编码器（适合您的数据，即准备映射）但不转换数据。

你必须打电话transform转换数据，或使用fit_transform拟合并转换相同的数据。

enc = OrdinalEncoder()
enc.fit(df[["Sex","Blood", "Study"]])
df[["Sex","Blood", "Study"]] = enc.transform(df[["Sex","Blood", "Study"]])

或直接

enc = OrdinalEncoder()
df[["Sex","Blood", "Study"]] = enc.fit_transform(df[["Sex","Blood", "Study"]])

注意：这些值不会是您提供的值，因为 fit 方法在内部使用numpy.unique它给出的结果按字母顺序排序，而不是按出现顺序排序。

正如你可以看到的enc.categories_

[array(['F', 'M'], dtype=object),
 array(['A', 'AB', 'B', 'O'], dtype=object),
 array(['Biology', 'English', 'Math', 'Science'], dtype=object)]```

数组中的每个值都按其位置进行编码。（F 将编码为 0 ，M 编码为 1）

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

scikitlearn

使用 OrdinalEncoder 转换分类值的相关文章

使用 pandas.date_range() 生成多个日期时间，每周两个日期

我在用着pd date range start date end date freq W MON 每周一生成每周频率日期时间start date 2017 01 01 and end date 2017 12 31 这意味着每月大约生成 4
将 yerr/xerr 绘制为阴影区域而不是误差线

在 matplotlib 中如何将误差绘制为阴影区域而不是误差条例如而不是忽略示例图中各点之间的平滑插值这需要进行一些手动插值或者只是获得更高分辨率的数据您可以使用pyplot fill between https matpl
如何删除 PyCharm 中的项目？

如果我关闭一个项目然后删除该项目文件夹则在 PyCharm 重新启动后会再次创建一个空的项目文件夹只需按顺序执行以下步骤即可他们假设您当前在 PyCharm 窗口中打开了该项目单击文件 gt 关闭项目关闭项目在 PyCha
McNemar 在 Python 中的测试以及分类机器学习模型的比较 [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案有没有用 Python 实现的好的 McNemar 测试我在 Scipy stats 或 Scikit
如何在python中附加两个字节？

说你有b x04 and b x00 你如何将它们组合起来b x0400 使用Python 3 gt gt gt a b x04 gt gt gt b b x00 gt gt gt a b b x04 x00
Python re无限执行

我正在尝试执行这段代码 import re pattern r w w s re compiled re compile pattern results re compiled search COPRO HORIZON 2000 HOR p
数据框 - 平均列

我在 pandas 中有以下数据框 Column 1 Column 2 Column3 Column 4 2 2 2 4 1 2 2 3 我正在创建一个数据框其中包含第 1 列和第 2 列第 3 列和第 4 列等的平均值 ColumnA
从 pyspark.sql 中的列表创建数据框

我完全陷入了有线的境地现在我有一个清单li li example data map lambda x get labeled prediction w x collect print li type li 输出就像 0 0 59 0 0
为什么第二个 request.session cookies 返回空？

我想使用 requests Session post 登录网站但是当我已经登录主页然后进入帐户页面时看来cookies还没有保存因为cookies是空的而且我无法进入正确的帐户页面 import requests from bs4
以类型化内存视图作为成员的结构定义

目前我正在尝试让一个具有类型化内存视图的结构能够工作例如 ctypedef struct node unsigned int inds 如果 inds 不是内存视图据我所知它可以完美地工作然而通过内存视图并使用类似的东西 def
numpy：高效执行数组的复杂重塑

我正在将供应商提供的大型二进制数组读入 2D numpy 数组 tempfid M N load data data numpy fromfile file dirname fid dtype numpy dtype i4 convert
将 pandas 剪切操作转换为常规字符串

我明白了 pandas cut 操作的输出 0 0 20 1 0 20 2 0 20 3 0 20 4 0 20 5 0 20 6 0 20 7 0 20 8 0 20 9 0 20 如何将 0 20 转换为 0 20 我正在这样做 str
如何使用 Homebrew 在 Mac 上安装 Python 2 和 3？

我需要能够在 Python 2 和 3 之间来回切换我如何使用 Homebrew 来做到这一点因为我不想弄乱路径并陷入麻烦现在我已经通过 Homebrew 安装了 2 7 我会用pyenv https github com yyuu
仅当某些值相等时，如何才能将一个文本文件中的值替换为另一个文本文件中的其他值？

我有一个名为finalscores txt我想创建一个 python 脚本它将打开它并从两个单独的列中读取值这是我的finalscores txt file Atom nVa predppm avgppm stdev delta QPr
App Engine 实体到字典

将 google app engine 实体在 python 中复制到字典对象的好方法是什么我正在使用 db Expando 对象所有属性均为扩展属性 Thanks 有一个名为foo尝试 foo dict
使用 suds SOAP 库进行 HTTP 身份验证的奇怪行为

我有一个正在运行的 python 程序它使用 suds 通过 SOAP 获取大量数据 Web服务是通过分页功能实现的这样我就可以抓取nnn每个 fetch 调用的行并获取下一个nnn与后续的电话如果我使用如下代码向 HTTP 服务器进
寻找完美的正方形

我有这个Python代码 def sqrt x ans 0 if x gt 0 while ans ans lt x ans ans 1 if ans ans x print x is not a perfect square return
非法指令：MacOS High Sierra 上有 4 条指令

我正在尝试在 pygame 3 6 中制作一个看起来像聊天的窗口我刚刚将我的 MacBook 更新到版本 10 13 6 在我这样做之前它工作得很好但在我收到消息之后非法指令 4 Code import pygame from pyg
django jet 中的自定义徽标

我目前正在尝试对 django 管理面板的皮肤进行一些定制以使其更符合我们的品牌目前我们使用 django jet 来美化管理面板 django jet 可以自定义 css html 吗所有评论都说我应该更改一些 html 文件但我
如何在 scikit 中加载 CSV 数据并将其用于朴素贝叶斯分类

尝试加载自定义数据以在 Scikit 中执行 NB 分类需要帮助将示例数据加载到 Scikit 中然后执行 NB 如何加载目标的分类值使用相同的数据进行训练和测试或使用完整的数据集进行测试 Sl No Member ID Membe

随机推荐

调用 oncontextmenu 时 Firefox 浏览器的事件未定义

我在右键单击页面中的按钮时显示上下文菜单用于显示上下文菜单的代码是 window addEventListener contextmenu function e e preventDefault false 当我右键单击按钮时调用的上下
解决 git merge octopus 上的冲突

章鱼合并是指合并2个以上的头用户应该如何使用普通的三向合并工具比较文件 3 个文件被传递到合并工具 BASE LOCAL REMOTE 3 个头需要多少个以及什么组合在这种情况下您不应该使用章鱼合并八达通合并仅应在不存在合并冲突或冲
setInterval 使用 Electron 一小时后停止

希望有人能在这里指出我正确的方向我的电子应用程序需要每 10 分钟左右执行一次 API 调用目前我在渲染器进程中使用 setInterval 循环来执行此操作该循环每 10 分钟触发一次它通常工作得很好几个小时后似乎就停止了我
Android Studio 在创建新活动时“发生 IDE 错误”

更新见底部由于 Android Studio 将自身更新到 v3 0 我无法创建新的 Activity 我收到此错误报告对话框显示 2 个错误我尝试了不同的项目尝试清理项目重新同步 gradle 重新启动计算机卸载重新安装 A
strdup()：对警告感到困惑（“隐式声明”、“使指针...无需强制转换”、内存泄漏）

当我编译下面的一小段代码其中我们定义一个字符串然后使用 strdup 来制作副本时我收到 3 个警告来自 GCC 的 2 个编译器警告和来自 valgrind 的 1 个运行时警告错误我怀疑内存泄漏错误由 valgrind
x86-SSE 中四个压缩单精度浮点到无符号双字的转换

有没有办法将四个打包单精度浮点值转换为具有 SSE 扩展的 x86 中的四个双字最接近的指令是CVTPS2PI 但它不能在两个 xmm 寄存器上执行而是应该给出为CVTPS2PI MM XMM M64 如果我想要类似的东西怎么办
R metaMDS 排序距离

我一直在对不同采样点的丰富物种数据集进行一些排序我在用metaMDS 素食主义者可以做到这一点通过此功能您可以直接输入群落数据行中的站点和列中的物种并指定您希望使用的距离类型即 jaccard brays curtis euc
Linux 上的 OpenCL，集成英特尔图形芯片

我想用OpenCL在 Debian 8 上我读到在本页 http streamcomputing eu blog 2011 12 29 opencl hardware support Linux 上不支持 Intel 的 GPU 这篇文章
XCode 4.5 警告父/子类的类别之间的方法名称冲突

我正在开发一个最初使用 XCode 4 0 构建的项目然后迁移到使用 XCode 4 2 现在我已经测试了迁移到 XCode 4 5 并且收到了大量如下警告 instance method values in category from
如何将模型数据对象数组转换为dataProvider

假设我有模型User与其自身有多对多的关系命名为friends so user gt friends or model gt friends在视图中给了我一个数组User对象我想将朋友显示为网格视图但CGridView数据为data
在二维动画上绘制可变大小和位置的圆圈

我正在 Python 3 3 中使用 matplotlib 我有一个动画 2d 和 3d 窗口我在上面画点这些点代表物体但不确定它们是否真的存在所以我想围绕这些点画一个圆圈来显示不确定性这种不确定性是变化的所以底线是我想在 2
JavaScript 中可以编写连续的嵌套函数吗？

我知道这就是封闭的领域但是可以连续调用嵌套的匿名函数吗假设我有这个 function testing input var testing 0 function testing testing 1 return testing 我们可以有
多列的加权平均值，按组（在 data.table 中）

这个问题紧接着另一个问题组加权平均值 https stackoverflow com questions 14145859 weighted means by group and column 我想使用创建加权组内平均值data table
自动更新AngularJS中的范围变量

我目前正在使用 AngularJS 我想从服务返回一个变量让作用域知道它何时发生变化为了说明这一点请查看 www angularjs org 中的示例连接后端粗略地我们可以看到以下内容 var projects firebase
如何使用 ITfoxtec 创建 IdP

我有兴趣使用 SAML 创建 IdP 身份提供商是否可以使用 ITfoxtec Nuget 创建完整的 IdP 功能有 ASP Net C 的示例吗是的可以使用 ITfoxtec Identity Saml 2 0 库实施 IdP
使用 WCF 将 Linq-to-Sql 对象发送到服务器时出错

我正在尝试开发一个具有 2 层的系统移动客户端和使用 LINQ to SQL 在数据库中存储信息的服务器我想创建一个在服务器中存储任务的 WCF 服务器因此它将从客户端接收任务并使用 LINQ to SQL 来存储它为了执行此服务
从键值对动态填充列

我正在使用 xslt 文件进行样式设置我以表格格式显示一些内容我需要从预定义的键值对动态填充一列请看下面的例子
动态增加android中的相对布局大小

我有一个相对布局在其中显示页面和一些内容当我缩放页面时布局尺寸没有增加我希望我的布局能够动态增加其大小我该如何设置我尝试用java代码来做 contentLayout getLayoutParams height x some
PySpark：如何分组、重新采样和前向填充空值？

考虑以下数据集in Spark 我想以特定频率例如 5 分钟对日期重新采样 START DATE dt datetime 2019 8 15 20 33 0 test df pd DataFrame school id remote r
使用 OrdinalEncoder 转换分类值

我有一个数据集其中包含以下列 No Name Sex Blood Grade Height Study 1 Tom M O 56 160 Math 2 Harry M A 76 192 Math 3 John M A 45 178 Eng

使用 OrdinalEncoder 转换分类值

使用 OrdinalEncoder 转换分类值 的相关文章

随机推荐

热门标签

使用 OrdinalEncoder 转换分类值的相关文章