LabelEncoder指定DataFrame中的类

2024-03-10

我正在将 LabelEncoder 应用于 pandas DataFrame，df

Feat1  Feat2  Feat3  Feat4  Feat5
  A      A      A      A      E
  B      B      C      C      E
  C      D      C      C      E
  D      A      C      D      E

我将标签编码器应用到这样的数据帧 -

from sklearn import preprocessing
le = preprocessing.LabelEncoder()
intIndexed = df.apply(le.fit_transform)

这就是标签的映射方式

A = 0
B = 1
C = 2
D = 3
E = 0

我猜E没有给出以下值4因为它不会出现在除Feat 5 .

I want E被赋予的值4- 但不知道如何在 DataFrame 中执行此操作。

你可以fit http://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.LabelEncoder.html#sklearn.preprocessing.LabelEncoder.fit标签编码器及更高版本transform http://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.LabelEncoder.html#sklearn.preprocessing.LabelEncoder.transform标签的标准化编码如下：

In [4]: from sklearn import preprocessing
   ...: import numpy as np

In [5]: le = preprocessing.LabelEncoder()

In [6]: le.fit(np.unique(df.values))
Out[6]: LabelEncoder()

In [7]: list(le.classes_)
Out[7]: ['A', 'B', 'C', 'D', 'E']

In [8]: df.apply(le.transform)
Out[8]: 
   Feat1  Feat2  Feat3  Feat4  Feat5
0      0      0      0      0      4
1      1      1      2      2      4
2      2      3      2      2      4
3      3      0      2      3      4

默认情况下指定标签的一种方法是：

In [9]: labels = ['A', 'B', 'C', 'D', 'E']

In [10]: enc = le.fit(labels)

In [11]: enc.classes_                       # sorts the labels in alphabetical order
Out[11]: 
array(['A', 'B', 'C', 'D', 'E'], 
      dtype='<U1')

In [12]: enc.transform('E')
Out[12]: 4

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

machinelearning

scikitlearn

LabelEncoder指定DataFrame中的类的相关文章

Python 比编译的 Haskell 更快？

我有一个用 Python 和 Haskell 编写的简单脚本它读取包含 1 000 000 个换行符分隔的整数的文件将该文件解析为整数列表对其进行快速排序然后将其写入已排序的不同文件中该文件与未排序的文件具有相同的格式简单的这
Pandas read_sql 读取时更改大量 ID

我将 Oracle 数据库转移到 SQL Server 一切似乎都很顺利各种 ID 列都是很大的数字因此我不得不使用 Decimal 因为它们对于 BigInt 来说太大了我现在尝试使用 pandas read sql 使用 pyod
如何在Python中拟合阶跃函数

我有一个关于使用 curve fit 等 scipy 例程拟合阶跃函数的问题我很难将其矢量化例如 import numpy as np from scipy optimize import curve fit import matplo
类型错误：不支持的操作数类型 -：“int”和“list”

我正在尝试用 python 创建一个程序它会使用 Zeller 算法告诉你你出生在星期几http en wikipedia org wiki Zeller 27s congruence http en wikipedia org wiki
python数据结构（类似设置）在添加重复项时抛出异常

我正在寻找一种在添加重复元素时会引发异常的数据结构我发现的最接近的是collections Counter gt gt gt from collections import Counter as counter gt gt gt c co
Python NameError，变量“未定义”

它返回的错误是 NameError name lives is not defined 我知道代码并不是尽可能高效这是我的第一个项目但是无论我尝试做什么都会弹出这个错误我尝试为其创建一个全局变量但这没有帮助我真的很感激一些帮助
匹配字典集。最优雅的解决方案。 Python

给定两个字典列表新的和旧的字典在两个列表中表示相同的对象我需要找到差异并生成新的字典列表其中仅包含新字典中的对象和旧字典中的更新属性例子 list new id 1 name bob desc cool guy id 2 name
如何在 conda 中从一个文件安装多个包而不创建新环境？

我从当前环境缺少的包的 yml 文件中获取了这些我如何在当前环境中安装这些 channels defaults dependencies appdirs 1 4 3 py36h28b3542 0 asn1crypto 0 24 0 py3
如何使用包含 \n 的 .txt 创建一维列表？

我想读取一个文本文件并将文件的每个元素放入一个列表中而不是为文件中的每一行都有一个单独的列表例如如果文件是你好我的名字 Is Joe 我希望列表是你好我的名字是 Joe 而不是你好我的名字是乔这是我到目前为止所拥有的 d
如何通过检查传递给 pytest_runtest_teardown 的 Item 对象来确定测试是否通过或失败？

Pytest 允许您通过实现一个名为的函数来进入每个测试的拆卸阶段pytest runtest teardown在插件中 def pytest runtest teardown item nextitem pass 是否有一个属性或方法it
如何将当前登录的用户指定为模型字段的默认值？

我想做这样的事情 class Task models Model created by models ForeignKey User default LoggedInUser blank True null True related nam
TypeError: 'module' 对象不可调用错误 driver=webdriver("C:\\Python34\\Lib\\site-packages\\selenium\\webdriver\\chromedriver.exe")

我在 Pycharm 中遇到类似错误 Traceback most recent call last File C PycharmProjects DemoPyth PythonPack1 Prg1 py line 3 in
Scapy TCP 校验和重新计算奇怪的行为

我正在尝试进行 TCP ACK 欺骗我从 pcap 文件中嗅探一个 ACK 数据包并在循环中发送它增加其 ACK 编号以及另一个选项字段嗅探部分预欺骗 from scapy all import from struct impor
Python Flask 不更新图像[重复]

这个问题在这里已经有答案了这里有一些关于图像的 Flask 问题但没有一个能解决我的问题我有一个应用程序可以创建图像保存它然后显示它一次它应该多次执行此操作每次更改图像时它应该加载新图像它不是它只显示与其显示的文件名关
如何识别嵌套 json 文件并将其分解为数据框的列？

我再次重新组织我的问题以便更清楚我的数据看起来像这样 Research xmlns http www xml org 2013 2 XML language eng createDateTime 2022 03 25T10 12 39Z
openpyxl：为一系列 Excel 单元格分配值或应用格式而不进行迭代

我想应用特定格式或为一系列 Excel 单元格分配一个值而不需要迭代每个单元格我目前正在使用这个脚本 from openpyxl import Workbook from openpyxl styles import Font wb W
在 jupyter 笔记本中运行 pytest 测试函数

我正在制作有关 python 测试选项的演示我想要演示的技术之一是 pytest 我计划使用 jupyter ipython 笔记本进行演示理想情况下我希望能够在单元格中定义一个测试函数然后使用 pytest 运行该函数这样我就可
从多个 .csv 文件创建混淆矩阵

我有很多具有以下格式的 csv 文件 338 800 338 550 339 670 340 600 327 500 301 430 299 350 284 339 284 338 283 335 283 330 283 310 282 3
类型错误：“生成器”对象没有属性“__getitem__”

我编写了一个应该返回字典的生成函数但是当我尝试打印字段时出现以下错误 print row2 SearchDate TypeError generator object has no attribute getitem 这是我的代码 fro
每次都在django查询数据库中过滤查询集吗？

想象一下我有以下代码 qs Users objects all list for i in range 10 list append qs filter age i 这里过滤器被调用 10 次它是连接到数据库 10 次还是第一次使用过滤器

随机推荐

OSError：无法加载库'C：\ Program Files \ R \ R-4.0.2 \ bin \ x64 \ R.dll'：错误0x7e

我正在尝试将 rpy2 库导入 Jupyter Notebook 但无法克服此错误已添加路径 C Program Files R R 4 0 2 bin x64 这是我的计算机上安装的唯一 R 版本我已经完全卸载并重新安装了 R Rst
更改python中的字符串格式分隔符

我想模板化一些配置文件但它们与 python 不兼容 this is a template format template string 格式化例如大括号是配置的一部分 nginx 配置您可以将分隔符更改为其他内容吗 eg this
AVPlayer 暂停后无法恢复+一些等待

在 pause 之后如果我调用 play 它会继续但是如果我在 pause 之后等待 30 60 秒并尝试 play 它有时会无法播放 AVPlayerStatus Failed 返回 false AVPlayerStatus Read
JavaFX：当用户选中复选框时，CheckBoxTableCell 获取 ActionEvent

我想在用户选中或取消选中 tableView 中的复选框时触发方法或操作当用户使用 checkBox 时 coursData addListener 不会被触发这是我编译的代码窗口中出现带有复选框的 tableView package
使用 WinCrypt 和 CryptImportKey 硬编码 AES-256 密钥

我需要让 Win32 应用程序加载硬编码的 AES 256 密钥最好使用 WinCrypt h 方法我的密钥位于 unsigned char 32 中但我找不到传递给 CryptImportKey 的密钥 blob 的正确格式一切似
在 Android 上查找音调

如何从我的语音记录中找到最小最大平均标准偏差音调我使用 AudioRecord 来录制我的声音 frequency 8000 channelConfiguration AudioFormat CHANNEL CONFIGURATIO
RealityKit – 以编程方式设置 Reality Composer 实体的文本

在我的 iOS 应用程序中我想使用新的 Reality Composer 来介绍 AR 的一部分在我的项目中我使用以下代码加载场景 let arView ARView init frame frame Configure the AR
从 Java 将变量插入 SQL 查询

如何将变量插入 SQL 查询这就是我到目前为止所拥有的 public String getBugList int amount Connection con DatabaseConnection getConnection try Pre
CSV 到 JSON Ruby 脚本？

有谁知道如何编写将 csv 文件转换为 json 文件的 Ruby 脚本 CSV 将采用以下格式 Canon Digital IXUS 70 Epic Epic 100 3x Yes lockable Yes lockable Yes Ca
Apple LLVM 9.0 错误组 - 无法读取配置文件。找不到这样的文件或目录

我已经创建了分发证书和分发配置文件在尝试构建应用程序时它抛出以下错误无法读取个人资料 Users nan Projects Projectname node modules react native React Optimizatio
ffmpeg：是否可以替换可变帧率视频中的帧？

用于视频处理的机器学习算法通常适用于帧图像而不是视频在我的工作中我使用 ffmpeg 将特定场景转储为一系列 png 文件以某种方式处理它们去噪去模糊着色注释修复等将结果输出到相同数量的 png 文件中然后用新帧更新
pymssql Windows 身份验证

pymssql模块用于支持windows身份验证现在看来并非如此尽管在某些地方它仍然表明它应该有效我一直无法找到这个问题的明确答案也找不到解决方案最相关的链接 https groups google com forum topic
EF：有关跨数据库关系的数据库设计问题

Summary 我目前正在制作一个非常简单多租户 Web 应用程序的原型其中用户存储在数据库中 1 可以注册到不同的租户存储在数据库中per租户相同的数据库模式我认为这种架构适用于许多多租户解决方案遗憾的是我发现实体框架不
使用 requestSpotInstances 的 TagSpecifications 使用 aws-sdk 的 UnexpectedParameter

我正在尝试向我的 AWS Spot 请求添加标签但它已经归还给我了 UnexpectedParameter Unexpected key TagSpecifications found in params LaunchSpecificat
Delphi 泛型类可以从其类参数派生吗？

我一直在尝试定义一个通用的可继承的 TSingleton 类这是我正在进行的工作 TSingleton
在 C# 中解析 JSON 数据

我有一个 JSON 数据如下 id 367501354973 from name Bret Taylor id 220439 由 IDictionary String Object 的对象结果返回在我的 C 代码中我不确定你是如何解
Perl：命名参数验证最佳实践

我在类方法调用中使用命名参数想知道是否有最佳实践来确保不传递未知参数这就是我正在做的 sub classmethod my self shift my args param1 gt default1 param2 gt default2
fft后如何在C上均衡

首先感谢您花时间回答我的问题是下一个我尝试使用 fft 快速傅立叶变换在 C 上构建均衡器因为现在我能够在向量音频样本上正确应用 fft 对其进行归一化然后应用逆 fft 因为这里一切都好但是当我尝试修改 fft 的结果以
如何从组件内的单点捕获 vuejs 错误

我有一个使用大量 axios 的组件then catch 在捕获中我总是抛出console error like axios get then catch error gt console error 还有其他一些地方我也抛出错误我正在寻
LabelEncoder指定DataFrame中的类

我正在将 LabelEncoder 应用于 pandas DataFrame df Feat1 Feat2 Feat3 Feat4 Feat5 A A A A E B B C C E C D C C E D A C D E 我将标签编码器应

LabelEncoder指定DataFrame中的类

LabelEncoder指定DataFrame中的类 的相关文章

随机推荐

热门标签

LabelEncoder指定DataFrame中的类的相关文章