Scikit-learn 的 LabelBinarizer 与 OneHotEncoder

2024-04-05

两者有什么区别?似乎两者都创建了新列,其数量等于特征中唯一类别的数量。然后,他们根据数据点所属的类别将 0 和 1 分配给数据点。


下面显示了使用 LabelEncoder、OneHotEncoder、LabelBinarizer 对数组进行编码的简单示例。

我看到 OneHotEncoder 首先需要整数编码形式的数据才能转换为其各自的编码,而在 LabelBinarizer 的情况下不需要。

from numpy import array
from sklearn.preprocessing import LabelEncoder
from sklearn.preprocessing import OneHotEncoder
from sklearn.preprocessing import LabelBinarizer

# define example
data = ['cold', 'cold', 'warm', 'cold', 'hot', 'hot', 'warm', 'cold', 
'warm', 'hot']
values = array(data)
print "Data: ", values
# integer encode
label_encoder = LabelEncoder()
integer_encoded = label_encoder.fit_transform(values)
print "Label Encoder:" ,integer_encoded

# onehot encode
onehot_encoder = OneHotEncoder(sparse=False)
integer_encoded = integer_encoded.reshape(len(integer_encoded), 1)
onehot_encoded = onehot_encoder.fit_transform(integer_encoded)
print "OneHot Encoder:", onehot_encoded

#Binary encode
lb = LabelBinarizer()
print "Label Binarizer:", lb.fit_transform(values)

解释 OneHotEncoder 的另一个很好的链接是:使用python解释onehotencoder https://stackoverflow.com/questions/42728772/explain-onehotencoder-using-python

两者之间可能还存在其他有效差异,专家可能会对此进行解释。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Scikit-learn 的 LabelBinarizer 与 OneHotEncoder 的相关文章

  • 检测到通过 ChromeDriver 启动的 Chrome 浏览器

    我正在尝试在 python 中使用 selenium chromedriver 来访问 www mouser co uk 网站 然而 从第一次拍摄开始 它就被检测为机器人 有人对此有解释吗 此后我使用的代码 options Options
  • 在 Pandas 中,如何从基于另一个数据框的数据框中删除行?

    我有 2 个数据框 一个名为 USERS 另一个名为 EXCLUDE 他们都有一个名为 电子邮件 的字段 基本上 我想删除 USERS 中包含 EXCLUDE 中包含电子邮件的每一行 我该怎么做 您可以使用boolean indexing
  • 使用 Python 创建 MIDI

    本质上 我正在尝试从头开始创建 MIDI 并将它们放到网上 我对不同的语言持开放态度 但更喜欢使用Python 两种语言之一 如果这有什么区别的话 并且想知道我应该使用哪个库 提前致谢 看起来这就是您正在寻找的 适用于 Python 的简单
  • 如何使用 colorchecker 在 opencv 中进行颜色校准?

    我有数码相机获取的色彩检查器图像 我如何使用它来使用 opencv 校准图像 按照以下颜色检查器图像操作 您是想问如何进行颜色校准或如何使用 OpenCV 进行校准 为了进行颜色校准 您可以使用校准板的最后一行 灰色调 以下是您应该逐步进行
  • NumPy linalg.eig

    我有这个烦人的问题 但我还没有弄清楚 我有一个矩阵 我想找到特征向量 所以我写 val vec np linalg eig mymatrix 然后我得到了 vec 我的问题是 当我小组中的其他人对相同的矩阵 mymatrix 做同样的事情时
  • 在 python 3 中使用子进程

    我使用 subprocess 模块在 python 3 中运行 shell 命令 这是我的代码 import subprocess filename somename py in practical i m using a real fil
  • 适用于 .NET 2.0 的更精确的 PNG 库?

    是的 我正在使用 C 2 0 需要对 PNG 文件执行操作 例如使用自定义调色板 但我不知道如何使用 System Drawing 是否有第 3 方库 最好是兼容 GPL 的 可以对 PNG 编码进行更精细的控制 Update 我想做的事情
  • Pandas dataframe:每批行的操作

    我有一个熊猫数据框df我想计算每批行的一些统计信息 例如 假设我有一个batch size 200000 对于每批batch sizerows 我想要一列的唯一值的数量ID我的数据框 我怎样才能做这样的事情呢 这是我想要的一个例子 prin
  • ImportError:运行 jupyter Notebook 时没有名为 IPython.paths 的模块?

    我通过以下方式安装了 jupyter usr local opt python bin python2 7 m pip install jupyter 这将安装 ipython 版本 4 1 2 但是 当我运行 jupyter Notebo
  • Python中列表中两个连续元素的平均值

    我有一个偶数个浮点数的列表 2 34 3 45 4 56 1 23 2 34 7 89 我的任务是计算 1 和 2 个元素 3 和 4 5 和 6 等元素的平均值 在 Python 中执行此操作的快捷方法是什么 data 2 34 3 45
  • 如何从 JSON 响应重定向?

    所以我尝试使用 Flask 和 Javascript 上传器 Dropzone 上传文件并在上传完成后重定向 文件上传正常 但在烧瓶中使用传统的重定向 return redirect http somesite com 不执行任何操作 页面
  • Python:我不明白 sum() 的完整用法

    当然 我明白你使用 sum 与几个数字 然后它总结所有 但我正在查看它的文档 我发现了这一点 sum iterable start 第二个参数 start 的作用是什么 这太尴尬了 但我似乎无法通过谷歌找到任何示例 并且对于尝试学习该语言的
  • 在 Spyder 的变量资源管理器中查看局部变量

    我是 python 新手 正在使用 Spyder 的 IDE 我欣赏它的一项功能是它的变量资源管理器 然而 根据一些研究 我发现它只显示全局变量 我找到的解决方法是使用检查模块 import inspect local vars def m
  • 使用 pybtex 将 bibtex 转换为格式化的 HTML 参考书目,例如哈佛风格

    我正在使用 Django 并将 bibtex 存储在我的模型中 并且希望能够以格式化 HTML 字符串的形式向我的视图传递引用 使其看起来像哈佛引用样式 使用中描述的方法Pybtex 无法识别 bibtex 条目 https stackov
  • Python对象初始化性能

    我只是做了一些快速的性能测试 我注意到一般情况下初始化列表比显式初始化列表慢大约四到六倍 这些可能是错误的术语 我不确定这里的行话 例如 gt gt gt import timeit gt gt gt print timeit timeit
  • 带有 RotatingFileHandler 的 Python 3 记录器超出 maxBytes 限制

    我使用以下代码来限制日志文件的大小 最小示例 import logging from logging handlers import RotatingFileHandler Set up logfile and message loggin
  • PIL - 需要抖动,但限制调色板会导致问题

    我是 Python 新手 正在尝试使用 PIL 来执行 Arduino 项目所需的解析任务 这个问题涉及到Image convert 方法以及调色板 抖动等选项 我有一些硬件能够一次仅显示 16 种颜色的图像 但它们可以指定为 RGB 三元
  • 附加两个具有相同列、不同顺序的数据框

    我有两个熊猫数据框 noclickDF DataFrame 0 123 321 0 1543 432 columns click id location clickDF DataFrame 1 123 421 1 1543 436 colu
  • bs4 `next_sibling` VS `find_next_sibling`

    我在使用时遇到困难next sibling 并且类似地与next element 如果用作属性 我不会得到任何返回 但如果用作find next sibling or find next 然后就可以了 来自doc https www cru
  • 使用Multiprocessing和Pool时如何访问全局变量?

    我试图避免将变量冗余地传递到dataList e g 1 globalDict 2 globalDict 3 globalDict 并在全球范围内使用它们 global globalDict然而 在下面的代码中并不是这样做的解决方案 是否有

随机推荐

  • smarty 替换换行符

    在撰写本文时 smarty net 网站似乎已关闭 无论如何 如何在 smarty 变量中用空格替换换行符 是这样的吗 var regex replace r n s 我尝试过 但没有成功 试试这个如果有效的话 var regex repl
  • 在c#中将网页捕获为图像,确保javascript渲染的元素可见

    我正在尝试使用标准 c net 代码捕获以下页面 我搜索了人们的各种方法 其中大多数涉及实例化浏览器对象并使用绘制位图方法 然而 这些都没有获取此页面上图表的内容 http www highcharts com demo combo dua
  • Web 服务上下文中的 UDDI 是什么?

    Web 服务上下文中的 UDDI 是什么 UDDI 是通用描述 发现和集成 它直接用于发布和发现公共 Web 服务 更多详情可访问网站http www UDDI org http www UDDI org
  • 运行“pip install -rrequirements.txt --upgrade”时出错

    当我在 Django 项目中运行以下命令时 pip install r requests txt upgrade 我收到以下错误 检测到我们无法卸载的 distutils 安装项目 argparse distutils 提供的元数据不包含
  • C#计算打开文件的MD5?

    如何计算进程打开或使用的文件的 MD5 哈希值 文件可以是 txt 或 exe 我当前的代码返回 exe 错误 因为它正在运行 这是我当前的代码 public static string GetMd5HashFromFile string
  • 访问 iPhone/iPod touch 上的日历条目

    是否可以在 iPhone iPod touch 上访问日历条目 即读取 创建 更改 删 除约会 我搜索了iPhone SDK文档但没有找到任何东西 也许我错过了什么 目前 SDK 不支持此功能 如果您需要此信息 请考虑提交一份错误报告 ht
  • Android 中如何在另一个 Activity 中显示一个 Activity?

    我有一项活动 想在其中显示另一项活动 这是我的布局
  • 更改 DirectionsRenderer 中折线的颜色

    我已经集成了地图 我想显示两个位置之间的路线方向 一切工作正常 方向显示完美 但我想改变的颜色Polyline方向 我已经尝试过这段代码 如文档所述 polyline options var pOptions map map strokeC
  • Selenium Java:我想访问 div 类中的第一个 div 元素

    Selenium Java 我想访问 div 类中的第一个 div 元素 public int checkLinks int x driver findElements By xpath div class recommendation h
  • {{action}} 与使用关系 id 的transitionTo 链接

    给定一个具有如下上下文的视图 id 1 form id 5 我想创建一个 action 使用链接到表格form id 我的视图代码如下所示 我的路由器中的操作如下所示 showForm function router event var f
  • UnicodeDecodeError:“ascii”编解码器无法解码字节 0xc5

    UnicodeDecodeError ascii codec can t decode byte 0xc5 in position 537 ordinal not in range 128 referer 当我尝试用字符 输出整个网站时 我
  • 我可以在 Honeycomb 的操作栏中隐藏应用程序图标吗?

    我目前正在计划对我的应用程序进行蜂窝更新 我想知道如何正确使用操作栏 我的第一个问题是是否可以从操作栏中隐藏应用程序图标和标题 Honeycomb UI 是否有任何设计指南 是的 您可以隐藏应用程序图标和标题 您还可以将应用程序图标替换为适
  • 仅在 WCF Web 服务中的某些方法需要凭据

    我有一个具有不同方法的 UserAccountService 其中一些方法需要对用户进行身份验证 例如 ChangePassword ChangeUserData 而另一些则不需要 RegisterUser 然而 我似乎无法让它工作 因此只
  • 低级鼠标钩子 - 鼠标在断点处冻结

    我想自己绘制和移动我的窗口 使用 chromium 嵌入式框架 为此 当鼠标移动到窗口之外时 我需要一个全局回调 所以我安装了一个低级别的鼠标钩子 hMouseLLHook SetWindowsHookEx WH MOUSE LL HOOK
  • 如何在PIL中减少png图像文件大小

    我已经使用 PIL 将 JPG BMP 文件转换并调整大小为 PNG 格式 我可以轻松调整大小并将其转换为 PNG 但新图像的文件大小太大 im Image open input jpg im resize im resize 400 40
  • 如何将 Mongoose 文档转换为普通对象?

    我有一个来自猫鼬的文档 我想在 JSON 编码并作为响应发送之前进行扩展 如果我尝试向文档添加属性 它将被忽略 该属性未出现在Object getOwnPropertyNames doc 无法正常延长 奇怪的是JSON parse JSON
  • 收到“线程 1:EXC_BAD_ACCESS”错误?

    我正在使用 WKWebView 和 Swift 语言创建一个简单的 Web 查看器 这是我的代码 import Cocoa import WebKit NSApplicationMain class AppDelegate NSObject
  • NSMutableDictionary 以 UIButton* 作为键 - iPhone 开发

    我是 iPhone 开发新手 我有一个问题 可能有一个非常简单的答案 我正在尝试向视图添加按钮 这些按钮与我定义的自定义类相关联 当我将按钮添加到视图中时 我想知道这些按钮对应什么类 这是因为当我按下按钮时 我需要获取有关该类的一些信息 但
  • VKDefault - 三角器未能完全三角化多边形 MapKit

    我遇到了收到警告的问题 VKDefault Triangulator failed to fully triangulate polygon MapKit放大和缩小地图上的特定区域时 我正在从 json 数据创建多边形 该数据可以包含 MK
  • Scikit-learn 的 LabelBinarizer 与 OneHotEncoder

    两者有什么区别 似乎两者都创建了新列 其数量等于特征中唯一类别的数量 然后 他们根据数据点所属的类别将 0 和 1 分配给数据点 下面显示了使用 LabelEncoder OneHotEncoder LabelBinarizer 对数组进行