为 Sklearn 重塑数据

2023-12-03

我有一个颜色列表：

initialColors = [u'black' u'black' u'black' u'white' u'white' u'white' u'powderblue'
 u'whitesmoke' u'black' u'cornflowerblue' u'powderblue' u'powderblue'
 u'goldenrod' u'white' u'lavender' u'white' u'powderblue' u'powderblue'
 u'powderblue' u'powderblue' u'powderblue' u'powderblue' u'powderblue'
 u'powderblue' u'white' u'white' u'powderblue' u'white' u'white']

我有这些颜色的标签，如下所示：

labels_train = [0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1]

0意味着颜色由女性选择，1是指男性。我将使用另一组颜色来预测性别。

因此，对于我的初始颜色，我将名称转换为数字特征向量，如下所示：

from sklearn import preprocessing
le = preprocessing.LabelEncoder()
le.fit(initialColors)
features_train = le.transform(initialColors)

之后我的features_train好像：

[0 0 0 5 5 5 4 6 0 1 4 4 2 5 3 5 4 4 4 4 4 4 4 4 5 5 4 5 5]

最后，我这样做：

from sklearn.naive_bayes import GaussianNB
clf = GaussianNB()
clf.fit(features_train, labels_train)

但我有一个错误：

/Library/Python/2.7/site-packages/sklearn/utils/validation.py:395: DeprecationWarning: Passing 1d arrays as data is deprecated in 0.17 and will raise ValueError in 0.19. Reshape your data either using X.reshape(-1, 1) if your data has a single feature or X.reshape(1, -1) if it contains a single sample.
  DeprecationWarning)
Traceback (most recent call last):
  File "app.py", line 36, in <module>
    clf.fit(features_train, labels_train)
  File "/Library/Python/2.7/site-packages/sklearn/naive_bayes.py", line 182, in fit
    X, y = check_X_y(X, y)
  File "/Library/Python/2.7/site-packages/sklearn/utils/validation.py", line 531, in check_X_y
    check_consistent_length(X, y)
  File "/Library/Python/2.7/site-packages/sklearn/utils/validation.py", line 181, in check_consistent_length
    " samples: %r" % [int(l) for l in lengths])
ValueError: Found input variables with inconsistent numbers of samples: [1, 70]

I did:

features_train = features_train.reshape(-1, 1)
labels_train = labels_train.reshape(-1, 1)
clf.fit(features_train, labels_train)

我有一个错误：

/Library/Python/2.7/site-packages/sklearn/utils/validation.py:526: DataConversionWarning: A column-vector y was passed when a 1d array was expected. Please change the shape of y to (n_samples, ), for example using ravel().
  y = column_or_1d(y, warn=True)

我也尝试过：

features_train = features_train.reshape(1, -1)
labels_train = labels_train.reshape(1, -1)

但不管怎么说：

Traceback (most recent call last):
  File "app.py", line 36, in <module>
    clf.fit(features_train, labels_train)
  File "/Library/Python/2.7/site-packages/sklearn/naive_bayes.py", line 182, in fit
    X, y = check_X_y(X, y)
  File "/Library/Python/2.7/site-packages/sklearn/utils/validation.py", line 526, in check_X_y
    y = column_or_1d(y, warn=True)
  File "/Library/Python/2.7/site-packages/sklearn/utils/validation.py", line 562, in column_or_1d
    raise ValueError("bad input shape {0}".format(shape))
ValueError: bad input shape (1, 29)

我的问题是我不明白在我的情况下重塑数据的最佳方法是什么。您能帮我选择一种重塑数据的方法吗？

快速回答：

Do features_train = features_train.reshape(-1, 1);
不要做labels_train = labels_train.reshape(-1, 1). Leave labels_train就这样。

一些细节：

您似乎对估算器需要二维数据数组输入的原因感到困惑。你的训练向量X有一个形状 (n_samples, n_features). So features_train.reshape(-1, 1)对于您的情况来说是正确的，因为您只有 1 个功能并且想让numpy来推断有多少个样本。这确实解决了您的第一个错误。

Your 目标值y有一个形状 (n_samples,)，它需要一个一维数组。当你这样做时labels_train = labels_train.reshape(-1, 1)，将其转换为二维列向量。这就是你收到第二次警告的原因。注意，这是一个警告，意思是fit()弄清楚并进行了正确的转换，即您的程序继续运行并且应该是正确的。

当你这样做时：

features_train = features_train.reshape(1, -1)
labels_train = labels_train.reshape(1, -1)

首先，这是一个错误的转换features_train对于你的情况，因为X.reshape(1, -1)表示您有 1 个样品并希望让numpy来推断有多少个特征。这不是你想要的，但是fit()不知道并且会相应地处理它，给你错误的结果。

话虽这么说，你的最后一个错误并不是来自features_train = features_train.reshape(1, -1)。它来自labels_train = labels_train.reshape(1, -1). Your labels_train现在的形状 (1, 29) 既不是行向量也不是列向量。尽管我们可能知道它应该被解释为目标值的一维数组，fit()还没有那么聪明，不知道该怎么办。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

为 Sklearn 重塑数据的相关文章

如何在javascript中解压二进制文件？

我正在尝试将一些现有代码从 python 移植到 javascript 并且不确定如何处理以下行 var1 var2 struct unpack
类型错误：“生成器”对象没有属性“__getitem__”

我编写了一个应该返回字典的生成函数但是当我尝试打印字段时出现以下错误 print row2 SearchDate TypeError generator object has no attribute getitem 这是我的代码 fro
如何获取 sklearn.metrics.classification_report 的输出作为字典？

我一直在尝试以字典的形式获得分类报告所以根据 scikit learn 0 20 文档我这样做 from sklearn import metrics rep metrics classification report y true y
Google Colab 使用 Transformers 和 PyTorch 微调 BERT Base Case 时出现间歇性“RuntimeError: CUDA out of memory”错误

我正在运行以下代码来微调 Google Colab 中的 BERT Base Cased 模型有时代码第一次运行良好没有错误其他时候相同的代码使用相同的数据会导致 CUDA 内存不足错误以前重新启动运行时或退出笔记本返回笔
使用xgboost进行分类时如何获得置信区间或预测离散度的度量？

使用xgboost进行分类时如何获得置信区间或预测离散度的度量例如如果 xgboost 预测某个事件的概率为 0 9 如何获得该概率的置信度这种置信度是否也被认为是异方差的要为 xgboost 模型生成置信区间您应该训练多个模型
Python从int到string的快速转换

我正在用 python 求解大量阶乘并发现当我完成计算阶乘时需要相同的时间才能转换为字符串以保存到文件中我试图找到一种将 int 转换为字符串的快速方法我将举一个计算和 int 转换时间的例子我正在使用通用的 a str a 但感
更新 Sqlalchemy 中的多个列

我有一个在 Flask 上运行的应用程序并使用 sqlalchemy 与数据库交互我想用用户指定的值更新表的列我正在使用的查询是 def update table value1 value2 value3 query update T
如何将回溯/sys.exc_info() 值保存在变量中？

我想将错误名称和回溯详细信息保存到变量中这是我的尝试 import sys try try print x except Exception ex raise NameError except Exception er print 0 s
Python 通过从现有 csv 文件中过滤选定的行来写入新的 csv 文件

只是一个问题我试图将 csv 文件中的选定行写入新的 csv 文件但出现错误我试图读取的 test csv 文件是这样的两列 2013 9 1 2013 10 2 2013 11 3 2013 12 4 2014 1 5 2014
sqlalchemy 具有相同表名的多个数据库不起作用

我正在使用 SQLAlchemy 使用 Python 处理两个数据库这些数据库共享表名因此在运行代码时收到错误消息错误消息是 sqlalchemy exc InvalidRequestError Table wo is already
按下按钮时有多个命令

我想在单击按钮时运行多个功能例如我希望我的按钮看起来像 self testButton Button self text test command func1 command func2 当我执行此语句时我收到错误因为我无法将某些内容
使用 Python 2.7 和 MySQLdb 将二进制数据插入 MySQL 中的 blob 列时如何避免编码警告

我在将二进制数据插入到longblob使用 Python 2 7 中的 MySQLdb 在 MySQL 中的列但我收到一个编码警告我不知道如何解决 test py 11 Warning Invalid utf8 character st
使用张量流导出神经网络的权重

我使用张量流工具编写了神经网络一切正常现在我想导出神经网络的最终权重以制定单一的预测方法我怎样才能做到这一点您需要在训练结束时使用以下命令保存模型tf train Saver https www tensorflow org ver
在 Keras 中使用有状态 LSTM 训练多变量多级数回归问题

我有时间序列P过程每个过程的长度各不相同但都有 5 个变量维度我试图预测测试过程的估计寿命我正在用有状态的方法来解决这个问题LSTM在喀拉斯但我不确定我的训练过程是否正确我将每个序列分成长度的批次30 所以每个序列都是这样的形
在 Tensorflow2 中将图冻结为 pb

我们通过图形冻结保存来自 TF1 的许多模型 tf train write graph self session graph def some path get graph definitions with weights output g
列表推导式在 Python2 中泄漏循环变量：如何使其与 Python3 兼容

我刚刚了解到为什么列表推导式会写入循环变量而生成器却不会 https stackoverflow com questions 19848082 why do list comprehensions write to the loop va
是否可以忽略 Matplotlib 绘图的第一个默认颜色？

Matplotlib plots each column of my matrix a with 4 columns by blue yellow green red Then I plot only the second third fo
在防风草模型上使用 VIP 包计算重要性度量

我正在尝试使用 vi firm 在防风草中制作的逻辑回归模型上计算特征重要性对于正则表达式我将使用 iris 数据集并尝试预测观察结果是否为 setosa iris1 lt iris gt mutate class case when
导入我自己的模块时出现“ImportError：没有名为...的模块”

我正在尝试导入模块但不断收到导入错误在 PortfolioStatus py 文件中我有以下代码它从 share data py 模块导入 share data 类 from Shares share data import sha
导入错误：没有名为 google.auth 的模块

当我尝试导入时firebase admin in python 2 7我收到错误导入错误没有名为 google auth 的模块这是Docker文件 https github com ammaratef45 Attendance bl

随机推荐

SSRS 列表报告中的分组依据

我正在制作 SSRS 报告我必须按客户名称进行分组数据集将是这样的从客户中选择Column1 Column2 Column2 按客户名称分组 Expected Report Layout Customer Name Jim Mouse
是否有一个 css 属性不会改变任何内容以及我们可以在哪里存储信息？

是否有一个 css 属性不会改变任何内容我在写作时经常需要这个来进行测试scss只是为了看看我是否正确创建了一个 css 选择器例如我很高兴有这样的东西foo helloworld1 稍后我就可以改变的值foo并检查开发人员工具中的值
Spring Security OAuth2：InsufficientAuthenticationException

首先我禁用基本身份验证 security basic enabled false 然后我访问授权页面 http localhost 8080 oauth authorize client id client response type c
如果在 iframe 中则隐藏标题

我需要隐藏基于 WordPress 的网站的标头以防该网站加载到 iFrame 中我应该用 javascript 函数还是 css 来实现我该怎么做呢我找到了这个
电话号码的 UITextField

我想知道如何格式化我用于电话号码的文本字段即像iPhone上的添加新联系人页面当我输入新手机时例如1236890987 它将其格式设置为 123 689 0987 我已经将键盘设置为数字键盘这是我的解决方案效果很好实时格式化
在MATLAB中绘制椭圆和椭球体

如何使用 MATLAB 绘制椭圆和椭球体 x 2 a 2 y 2 b 2 1 n 40 a 0 b 2 pi c 0 d 2 pi for i 1 n u a b a i 1 n 1 for j 1 m v a d c j 1 m 1 x
try catch 块中未捕获异常

我做一个简单的抛出测试抛出它没有被我的catch std 异常 e 是因为我正在抓一个std 异常 e 我的意思是只有从 std exception 派生的异常类才会被捕获吗如果不是是我做错了什么还是正常的顺便说一句两个 ca
使用JAVA在HANA中插入数组

我有一个对象数组列表并尝试将该列表插入到 HANA 中所以我的插入代码看起来像 PreparedStatement stmt conn prepareStatement INSERT INTO SCHEMA TABLE VALUES A
在 inno Setup 中使用 DOM 添加节点到 xml - 奇怪的问题

非常奇怪的问题我使用 DOM 编辑 xml 文件需要与我们交互的应用程序的 exe config 文件但是由于我必须批量添加几个类似的部分所以我创建了一个函数来插入整个需要的块调用这个函数一次就完美了之后使用不同的参数再次调用它
使用 GROUP SEPARATOR 的 Explode() 函数

根据发现通过MySQL GROUP CONCAT 转义这个我有用GROUP CONCAT SELECT topic response response GROUP CONCAT comment SEPARATOR 0x1D AS comme
你能用 javascript (jxa) 编写文件夹操作吗？

我正在寻找 AppleScript 的直接翻译 on adding folder items to this folder 但我似乎无法在任何地方找到它无论是术语的用法还是关键字 this folder 本身使用 Automator 我
在引导输入字段中放置清除按钮

我试图在输入字段内搜索图标之前的右侧放置一个清除按钮但它不起作用 x 显示在输入字段的前面我使用绝对定位 right 0 和 top 4px 您可以在这里查看我的示例 http www bootply com YUwdJ5Kvx6 一
Delphi Windows 服务设计

Delphi Windows 服务设计我从未创建过 Windows 服务但一直在阅读我发现的所有内容我遇到的所有文章或示例在实现上都非常基础并且范围有限还没有看到任何超出此范围或解决特定场景的内容所以我已经掌握了我可能会找到的
jQuery 的“uploadProgress”未在“$.ajax”中触发

我是 jQuery 新手现在正在处理文件上传我想在每次上传图像时添加一些进度条我用的是uploadProgress在 jQuery 中但它似乎不起作用这是我的代码 form on submit function e var fil
Progress 元素内的 html 文本

您好有人可以帮我处理这个进度 html 元素吗我需要能够在进度的右侧放置一个文本值并根据进度是否减少文本来配合该元素 progress webkit appearance none progress webkit progress b
在 OleDbCommand 中使用“... where Column like ...”不起作用

我正在使用 C 从 Access 我认为是 2003 或 2007 数据库中选择某些内容但它没有选择任何内容我在 Access 本身中尝试了 SQL 语法它似乎工作正常我对 C 和 Access 相当陌生到目前为止我所拥有的 Ol
Jquery 从脚本标签获取文本时出现问题？

我有这个小 HTML 文档
在 Windows 10 中批量运行 VBS 脚本时解压缩文件错误

运行VBS时解压码在 Win 10 中执行批处理出现以下错误鉴于其他人之前曾报告过它可以工作这可能是什么原因更改目标目录或显式设置它们不会影响该错误 echo off setlocal enabledelayedexpansion
python：直接编辑ISO文件

是否可以获取 ISO 文件并直接编辑其中的文件即不解压更改文件并重新打包 1 可以用Python来做吗我该怎么做呢您可以用于列出和提取我测试了第一个 https github com barneygale iso9660 blob
为 Sklearn 重塑数据

我有一个颜色列表 initialColors u black u black u black u white u white u white u powderblue u whitesmoke u black u cornflowerblu

为 Sklearn 重塑数据

为 Sklearn 重塑数据 的相关文章

随机推荐

热门标签

为 Sklearn 重塑数据的相关文章