尝试使用 BayesSearchCV 调整 MLPClassifier hide_layer_sizes 时出错

2024-01-21

当尝试调整 sklearn 时MLP分类器hidden_layer_sizes超参数，使用贝叶斯搜索CV，我收到错误：ValueError: can only convert an array of size 1 to a Python scalar.

但是，当我使用GridSearchCV，效果很好！我缺少什么？

这是一个可重现的示例：

from skopt import BayesSearchCV
from skopt.space import Real, Categorical, Integer
from sklearn.datasets import load_iris
from sklearn.neural_network import MLPClassifier
from sklearn.model_selection import train_test_split
from sklearn.model_selection import GridSearchCV

X, y = load_iris(True)
X_train, X_test, y_train, y_test = train_test_split(X, y,
                                                 train_size=0.75,
                                                 random_state=0)
# this does not work!
opt_bs = BayesSearchCV(MLPClassifier(), 
                     {'learning_rate_init': Real(0.001, 0.05),
                        'solver': Categorical(["adam", 'sgd']), 
                        'hidden_layer_sizes': Categorical([(10,5), (15,10,5)])}, 
                     n_iter=32,
                     random_state=0)

# this one does :)
opt_gs = GridSearchCV(MLPClassifier(), 
                   {'learning_rate_init': [0.001, 0.05],
                        'solver': ["adam", 'sgd'], 
                        'hidden_layer_sizes': [(10,5), (15,10,5)]})
                   
# executes optimization using opt_gs or opt_bs
opt = opt_bs
res = opt.fit(X_train, y_train)
opt

生产：

---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
<ipython-input-64-78e6d29cae99> in <module>()
     27 # executes optimization using opt_gs or opt_bs
     28 opt = opt_bs
---> 29 res = opt.fit(X_train, y_train)
     30 opt

/usr/local/lib/python3.6/dist-packages/skopt/searchcv.py in fit(self, X, y, groups, callback)
    678                 optim_result = self._step(
    679                     X, y, search_space, optimizer,
--> 680                     groups=groups, n_points=n_points_adjusted
    681                 )
    682                 n_iter -= n_points

/usr/local/lib/python3.6/dist-packages/skopt/searchcv.py in _step(self, X, y, search_space, optimizer, groups, n_points)
    553 
    554         # convert parameters to python native types
--> 555         params = [[np.array(v).item() for v in p] for p in params]
    556 
    557         # make lists into dictionaries

/usr/local/lib/python3.6/dist-packages/skopt/searchcv.py in <listcomp>(.0)
    553 
    554         # convert parameters to python native types
--> 555         params = [[np.array(v).item() for v in p] for p in params]
    556 
    557         # make lists into dictionaries

/usr/local/lib/python3.6/dist-packages/skopt/searchcv.py in <listcomp>(.0)
    553 
    554         # convert parameters to python native types
--> 555         params = [[np.array(v).item() for v in p] for p in params]
    556 
    557         # make lists into dictionaries

ValueError: can only convert an array of size 1 to a Python scalar

不幸的是，BayesSearchCV 仅接受分类、整数或实数类型值的参数。就您而言，没有问题learning_rate_init and solver参数被明确定义为Real and Categorical问题分别出在hidden_layer_sizes您将神经元的数量声明为Categorical在本例中是元组的值，并且 BayesSearchCV 尚未具备处理元组中的搜索空间的能力，请参阅here https://github.com/scikit-optimize/scikit-optimize/issues/926有关此的更多详细信息。但是，作为临时黑客，您可以围绕 MLPClassifier 创建自己的包装器，以使估计器的参数能够被正确识别。请参考以下代码片段作为示例：

from skopt import BayesSearchCV
from skopt.space import Integer
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.neural_network import MLPRegressor, MLPClassifier
from sklearn.base import BaseEstimator, ClassifierMixin
import itertools

X, y = load_iris(True)
X_train, X_test, y_train, y_test = train_test_split(X, y,
                                                 train_size=0.75,
                                                 random_state=0)

class MLPWrapper(BaseEstimator, ClassifierMixin):
    def __init__(self, layer1=10, layer2=10, layer3=10):
        self.layer1 = layer1
        self.layer2 = layer2
        self.layer3 = layer3

    def fit(self, X, y):
        model = MLPClassifier(
            hidden_layer_sizes=[self.layer1, self.layer2, self.layer3]
        )
        model.fit(X, y)
        self.model = model
        return self

    def predict(self, X):
        return self.model.predict(X)

    def score(self, X, y):
        return self.model.score(X, y)


opt = BayesSearchCV(
    estimator=MLPWrapper(),
    search_spaces={
        'layer1': Integer(10, 100),
        'layer2': Integer(10, 100),
        'layer3': Integer(10, 100)
    },
    n_iter=11
)

opt.fit(X_train, y_train)
opt.score(X_test,y_test)
0.9736842105263158

注意：这假设您构建了一个具有三层的 MLP 网络。您可以根据需要修改它。此外，创建一个类来构造具有任意层数的 MLP 会变得有些棘手。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

尝试使用 BayesSearchCV 调整 MLPClassifier hide_layer_sizes 时出错的相关文章

如何在 AWS CDK 创建的 Python Lambda 函数中安装外部模块？

我在 Cloud9 中使用 Python AWS CDK 并且我部署简单的 Lambda 函数那应该是发送 API 请求到 Atlassian 的 API当对象上传到 S3 存储桶时也是由 CDK 创建的这是我的 CDK 堆栈代码 fr
python 中的代表

我实现了这个简短的示例来尝试演示一个简单的委托模式我的问题是这看起来我已经理解了委托吗 class Handler def init self parent None self parent parent def Handle self
如何正确地将 MIDI 刻度转换为毫秒？

我正在尝试将 MIDI 刻度增量时间转换为毫秒并且已经找到了一些有用的资源 MIDI Delta 时间刻度到秒 http www lastrayofhope co uk 2009 12 23 midi delta time ticks
pydev 调试器：严重警告：此版本的 python 似乎编译不正确（内部生成的文件名不是绝对的）[重复]

这个问题在这里已经有答案了通过运行 from sklearn datasets import fetch california housing import pandas as pd pd set option precision 4 m
如何使用 imaplib 获取“消息 ID”

我尝试获取一个在操作期间不会更改的唯一 ID 我觉得UID不好所以我认为 Message ID 是正确的但我不知道如何获取它我只知道 imap fetch uid XXXX 有人有解决方案吗来自 IMAP 文档本身 IMAP4消息号
Argparse nargs="+" 正在吃位置参数

这是我的解析器配置的一小部分 parser add argument infile help The file to be imported type argparse FileType r default sys stdin parser
如何在 pytest 中将单元测试和集成测试分开

根据维基百科 https en wikipedia org wiki Unit testing Description和各种articles https techbeacon com devops 6 best practices inte
Pandas 中允许重复列

我将一个大的 CSV 包含股票财务数据文件分割成更小的块 CSV 文件的格式不同像 Excel 数据透视表之类的东西第一列的前几行包含一些标题公司名称 ID 等在以下列中重复因为一家公司有多个属性而不是一家公司只有一栏在前几行
填充两个函数之间的区域

import matplotlib pyplot as plt import numpy as np def domain x np arange 0 10 0 001 f1 lambda x 2 x x 2 0 5 plt plot x
使用 Python pandas 计算调整后的成本基础（股票买入/卖出的投资组合分析）

我正在尝试对我的交易进行投资组合分析并尝试计算调整后的成本基础价格我几乎尝试了一切但似乎没有任何效果我能够计算调整后的数量但无法获得调整后的购买价格有人可以帮忙吗这是示例交易日志原始数据 import pandas as pd
更改 `base_compiledir` 以将编译后的文件保存在另一个目录中

theano base compiledir指编译后的文件存放的目录有没有办法可以永久设置theano base compiledir到不同的位置也许通过修改一些内部 Theano 文件的内容 http deeplearning net
如何通过在 Python 3.x 上按键来启动和中断循环

我有这段代码当按下 P 键时会中断循环但除非我按下非 P 键否则循环不会工作 def main openGame while True purchase imageGrab if a sum gt 1200 fleaButton ti
将 matplotlib 颜色图集中在特定值上

我正在使用 matplotlib 颜色图 seismic 绘制绘图并且希望白色以 0 为中心当我在不进行任何更改的情况下运行脚本时白色从 0 下降到 10 我尝试设置 vmin 50 vmax 50 但在这种情况下我完全失去了白色关
将 2D NumPy 数组按元素相乘并求和

我想知道是否有一种更快的方法专用 NumPy 函数来执行 2D NumPy 数组的元素乘法然后对所有元素求和我目前使用np sum np multiply A B 其中 A B 是相同维度的 NumPy 数组m x n 您可以使用np
无法在 osx-arm64 上安装 Python 3.7

我正在尝试使用 Conda 创建一个带有 Python 3 7 的新环境例如 conda create n qnn python 3 7 我收到以下错误 Collecting package metadata current repoda
使用yield 进行字典理解

作为一个人为的例子 myset set a b c d mydict item yield join item s for item in myset and list mydict gives as cs bs ds a None b N
如何在 OSX 上安装 numpy 和 scipy？

我是 Mac 新手请耐心等待我现在使用的是雪豹 10 6 4 我想安装numpy和scipy 所以我从他们的官方网站下载了python2 6 numpy和scipy dmg文件但是我在导入 numpy 时遇到问题 Library F
Tkinter - 浮动窗口 - 调整大小

灵感来自this https stackoverflow com a 22424245 13629335问题我想为我的根窗口编写自己的调整大小函数但我刚刚注意到我的代码显示了一些性能问题如果你快速调整它的大小你会发现窗口没有像我希望
Ubuntu 上的 Python 2.7

我是 Python 新手正在 Linux 机器 Ubuntu 10 10 上工作它正在运行 python 2 6 但我想运行 2 7 因为它有我想使用的功能有人敦促我不要安装 2 7 并将其设置为我的默认 python 我的问题是如
检查字典键是否有空值

我有以下字典 dict1 city name yass region zipcode phone address tehsil planet mars 我正在尝试创建一个基于 dict1 的新字典但是它不会包含带有空字符串的键它不会包

随机推荐

Vue js 加载器覆盖全局 css

我想用 vue loader 组件中定义的 css 覆盖全局 css 目前我在index html中有这个 div div Other Code G
如何进行滚动求和，每一行需要包含前几行的总和

我有桌子访问当 order number 为空时我需要获取按 user id 分组的行以及 Visit duration seconds 的总和例如对于用户 2875636 我将得到 61 151 33 13 每行应包含其前面的行
程序启动时（asm、linux）默认的寄存器状态是什么？

当程序启动时 Linux ELF 可执行文件其中是否有零eax ebx等等或者还有什么吗我没有进行任何调用或使用外部库在我的机器上寄存器被清零但是在编写 asm 程序时我可以在新进程中依赖这种行为吗这完全取决于每个平台的 AB
为外部承包商清理 Mercurial 存储库

我有一个包含一些敏感文件和目录的活动项目我想聘请外部承包商来做一些简单的 UI 工作但是我不希望承包商有权访问某些目录和文件我的项目在 Bitbucket 上的 Mercurial 中清理项目并让他有权提交更改的最佳方法是什么我
** 中的错误不是 NgModule

我有这个 NgModule NgModule imports CommonModule exports SP21LoadingBar declarations SP21LoadingBar export class SP21LoadingB
将 SQL Azure 数据库导出到 blob - Start-AzureSqlDatabaseExport：无法将 AzureStorageContainer 转换为 AzureStorageContainer

我在用这段代码找到了 https stackoverflow com questions 36261258 start azuresqldatabaseexport object reference not set to an instan
我如何知道Linux系统调用是否是线程安全的？

Linux 中的一些函数通过 r 标记线程安全例如 gmtime r 但大多数系统调用都没有被标记也没有在联机帮助页中提及所以我的问题是我如何知道Linux系统调用是否是线程安全的谢谢你我认为你的意思是库函数由于对线程的内
将第一个函数中创建的数组传递给第二个函数

这个问题是从我的上一个问题开始的主要是因为我想避免使用全局变量因为它的局限性请参阅此处链接的答案如何调用由不同函数创建的数组 https stackoverflow com questions 41436347 how do i c
如何可靠地恢复 MySQL blob

多年来我一直使用以下命令备份 MySQL 数据库 mysqldump myDatabaseName u root gt myBackupFile sql 备份似乎工作正常然后我想将其中一个备份恢复到另一个命名的数据库所以我这样做了 my
Qt5 在 OSX 上安装 -qt-xcb

我在 OSX 上安装 Qt5 时遇到问题 The Mac OSX 的 Qt 要求 http qt project org doc qt 5 0 qtdoc requirements mac html完成 Xcode 和命令行已安装然后我按
使用 ctypes 将 python 字符串传递给 Fortran 子例程

我正在尝试使用 ctypes 将参数传递给共享库中的 Fortran 子例程现在这是我的简单 fortran 代码 MODULE test module INCLUDES SUBROUTINE fstr test file or exte
用 C++ 构建多线程工作队列（消费者/生产者）

我有以下场景我有一个线程应该填充带有整数对的容器本质上是任务描述我有一个很大的应从此容器中获取元素并执行操作的工作线程数 8 16 一些工作我认为这个问题可以通过阻塞队列轻松解决例如在项目删除时线程同步对队列的访问如果没有
WPF DataTemplate 下的排序 ItemsControl

我在 DataTemplate 下使用 ItemsControl 我想对 ItemsControl 进行排序ic使用 id 列
Unity3D C# 检查事件是否为空

例如 DelegateHandler是我发送事件的地方 public class DelegateHandler MonoBehaviour public delegate void OnButtonClickDelegate public
方法签名中的Java“参数”？

在C 中如果希望方法具有不确定数量的参数可以将方法签名中的最后一个参数设为params这样方法参数看起来像一个数组但允许使用该方法的每个人根据调用者的需要传递任意数量的该类型的参数我相当确定 Java 支持类似的行为但我不知道如何
查找子字符串，带有一些附加条件

我得到了一个如下所示的字符串 1011010100 我的任务是找到一个子字符串的长度其中空值的数量始终 10110101 gt 8 我知道复杂度应该是 O n 或 O n log n 因为长度最多可达 10 6 有任何想法吗 The O
在 Android 上，我可以注册一个回调来告诉我蓝牙是否打开或关闭吗？

我需要知道我的应用程序内部蓝牙是否打开或关闭或者蓝牙是否打开或关闭例如从操作系统设置下拉菜单我想我可以在活动中做到这一点onResume 但事实证明当 Android 操作系统的设置下拉菜单通过用手指从屏幕顶部边缘下拉来访问的菜
用于计算类数的部分语法

我需要计算正确的 C 源文件中的类数量我写了以下语法 grammar CSharpClassGrammar options language CSharp2 parser namespace CSharpClassGrammar Gene
H2 表列在双引号中不区分大小写

我正在开发一个工具它将数据导入到动态生成的模式中因此我几乎无法控制表或列名称的外观我最近遇到了在表中创建两列名称相同但大小写不同的问题这个问题可以通过这个最简单的 DDL 操作来演示 CREATE TABLE a c1 integ
尝试使用 BayesSearchCV 调整 MLPClassifier hide_layer_sizes 时出错

当尝试调整 sklearn 时MLP分类器hidden layer sizes超参数使用贝叶斯搜索CV 我收到错误 ValueError can only convert an array of size 1 to a Python sc

尝试使用 BayesSearchCV 调整 MLPClassifier hide_layer_sizes 时出错

尝试使用 BayesSearchCV 调整 MLPClassifier hide_layer_sizes 时出错 的相关文章

随机推荐

热门标签

尝试使用 BayesSearchCV 调整 MLPClassifier hide_layer_sizes 时出错的相关文章