拟合sklearn GridSearchCV模型

2024-01-14

我正在尝试解决回归问题波士顿数据集 https://www.kaggle.com/c/boston-housing在...的帮助下随机森林回归器 https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.RandomForestRegressor.html.我正在使用网格搜索简历 https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.GridSearchCV.html用于选择最佳超参数。

问题1

我应该适合吗GridSearchCV一些X_train, y_train然后得到最佳参数。

OR

我应该戴上它吗X, y获得最佳参数。(X,y =整个数据集)

问题2

说如果我适合它X, y并获得最佳参数,然后在这些最佳参数上建立新模型。 现在我应该如何训练这个新模型?

我应该训练新模型吗X_train, y_train or X, y.

问题3

如果我训练新模型X,y那么我将如何验证结果?

到目前为止我的代码

   #Dataframes
    feature_cols = ['CRIM','ZN','INDUS','NOX','RM','AGE','DIS','TAX','PTRATIO','B','LSTAT']

    X = boston_data[feature_cols]
    y = boston_data['PRICE']

训练测试数据分割

from sklearn.cross_validation import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X, y, random_state = 1)

网格搜索以获得最佳超参数

from sklearn.grid_search import GridSearchCV
param_grid = { 
    'n_estimators': [100, 500, 1000, 1500],
    'max_depth' : [4,5,6,7,8,9,10]
}

CV_rfc = GridSearchCV(estimator=RFReg, param_grid=param_grid, cv= 10)
CV_rfc.fit(X_train, y_train)

CV_rfc.best_params_ 
#{'max_depth': 10, 'n_estimators': 100}

在最大深度:10、n_估计器:100 上训练模型

RFReg = RandomForestRegressor(max_depth = 10, n_estimators = 100, random_state = 1)
RFReg.fit(X_train, y_train)
y_pred = RFReg.predict(X_test)
y_pred_train = RFReg.predict(X_train)

RMSE: 2.8139766730629394

我只是想要一些有关正确步骤的指导


一般来说,要调整超参数,您应该始终训练您的模型X_train,并使用X_test检查结果。您必须根据获得的结果调整参数X_test.

您永远不应该在整个数据集上调整超参数,因为这会破坏测试/训练分割的目的(正如您在问题3).

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

拟合sklearn GridSearchCV模型 的相关文章

  • sklearn DeprecationWarning 数组的真值

    从文档中运行 rasa core 示例 python3 m rasa core run d models dialogue u models nlu default current 并在对话框中的每条消息后获取此错误输出 sklearn D
  • 如何在 Windows 10 上使用 python 3.7 的 anaconda 包?

    我使用的是 Windows 10 Pro 64 位版本 我从此页面下载Anaconda3 2019 03 Windows x86 64 exe https www anaconda com distribution https www an
  • 如何修复 Apache mod_wsgi 的 Python 版本不匹配问题?

    我收到此错误 Thu Jul 12 14 31 36 2012 error python init Python version mismatch expected 2 6 7 found 2 6 8 当尝试启动 Apache 服务器时 在
  • Pandas 字符串提取所有匹配项

    我正在学习 pandas 系列字符串方法中的正则表达式操作 我能够从字符串中提取第一个数字 但我的正则表达式与第二个数字不匹配 如何捕获这两个数字 注意第二行 第二个元素在这里是 NAN CODE import pandas as pd d
  • 如何使用 django (python) 和 s3 上传文件?

    我正在寻找一种将文件上传到 s3 的方法 我正在使用 django 我目前正在使用亚马逊的 python 库进行上传以及以下代码 View def submitpicture request fuser request session lo
  • 重新索引错误没有意义

    I have DataFrames大小在 100k 到 2m 之间 我正在处理这个问题的框架是如此之大 但请注意 我必须对其他框架执行相同的操作 gt gt gt len data 357451 现在这个文件是通过编译许多文件创建的 所以它
  • Spyder 导入模块出错

    我正在尝试在 Spyder 中使用 sklearn 一开始 当我尝试导入它时 我收到 ImportError No module named sklearn 然后我用 PYTHONPATH 管理器设置 PATH 然后使用工具菜单中的 更新模
  • 如何为 C 分配的 numpy 数组注册析构函数?

    我想在 C C 中为 numpy 数组分配数字 并将它们作为 numpy 数组传递给 python 我可以做的PyArray SimpleNewFromData http docs scipy org doc numpy reference
  • 从主机名中提取域名

    是否有一种编程方式可以从给定的主机名查找域名 给出 gt www yahoo co jp 返回 gt yahoo co jp 有效但非常慢的方法是 拆分为 并从左侧删除 1 个组 使用 dnspython 加入并查询 SOA 记录 当返回有
  • 使用 boto3 从 s3 下载时使用 filename 作为文件名

    我正在使用 boto3 上传文件 如下所示 client boto3 client s3 aws access key id id aws secret access key key client upload file tmp test
  • 如何在Python中求和

    我想知道如何在 python 中表示总和而不需要像这样的循环here http docs scipy org doc scipy reference tutorial optimize html 我们有 def rosen x The Ro
  • 如何使用 xlrd 将新列和行添加到 .xls 文件

    如何向 xlrd 中的工作表添加新列和 或行 我有一个使用 open workbook 读取的 xls 文件 我需要在第一张表中添加一个新列 bouncebacks 然后在该表中添加新行 但我在 xlrd 文档中找不到任何显示如何添加新行和
  • 如何为 Python 中的应用程序设置专用屏幕区域?

    MS OneNote 就是一个很好的例子 它可以选择固定在屏幕的一侧 并将所有其他窗口推到一侧 当最大化或调整其他窗口大小时 它们只能扩展到 OneNote 的边缘 Python 使用 Tkinter 或其他模块是否具有此功能 感谢您的帮助
  • pandas to_sql sqlalchemy 与 secure_transport 的连接

    我正在尝试将数据发送到具有 require secure transport ON 的服务器上的 mysql 数据库 当我尝试使用以下代码连接到它时 import pandas as pd import pymysql from sqlal
  • 如何在交互式绘图(Python)中获得鼠标指向的(x,y)位置?

    我使用 ipython 笔记本 带有魔法 matplotlib nbagg 我正在审查matplotlib widget Cursor但仅查看光标widgets Cursor http matplotlib org 1 4 3 exampl
  • 如何在 Pytorch 中将一维 IntTensor 转换为 int

    如何将一维 IntTensor 转换为整数 这 IntTensor int 给出错误 KeyError Variable containing 423 torch IntTensor of size 1 我所知道的最简单 最干净的方法 In
  • 如何在 Sublime 2 REPL Mac 中运行 Python 3

    我的问题如下 我安装了 sublime 2 和 sublime repl 插件 一切正常 我唯一需要的是更改在控制台内置的 sublimerepl 上运行的 python 版本 我的意思是 我有 python 2 7 5 预先安装了 mav
  • 如何使用 pygame.mixer 重复音乐?

    我创建了以下使用 pygame mixer 播放 mp3 音乐的代码 然而 音乐不会重复 有什么想法可以让音乐重复播放吗 这是代码 playlist list playlist append put music here mp3 playl
  • 如何将 fields 参数传递到 Google Drive Python API 调用中

    I have results drive service files list body execute where body q query string maxResults 1 为了提高性能 我想限制返回的字段 如下所述 https
  • django admin 中内联模型的分页器

    我有这个简单的 django 模型 由一个传感器和特定传感器的值组成 每个日射强度计的值数量很多 gt 30k 是否可以以某种方式分页PyranometerValues在特定日期或一般情况下将分页器应用于管理内联视图 class Pyran

随机推荐

  • Salt Generation 和开源软件

    据我了解 生成盐的最佳实践是使用源代码中存储的一些神秘公式 甚至魔术常数 我正在开发一个计划作为开源发布的项目 但问题是源代码带来了生成盐的秘密公式 因此能够在我们的网站上运行彩虹表攻击 我认为很多人在我之前已经考虑过这个问题 我想知道最佳
  • 如何在Android应用程序中创建进度对话框?

    我正在开发应用程序以从互联网接收一些数据 同时接收我想要显示 进度对话框 的数据 我用了 异步任务 在我的应用程序中 问题是如何使用它以及如何显示百分比 如 100 请建议我并给我一些例子 谢谢你 对不起我的英语 要显示进度对话框 您可以使
  • 使用matlab保存函数

    是否可以在函数内使用 Matlab save 命令来存储工作区变量 考虑以下场景 我在 Matlab 工作区中有一堆变量 并且希望 mat 文件中所有以 a 和 b 开头的变量 当然这有效 save test mat a b 但我想要一个可
  • Vuejs:渲染后回调

    我有一个 Bootstrap 弹出窗口 我想将其附加到具有条件渲染的元素 因此 我必须在元素附加到 DOM 后触发 popover 有没有办法触发回调afterv if 语句将元素插入到 DOM 中 在 vuejs 2 中使用它 updat
  • 查找列表中 int 的索引

    有没有办法从列表中获取 int 的索引 寻找类似的东西list1 FindIndex 5 我想在列表中找到 5 的位置 Use the IndexOf 列表的方法 该方法的规范可以在MSDN http msdn microsoft com
  • Polars:在 read_csv 中一次指定所有列的数据类型

    In Polars https www pola rs 如何为中的所有列指定单一数据类型read csv 根据docs https pola rs github io polars py polars html reference api
  • Google 地图 API autocomplete.getPlace() 返回的几何图形不一致

    我在 AngularJS 应用程序中使用 GoogleMaps 自动完成功能 当我调用 autocomplete getPlace 当我尝试使用地方时 有一半的时间它说几何图形为空 一半的时间都有效 似乎无法弄清楚 我唯一的想法是我的代码在
  • 从 MCV2 视图中的模型集合中读取 DataAnnotations

    在我的 MVC2 AdminArea 中 我想为每个域模型创建一个概述表 我正在使用如下所示的 DataAnnotations 作为这些域模型对象的属性 DisplayName MyPropertyName public string Na
  • SQL 中聚合函数的除法行为不符合预期

    我正在尝试在 SQL Server 2008 R2 中做一些交叉表 这部分没问题 但是 如果我尝试获取每个单元格的百分比 我就会遇到问题 这是一个精炼的用例 一项调查 人们给出了他们最喜欢的颜色和最喜欢的水果 我想知道有多少人喜欢给定的水果
  • Strapi database.js / 多个数据库配置

    如果我在 database js 中运行 sqlite 则 Strapi 在本地工作 但如果我运行 postgres 则不行 我在网上发现我可以指定npm run develop使用 sqlite 生产应该使用 postgres 对于参考
  • 我的 iPhone 认为宽度为 980 像素

    我正在尝试创建一组三个很简单媒体查询来处理各种屏幕尺寸 经过一番绞尽脑汁之后 我得出了以下结论 media all and min width 0px and max width 480px styles here media all an
  • 在 WPF 中的标签 MouseHover 上显示按钮

    在我的应用程序中我有一个Startup Window其中包含 提示 信息等 窗口的一部分包含 3Labels左侧还有3个隐藏Buttons在右侧 我想要的是每当用户将鼠标悬停在其中之一上时Labels位于另一侧的按钮Label出现 我知道如
  • 动态添加时 Facebook 社交插件不显示

    我正在将 Facebook 社交插件添加到网页中 当我手动添加时 div class fb comments div 它可以工作 但是 当 javascript 代码添加它时 它不会 有任何想法吗 JS SDK 在初始化时会检查您的文档一次
  • Servlet 应用程序中的 Unicode 字符显示为问号

    最近我基于以下实现了国际化如何国际化 Java Web 应用程序 https stackoverflow com questions 4276061 how to internationalize a java web applicatio
  • RecyclerView.Adapter 中实现 getItemId() 的正确方法

    我有通用类 public abstract class BaseAdapter
  • jQuery:从另一个元素触发悬停事件

    当您将鼠标悬停在其中一个上时 div 我想要一个 a 也可以在页面的单独部分上 悬停 div class initiator div div a class Touch the div and I get hovered a div 我已经
  • 生成与 mysqldump 备份名称不同的数据库

    数据库 db 在 backup sql 中备份 有没有办法从与 db 名称不同的脚本恢复数据库 先感谢您 当然 当你导入它时 你会这样做 mysql uuser ppassword databasename lt mydump sql 你可
  • 使用 spring security 手动进行身份验证

    我正在使用 spring security 它工作正常 但现在我想手动启动安全过程 对我需要进入的客户端进行更改my控制器用户名和密码 表单不会直接调用 j spring security check 我想到了两种选择 我都遇到了一些问题
  • Rails:如何从 JSON 中提取值

    非常简单的问题 我是初学者 我有来自 fb 的 JSON 响应 其中包含名称和 ID name gt John Kline id gt 10276192 name gt Quinn Kumbers id gt 18093781 name g
  • 拟合sklearn GridSearchCV模型

    我正在尝试解决回归问题波士顿数据集 https www kaggle com c boston housing在 的帮助下随机森林回归器 https scikit learn org stable modules generated skl