拟合sklearn GridSearchCV模型

2024-01-14

我正在尝试解决回归问题波士顿数据集 https://www.kaggle.com/c/boston-housing在...的帮助下随机森林回归器 https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.RandomForestRegressor.html.我正在使用网格搜索简历 https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.GridSearchCV.html用于选择最佳超参数。

问题1

我应该适合吗GridSearchCV一些X_train, y_train然后得到最佳参数。

我应该戴上它吗X, y获得最佳参数。（X，y =整个数据集）

问题2

说如果我适合它X, y并获得最佳参数，然后在这些最佳参数上建立新模型。现在我应该如何训练这个新模型？

我应该训练新模型吗X_train, y_train or X, y.

问题3

如果我训练新模型X,y那么我将如何验证结果？

到目前为止我的代码

   #Dataframes
    feature_cols = ['CRIM','ZN','INDUS','NOX','RM','AGE','DIS','TAX','PTRATIO','B','LSTAT']

    X = boston_data[feature_cols]
    y = boston_data['PRICE']

训练测试数据分割

from sklearn.cross_validation import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X, y, random_state = 1)

网格搜索以获得最佳超参数

from sklearn.grid_search import GridSearchCV
param_grid = { 
    'n_estimators': [100, 500, 1000, 1500],
    'max_depth' : [4,5,6,7,8,9,10]
}

CV_rfc = GridSearchCV(estimator=RFReg, param_grid=param_grid, cv= 10)
CV_rfc.fit(X_train, y_train)

CV_rfc.best_params_ 
#{'max_depth': 10, 'n_estimators': 100}

在最大深度：10、n_估计器：100 上训练模型

RFReg = RandomForestRegressor(max_depth = 10, n_estimators = 100, random_state = 1)
RFReg.fit(X_train, y_train)
y_pred = RFReg.predict(X_test)
y_pred_train = RFReg.predict(X_train)

RMSE: 2.8139766730629394

我只是想要一些有关正确步骤的指导

一般来说，要调整超参数，您应该始终训练您的模型X_train，并使用X_test检查结果。您必须根据获得的结果调整参数X_test.

您永远不应该在整个数据集上调整超参数，因为这会破坏测试/训练分割的目的（正如您在问题3).

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

machinelearning

scikitlearn

RandomForest

Gridsearch

拟合sklearn GridSearchCV模型的相关文章

sklearn DeprecationWarning 数组的真值

从文档中运行 rasa core 示例 python3 m rasa core run d models dialogue u models nlu default current 并在对话框中的每条消息后获取此错误输出 sklearn D
如何在 Windows 10 上使用 python 3.7 的 anaconda 包？

我使用的是 Windows 10 Pro 64 位版本我从此页面下载Anaconda3 2019 03 Windows x86 64 exe https www anaconda com distribution https www an
如何修复 Apache mod_wsgi 的 Python 版本不匹配问题？

我收到此错误 Thu Jul 12 14 31 36 2012 error python init Python version mismatch expected 2 6 7 found 2 6 8 当尝试启动 Apache 服务器时在
Pandas 字符串提取所有匹配项

我正在学习 pandas 系列字符串方法中的正则表达式操作我能够从字符串中提取第一个数字但我的正则表达式与第二个数字不匹配如何捕获这两个数字注意第二行第二个元素在这里是 NAN CODE import pandas as pd d
如何使用 django (python) 和 s3 上传文件？

我正在寻找一种将文件上传到 s3 的方法我正在使用 django 我目前正在使用亚马逊的 python 库进行上传以及以下代码 View def submitpicture request fuser request session lo
重新索引错误没有意义

I have DataFrames大小在 100k 到 2m 之间我正在处理这个问题的框架是如此之大但请注意我必须对其他框架执行相同的操作 gt gt gt len data 357451 现在这个文件是通过编译许多文件创建的所以它
Spyder 导入模块出错

我正在尝试在 Spyder 中使用 sklearn 一开始当我尝试导入它时我收到 ImportError No module named sklearn 然后我用 PYTHONPATH 管理器设置 PATH 然后使用工具菜单中的更新模
如何为 C 分配的 numpy 数组注册析构函数？

我想在 C C 中为 numpy 数组分配数字并将它们作为 numpy 数组传递给 python 我可以做的PyArray SimpleNewFromData http docs scipy org doc numpy reference
从主机名中提取域名

是否有一种编程方式可以从给定的主机名查找域名给出 gt www yahoo co jp 返回 gt yahoo co jp 有效但非常慢的方法是拆分为并从左侧删除 1 个组使用 dnspython 加入并查询 SOA 记录当返回有
使用 boto3 从 s3 下载时使用 filename 作为文件名

我正在使用 boto3 上传文件如下所示 client boto3 client s3 aws access key id id aws secret access key key client upload file tmp test
如何在Python中求和

我想知道如何在 python 中表示总和而不需要像这样的循环here http docs scipy org doc scipy reference tutorial optimize html 我们有 def rosen x The Ro
如何使用 xlrd 将新列和行添加到 .xls 文件

如何向 xlrd 中的工作表添加新列和或行我有一个使用 open workbook 读取的 xls 文件我需要在第一张表中添加一个新列 bouncebacks 然后在该表中添加新行但我在 xlrd 文档中找不到任何显示如何添加新行和
如何为 Python 中的应用程序设置专用屏幕区域？

MS OneNote 就是一个很好的例子它可以选择固定在屏幕的一侧并将所有其他窗口推到一侧当最大化或调整其他窗口大小时它们只能扩展到 OneNote 的边缘 Python 使用 Tkinter 或其他模块是否具有此功能感谢您的帮助
pandas to_sql sqlalchemy 与 secure_transport 的连接

我正在尝试将数据发送到具有 require secure transport ON 的服务器上的 mysql 数据库当我尝试使用以下代码连接到它时 import pandas as pd import pymysql from sqlal
如何在交互式绘图（Python）中获得鼠标指向的（x，y）位置？

我使用 ipython 笔记本带有魔法 matplotlib nbagg 我正在审查matplotlib widget Cursor但仅查看光标widgets Cursor http matplotlib org 1 4 3 exampl
如何在 Pytorch 中将一维 IntTensor 转换为 int

如何将一维 IntTensor 转换为整数这 IntTensor int 给出错误 KeyError Variable containing 423 torch IntTensor of size 1 我所知道的最简单最干净的方法 In
如何在 Sublime 2 REPL Mac 中运行 Python 3

我的问题如下我安装了 sublime 2 和 sublime repl 插件一切正常我唯一需要的是更改在控制台内置的 sublimerepl 上运行的 python 版本我的意思是我有 python 2 7 5 预先安装了 mav
如何使用 pygame.mixer 重复音乐？

我创建了以下使用 pygame mixer 播放 mp3 音乐的代码然而音乐不会重复有什么想法可以让音乐重复播放吗这是代码 playlist list playlist append put music here mp3 playl
如何将 fields 参数传递到 Google Drive Python API 调用中

I have results drive service files list body execute where body q query string maxResults 1 为了提高性能我想限制返回的字段如下所述 https
django admin 中内联模型的分页器

我有这个简单的 django 模型由一个传感器和特定传感器的值组成每个日射强度计的值数量很多 gt 30k 是否可以以某种方式分页PyranometerValues在特定日期或一般情况下将分页器应用于管理内联视图 class Pyran

随机推荐

Salt Generation 和开源软件

据我了解生成盐的最佳实践是使用源代码中存储的一些神秘公式甚至魔术常数我正在开发一个计划作为开源发布的项目但问题是源代码带来了生成盐的秘密公式因此能够在我们的网站上运行彩虹表攻击我认为很多人在我之前已经考虑过这个问题我想知道最佳
如何在Android应用程序中创建进度对话框？

我正在开发应用程序以从互联网接收一些数据同时接收我想要显示进度对话框的数据我用了异步任务在我的应用程序中问题是如何使用它以及如何显示百分比如 100 请建议我并给我一些例子谢谢你对不起我的英语要显示进度对话框您可以使
使用matlab保存函数

是否可以在函数内使用 Matlab save 命令来存储工作区变量考虑以下场景我在 Matlab 工作区中有一堆变量并且希望 mat 文件中所有以 a 和 b 开头的变量当然这有效 save test mat a b 但我想要一个可
Vuejs：渲染后回调

我有一个 Bootstrap 弹出窗口我想将其附加到具有条件渲染的元素因此我必须在元素附加到 DOM 后触发 popover 有没有办法触发回调afterv if 语句将元素插入到 DOM 中在 vuejs 2 中使用它 updat
查找列表中 int 的索引

有没有办法从列表中获取 int 的索引寻找类似的东西list1 FindIndex 5 我想在列表中找到 5 的位置 Use the IndexOf 列表的方法该方法的规范可以在MSDN http msdn microsoft com
Polars：在 read_csv 中一次指定所有列的数据类型

In Polars https www pola rs 如何为中的所有列指定单一数据类型read csv 根据docs https pola rs github io polars py polars html reference api
Google 地图 API autocomplete.getPlace() 返回的几何图形不一致

我在 AngularJS 应用程序中使用 GoogleMaps 自动完成功能当我调用 autocomplete getPlace 当我尝试使用地方时有一半的时间它说几何图形为空一半的时间都有效似乎无法弄清楚我唯一的想法是我的代码在
从 MCV2 视图中的模型集合中读取 DataAnnotations

在我的 MVC2 AdminArea 中我想为每个域模型创建一个概述表我正在使用如下所示的 DataAnnotations 作为这些域模型对象的属性 DisplayName MyPropertyName public string Na
SQL 中聚合函数的除法行为不符合预期

我正在尝试在 SQL Server 2008 R2 中做一些交叉表这部分没问题但是如果我尝试获取每个单元格的百分比我就会遇到问题这是一个精炼的用例一项调查人们给出了他们最喜欢的颜色和最喜欢的水果我想知道有多少人喜欢给定的水果
Strapi database.js / 多个数据库配置

如果我在 database js 中运行 sqlite 则 Strapi 在本地工作但如果我运行 postgres 则不行我在网上发现我可以指定npm run develop使用 sqlite 生产应该使用 postgres 对于参考
我的 iPhone 认为宽度为 980 像素

我正在尝试创建一组三个很简单媒体查询来处理各种屏幕尺寸经过一番绞尽脑汁之后我得出了以下结论 media all and min width 0px and max width 480px styles here media all an
在 WPF 中的标签 MouseHover 上显示按钮

在我的应用程序中我有一个Startup Window其中包含提示信息等窗口的一部分包含 3Labels左侧还有3个隐藏Buttons在右侧我想要的是每当用户将鼠标悬停在其中之一上时Labels位于另一侧的按钮Label出现我知道如
动态添加时 Facebook 社交插件不显示

我正在将 Facebook 社交插件添加到网页中当我手动添加时 div class fb comments div 它可以工作但是当 javascript 代码添加它时它不会有任何想法吗 JS SDK 在初始化时会检查您的文档一次
Servlet 应用程序中的 Unicode 字符显示为问号

最近我基于以下实现了国际化如何国际化 Java Web 应用程序 https stackoverflow com questions 4276061 how to internationalize a java web applicatio
RecyclerView.Adapter 中实现 getItemId() 的正确方法

我有通用类 public abstract class BaseAdapter
jQuery：从另一个元素触发悬停事件

当您将鼠标悬停在其中一个上时 div 我想要一个 a 也可以在页面的单独部分上悬停 div class initiator div div a class Touch the div and I get hovered a div 我已经
生成与 mysqldump 备份名称不同的数据库

数据库 db 在 backup sql 中备份有没有办法从与 db 名称不同的脚本恢复数据库先感谢您当然当你导入它时你会这样做 mysql uuser ppassword databasename lt mydump sql 你可
使用 spring security 手动进行身份验证

我正在使用 spring security 它工作正常但现在我想手动启动安全过程对我需要进入的客户端进行更改my控制器用户名和密码表单不会直接调用 j spring security check 我想到了两种选择我都遇到了一些问题
Rails：如何从 JSON 中提取值

非常简单的问题我是初学者我有来自 fb 的 JSON 响应其中包含名称和 ID name gt John Kline id gt 10276192 name gt Quinn Kumbers id gt 18093781 name g
拟合sklearn GridSearchCV模型

我正在尝试解决回归问题波士顿数据集 https www kaggle com c boston housing在的帮助下随机森林回归器 https scikit learn org stable modules generated skl

拟合sklearn GridSearchCV模型

拟合sklearn GridSearchCV模型 的相关文章

随机推荐

热门标签

拟合sklearn GridSearchCV模型的相关文章