每次使用 scikit 运行线性回归时都会得到不同的结果

2024-04-24

您好，我有一个正在尝试优化的线性回归模型。我正在优化指数移动平均线的跨度以及回归中使用的滞后变量的数量。

然而，我不断发现结果和计算的均方误差不断得出不同的最终结果。不知道为什么有人可以帮忙？

启动循环后的流程： 1. 使用三个变量创建新的数据框 2. 删除nil值 3. 为每个变量创建 ewma 4. 为每个变量创建滞后 5. 删除 NA 6. 创建 X,y 7. 如果 MSE 更好，则回归并保存 ema 跨度和滞后数 8. 使用下一个值开始循环

我知道这可能是一个需要交叉验证的问题，但由于它可能是一个程序化的问题，所以我在这里发布了：

bestema = 0
bestlag = 0
mse = 1000000

for e in range(2, 30):
    for lags in range(1, 20):
        df2 = df[['diffbn','diffbl','diffbz']]
        df2 = df2[(df2 != 0).all(1)]        
        df2['emabn'] = pd.ewma(df2.diffbn, span=e)
        df2['emabl'] = pd.ewma(df2.diffbl, span=e)
        df2['emabz'] = pd.ewma(df2.diffbz, span=e)
        for i in range(0,lags):
            df2["lagbn%s" % str(i+1)] = df2["emabn"].shift(i+1)
            df2["lagbz%s" % str(i+1)] = df2["emabz"].shift(i+1)
            df2["lagbl%s" % str(i+1)] = df2["emabl"].shift(i+1)
        df2 = df2.dropna()
        b = list(df2)
            #print(a)
        b.remove('diffbl')
        b.remove('emabn')
        b.remove('emabz')
        b.remove('emabl')
        b.remove('diffbn')
        b.remove('diffbz')
        X = df2[b]
        y = df2["diffbl"]
        X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3)
        #print(X_train.shape)
        regr = linear_model.LinearRegression()
        regr.fit(X_train, y_train)
        if(mean_squared_error(y_test,regr.predict(X_test)) < mse):
            mse = mean_squared_error(y_test,regr.predict(X_test) ** 2)
            #mse = mean_squared_error(y_test,regr.predict(X_test))
            bestema = e
            bestlag = lags
            print(regr.coef_)
            print(bestema)
            print(bestlag)
            print(mse)

The train_test_splitsklearn 中的函数（参见文档：http://scikit-learn.org/stable/modules/ generated/sklearn.cross_validation.train_test_split.html http://scikit-learn.org/stable/modules/generated/sklearn.cross_validation.train_test_split.html）是随机的，因此每次都会得到不同的结果是合乎逻辑的。
您可以将参数传递给random_state关键字每次都相同。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

每次使用 scikit 运行线性回归时都会得到不同的结果的相关文章

自 1.4.0 版本以来，sphinx_rtd_theme 不再是硬依赖项

C Users Administrator Desktop item code serv documents api gt 制作 html 运行 Sphinx v1 6 2 加载腌制环境失败无法获取属性 WarningStream
SQLAlchemy 闭包表关系定义

我最近开始使用 SQL Alchemy 开展一个涉及攀岩区域和路线的项目区域是分层的因为单个区域可以包含多个区域而多个区域又可以包含其他区域路线直接与单个区域关联但也与该区域的父区域关联等等为了实现这一点我选择使用Bill
Keras AttributeError：“顺序”对象没有属性“predict_classes”

我试图按照本指南找到模型性能指标 F1 分数准确性召回率 https machinelearningmastery com how to calculate precision recall f1 and more for deep l
使用数据库数据模型生成 SQLAlchemy 模型、架构和 JSON 响应

将 Flask 和 SQLAlchemy 用于 Python Web 应用程序我的目标是创建一个系统在其中我可以从现有 PostgreSQL 数据库导入数据模型并将它们映射到相应 SQLAlchemy 模型中的字段使用这些 SQL
Pytorch“展开”等价于 Tensorflow [重复]

这个问题在这里已经有答案了假设我有大小为 50 50 的灰度图像在本例中批量大小为 2 并且我使用 Pytorch Unfold 函数如下所示 import numpy as np from torch import nn from
Keras 中的 Tensorflow 自定义损失函数 - 张量循环

我正在尝试在 Keras 中编写自定义损失函数如下所示 Keras 中的自定义损失函数 https stackoverflow com questions 43818584 custom loss function in keras 我的
如何读取 10 位原始图像？其中包含 RGB-IR 数据

我想知道如何从我的 10 位原始它有 rgb ir 图像数据数据中提取 RGB 图像如何使用 Python 或 MATLAB 进行阅读拍摄时的相机分辨率为 1280x720 室内照片图片下载 https drive google c
向 list.extend() 传递不可迭代对象

我正在创建一个公共方法来允许调用者将值写入设备例如将其称为 write vals 由于这些值将实时输入因此我希望通过允许用户输入列表或单个值来简化用户的生活具体取决于他们需要写入的值的数量例如 write to device 1 2
无法写入文本文件

我正在运行一些测试并需要写入文件当我运行测试时open file r 不写入文件测试脚本如下 class GetDetailsIP TestGet def runTest self self category PTZ try This
Python 2to3 Windows CMD

我已经安装了 python 32 包到 C python32 我还设置了路径 Python 路径 C Python32 Lib C Python32 DLLs C Python32 Lib lib tk 路径 C Python32 我想使用
PySide2/QML 填充 Gridview 模型/委托并为其设置动画

我是 QML 的新手正在寻求以下几点帮助如何基于 TextField 输入如 Regex 通过 PySide2 过滤 Gridview 模型中的 QAbstractListModel 数据标题如何在鼠标悬停时为 Gridview
Python：从字符串访问变量[重复]

这个问题在这里已经有答案了这可能是非常基本和简单的事情我可能只是在谷歌上搜索错误的术语但希望这里有人可以帮助我我仍然是编程的初学者这从这个问题中可能是显而易见的我正在寻找一种从字符串访问变量的方法像这样 A1 B1 C1 my
是否可以将 SpaCy 安装到 Raspberry Pi 4 Raspbian Buster

我一整天都在安装 SpaCy sudo pip install U spacy Looking in indexes https pypi org simple https www piwheels org simple Collectin
返回 OSError 异常类的子类实例的逻辑在哪里？

我一直在寻找一些对某些人来说可能相对愚蠢的东西但对我来说非常有趣输入和输出错误已合并为OSError在 Python 3 3 中异常类层次结构发生了变化关于内置类的一个有趣的特性OSError是这样它在传递时返回它的子类errno
如何用不同的颜色填充seaborn.distplot中的区域

是否可以用颜色填充两条阈值线 line1 和 line2 之外的区域并通过 distplot 绘制的 KDE 曲线限制 Y 轴代表我的应用程序的 3 sigmas import pylab as pl import seaborn as
随机数生成器每次仅返回一个数字

Python 是否有一个随机数生成器每次只返回一个随机整数next 函数被调用数字不应该重复并且生成器应返回区间内的随机整数 1 1 000 000 这是独一无二的我需要生成超过一百万个不同的数字这听起来好像非常消耗内存以防所有数
在 matplotlib 中添加新的导航模式

我正在编写一个 wx matplotlib 应用程序并且在向 matplotlib 导航工具栏添加新工具时遇到相当大的困难基本上我想添加选择工具选取框套索等以切换受控子图的鼠标模式到目前为止我还没有找到任何功能可以让我轻松地做
使用 PyODBC 选择表中的列名

我正在编写一个 Python 程序该程序使用 PyODBC 从 Microsoft Access mdb 文件中选择一些数据我需要发现几个不同表的列名在 SQL Server 中这可以通过使用类似的查询来完成 SELECT c na
如何从已安装的云端硬盘文件夹中永久删除？

我编写了一个脚本在每次迭代后将我的模型和训练示例上传到 Google Drive 以防发生崩溃或任何阻止笔记本运行的情况如下所示 drive path drive My Drive Colab Notebooks models if p
无法比较类型“ndarray(dtype=int64)”和“str”

Example of data that I want to replace 数据具有以下属性购买 V 高高中低维持 V 高高中低门 2 3 4 5 更多 2 4人以上 lug boot 小中大安全性低中高这就是

随机推荐

如何知道jar文件是否已经在运行？

经过谷歌研究后我找到了很好的答案例如 1 using jps or jps l让 jars 在 JVM 下运行这个答案可以但是如果用户根本没有安装java并且我使用例如 bat文件和带有java JRE的文件夹运行我的jar 另外
update_attributes 未保存到数据库

提交表单后正确的自定义参数显示在我的调试函数中但当我进入控制台时显示默认参数控制器 def update current user update attributes params user flash success Your se
如何在 RegionManager 中注册用户控件或控件模板内的区域？

我在用IRegionManager要加载并导航到视图我可以将内容加载到主视图中的主区域该主视图加载了引导程序类但我无法将内容加载到已加载视图内的区域区域管理器似乎没有注册这些地区我的引导程序类 protected override
事务 1 已在 MongoDB 中提交

我正在尝试使用事务来更新多个文档一种是加载表单文档 await Sheet save session 另一个是库存预订记录数组 await Stock bulkWrite const session await mongoose star
非调试模式下的 Django Whitenoise 500 服务器错误

我在本地机器上使用 django 为了提供静态文件我使用了 WhiteNoise 什么时候DEBUG True所有静态文件均已正确提供但当我改变了DEBUG False并设置ALLOWED HOSTS 我收到 500 服务器错误但是管
应用程序日志保存在哪里？ [复制]

这个问题在这里已经有答案了可能的重复 Windows 上应用程序日志文件的存储位置 https stackoverflow com questions 1572934 where to store an application log f
拖放到文件输入在 IE11 中不起作用

谁能回答我为什么拖放字段在 chrome 和 firefox 中工作正常但在 IE11 中不起作用当我从桌面拖放文件时 IE11 只是打开文件 IE版本 11 545 10586 0 HTML
是否可以使用 Rosyln 或 Resharper 来检测可能的 DivideByZero 情况？

我正在尝试确定是否有一种编程方式来检查可能的情况DivideByZeroException在我的代码库中我的代码库包含一系列相对简单到相对复杂的公式大约有 1500 个并且还在不断增加编写新公式时必须注意确保安全地进行除法以避免
如何在 C# 库中创建全局对象[重复]

这个问题在这里已经有答案了可能的重复使整个应用程序可以访问数据可能在运行时发生变化的最佳方法是什么 https stackoverflow com questions 11781131 best way to make data t
由于 bs4 与 BeautifulSoup 导致的导入错误

我正在尝试使用beautifulsoup兼容的lxml它给了我一个错误 from lxml html soupparser import fromstring Traceback most recent call last File
Flutter 启动画面不适用于 launch_background.xml

我似乎无法显示自己的启动屏幕每次启动应用程序时都会显示默认的空白启动屏幕即使我已在其中设置了所有内容launch background xml和其他文件res 我还设置了所有相关的图标drawable and mipmap 启动背景
将图像保存在 watir-webdriver 中

我需要将图像从 recaptcha 保存到本地主机磁盘我使用 watir webdriver 获取图像 dom 元素但它不支持保存方法如 watir 那样那么如何将图像保存到我的磁盘上呢网页 div style width 300
Webpack 2 的语义 UI 问题

一直在努力使用 Webpack 2 进行语义 ui 设置我遇到了一些与默认语义 ui 主题中的字体相关的错误以及另一个关于image webpack loader ERROR in css loader lessPlugins opti
无论如何，使用javascript（或类似jquery）获取图像文件大小[重复]

这个问题在这里已经有答案了 like img src http www google com intl en ALL images srpr logo1w png 我想要得到 logo1w png 文件大小 7 3kb 如何实施您可以对图
LocationManager requestLocationUpdates minTime OR minDistance

我用的是安卓系统LocationManager及其方法requestLocationUpdates像这样 locationManager requestLocationUpdates LocationManager GPS PROVIDER
Michael Hartl 的 Ruby on Rails 教程。第 9 章测试失败

我是一名正在学习 Michael Hartl Ruby on Rails 教程的新手在第 9 章的测试中有几个失败的项目运行 RSPEC 测试返回 sis macbook pro sample app Lagaspi bundle ex
使用 Visual Studio 测试运行器运行的 xUnit 测试的输出未显示在输出窗口中

我创建了一个新的 NET Core 类库项目名为FooBarBaz 然后我使用包管理器控制台来运行 Install Package xunit xunit Install Package xunit xunit runners visua
将 R 与 Jupyter 笔记本安装结合使用

我已经从官方网站安装了 R 并想从 jupyter notebook 和 jupyterlab 中使用它为此我使用以下命令在 R 中安装了 IRkernal install packages IRkernel 然后当我输入时IRkern
如何检查YML语法是否正确（gitlab.yml）

GitLab 服务器无法启动 https stackoverflow com questions 17690321 bitnami gitlab 5 2 0 gitlab sidekiq not running and could not
每次使用 scikit 运行线性回归时都会得到不同的结果

您好我有一个正在尝试优化的线性回归模型我正在优化指数移动平均线的跨度以及回归中使用的滞后变量的数量然而我不断发现结果和计算的均方误差不断得出不同的最终结果不知道为什么有人可以帮忙启动循环后的流程 1 使用三个变量创建新的数据框

每次使用 scikit 运行线性回归时都会得到不同的结果

每次使用 scikit 运行线性回归时都会得到不同的结果 的相关文章

随机推荐

热门标签

每次使用 scikit 运行线性回归时都会得到不同的结果的相关文章