sklearn：用户定义的时间序列数据交叉验证

2023-12-22

我正在尝试解决机器学习问题。我有一个特定的数据集时间序列元素。对于这个问题，我使用著名的 python 库 -sklearn。这个库中有很多交叉验证迭代器。还有几个迭代器用于您自己定义交叉验证。问题是我真的不知道如何定义时间序列的简单交叉验证。这是我想要得到的一个很好的例子：

假设我们有几个时期（年），并且希望将数据集分成几个块，如下所示：

data = [1, 2, 3, 4, 5, 6, 7]

train: [1]                test: [2] (or test: [2, 3, 4, 5, 6, 7])
train: [1, 2]             test: [3] (or test: [3, 4, 5, 6, 7])
train: [1, 2, 3]          test: [4] (or test: [4, 5, 6, 7])
...
train: [1, 2, 3, 4, 5, 6] test: [7]

我真的不明白如何使用 sklearn 工具创建这种交叉验证。也许我应该使用PredefinedSplit from sklearn.cross_validation像那样：

train_fraction  = 0.8
train_size      = int(train_fraction * X_train.shape[0])
validation_size = X_train.shape[0] - train_size

cv_split = cross_validation.PredefinedSplit(test_fold=[-1] * train_size + [1] * validation_size)

Result:

train: [1, 2, 3, 4, 5] test: [6, 7]

但仍然不如之前的数据分割那么好

您无需使用即可获得所需的交叉验证分割sklearn。这是一个例子

import numpy as np

from sklearn.svm import SVR
from sklearn.feature_selection import RFECV

# Generate some data.
N = 10
X_train = np.random.randn(N, 3)
y_train = np.random.randn(N)

# Define the splits.
idxs = np.arange(N)
cv_splits = [(idxs[:i], idxs[i:]) for i in range(1, N)]

# Create the RFE object and compute a cross-validated score.
svr = SVR(kernel="linear")
rfecv = RFECV(estimator=svr, step=1, cv=cv_splits)
rfecv.fit(X_train, y_train)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

scikitlearn

crossvalidation

sklearn：用户定义的时间序列数据交叉验证的相关文章

如何在多进程系统中实现锁定？

我们正在并行运行许多詹金斯项目我们使用 python 并且选择使用 pyenv 管理虚拟环境不幸的是 pyenv 有一个众所周知的竞争条件 https github com yyuu pyenv issues 174 为了解决这个问题
如何使用 Python 3 绕过 HTTP Error 403: Forbidden with urllib.request

您好不是每次都这样但有时在尝试访问 LSE 代码时我会收到每一个烦人的 HTTP 错误 403 禁止消息任何人都知道我如何仅使用标准 python 模块来克服这个问题遗憾的是没有漂亮的汤 import urllib request
此 TypeError 消息中提到的“代码对象”是什么？

在尝试使用Python时exec声明我收到以下错误 TypeError exec arg 1 must be a string file or code object 我不想传递字符串或文件但什么是代码对象如何创建一个创建代码对象的
从文本文件中删除特定字符

我对 Python 和编码都很陌生我当时正在做一个小项目但遇到了一个问题 44 1 6 23 2 7 49 2 3 53 2 1 68 1 6 71 2 7 我只需要从每行中删除第三个和第六个字符或者更具体地说从整个文件中删除字符
Virtualenv 在 OS X Yosemite 上失败并出现 OSError

我最近更新到 OSX Yosemite 现在无法使用virtualenv pip 每当我执行 virtualenv env 它抛出一个 OSError Command Users administrator ux env bin pytho
如何返回 cost, grad 作为 scipy 的 fmin_cg 函数的元组

我怎样才能使 scipy 的fmin cg使用一个返回的函数cost and gradient作为元组问题是有f对于成本和fprime对于梯度我可能必须执行两次操作非常昂贵 grad and cost被计算此外在它们之间共享变量可
Mypy 无法从文字列表推断项目的类型

我有一个变量x和一个文字列表例如 0 1 2 我想转换x这些文字之一如果x在列表中我将其退回否则我返回一个后备值 from typing import Literal Set Foo Literal 0 1 2 foos Set F
是否可以从 Julia 调用 Python 函数并返回其结果？

我正在使用 Python 从网络上抓取数据我想使用这些数据在 Julia 中运行计算是否可以在 Julia 中调用该函数并返回其结果或者我最好直接导出到 CSV 并以这种方式加载数据绝对地看PyCall jl https gith
无法在 selenium 和 requests 之间传递 cookie，以便使用后者进行抓取

我用 python 结合 selenium 编写了一个脚本来登录网站然后从driver to requests这样我就可以继续使用requests进行进一步的活动 I used item soup select one div class
协程从未被等待

我正在使用一个简单的上下文管理器其中包含一个异步循环 class Runner def init self self loop asyncio get event loop def enter self return self def e
运行 Python 单元测试，以便成功时不打印任何内容，失败时仅打印 AssertionError()

我有一个标准单元测试格式的测试模块 class my test unittest TestCase def test 1 self tests def test 2 self tests etc 我的公司有一个专有的测试工具它将作为命令行
给定一个排序数组，就地删除重复项，使每个元素仅出现一次并返回新长度

完整的问题我开始在线学习 python 但对这个标记为简单的问题有疑问给定一个排序数组就地删除重复项使得每个元素只出现一次并返回新的长度不分配另一个数组的额外空间您必须通过修改输入来完成此操作数组就地具有 O 1 额外内
如何查找或安装适用于 Python 的主题 tkinter ttk

过去 3 个月我一直在制作一个机器人仅用代码就可以完美运行现在我的下一个目标是为它制作一个 GUI 但是我发现了一些障碍主要的一个是能够看起来不像一个 30 年前的程序我使用的是 Windows 7 我仅使用 Python 3 3
在Raspberry pi上升级skimage版本

我已经使用 Raspberry Pi 2 上的 synaptic 包管理器安装了 python 包然而 skimage 模块版本 0 6 是 synaptic 中最新的可用版本有人可以指导我如何将其升级到0 11 因为旧版本中缺少某些功
使用另一个数据帧在数据帧中创建子列

我对 python 和 pandas 很陌生在这里我有一个以下数据框 did features offset word JAPE feature manual feature 0 200 0 aa 200 200 0 200 11 bf
检测是否从psycopg2游标获取？

假设我执行以下命令 insert into hello username values me 我跑起来就像 cursor fetchall 我收到以下错误 psycopg2 ProgrammingError no results to fe
使用 PIL 在 Tkinter 中显示动画 GIF

我正在尝试制作一个程序来使用 Tkinter 显示动画 GIF 这是我最初使用的代码 from future import division Just because division doesn t work right in 2 7 4
Django 管理器链接

我想知道是否有可能如果可以的话如何将多个管理器链接在一起以生成受两个单独管理器影响的查询集我将解释我正在研究的具体示例我有多个抽象模型类用于为其他模型提供小型的特定功能其中两个模型是DeleteMixin 和GlobalMix
将 Keras 集成到 SKLearn 管道？

我有一个 sklearn 管道对异构数据类型布尔分类数字文本执行特征工程并想尝试使用神经网络作为我的学习算法来拟合模型我遇到了输入数据形状的一些问题我想知道我想做的事情是否可能或者我是否应该尝试不同的方法我尝试了几种不
用于插入或替换 URL 参数的 Django 模板标签

有人知道 Django 模板标签可以获取当前路径和查询字符串并插入或替换查询字符串值吗例如向 some custom path q how now brown cow page 3 filter person 发出请求电话 urlpar

随机推荐

实体框架和使用 WCF 服务

我正在获取隐藏在 WCF 服务后面的数据库的数据在我有来自 Web 服务的自定义对象的场景中是否可以使用实体框架无法访问外部数据库当前没有插入更新删除逻辑的计划从空的 EF 模型开始并添加一个实体我在编译时收到此错误没有为
如何使用 Spring Security 3.1 更改当前用户的登录名？

我要求每个用户在保持登录状态时都可以更改自己的用户名问题是如何更新用户名 Principal 在 Spring Security 的身份验证令牌中我必须更新它因为我在某些业务用例中使用身份验证令牌中的主体名称来识别用户我使用基于表单
字节从 py2 到 py3 的行为变化

讨论发生后我很好奇这个问题 https stackoverflow com questions 18616657 how to encode integer in to base64 string in python 3 看来的行为byt
为什么在运行时更改 LD_LIBRARY_PATH 不会在加载可执行文件后反映到可执行文件上

我正在尝试改变LD LIBRARY PATH来自我的 C 程序我可以使用它来获取它的值getenv LD LIBRARY PATH 并使用设置其值setenv http man7 org linux man pages man3 sete
如何使用 MinGW 创建微型 PE (Win32) 可执行文件

我有以下 C 程序 include
如何在执行脚本之前自动清除 VSCode 中的终端？ [复制]

这个问题在这里已经有答案了我目前正在使用 VS Code 来学习 Python 所以我必须每分钟运行 10 15 次脚本只是做一些小的编辑并学习所有的东西我正在 VS code 的集成终端中运行脚本所以显然终端变得非常混乱我必须始
Anaconda 与 Python 有何关系？

我是初学者我想学习计算机编程所以现在我已经开始自学Python 并掌握了一些C和Fortran编程的知识现在我已经安装了Python 3 6 0版本并且我一直在努力寻找合适的文本来学习这个版本的Python 甚至在线讲座系列也要
类型转换和类型转换之间的区别？ [复制]

这个问题在这里已经有答案了可能的重复铸造和转换之间有什么区别 https stackoverflow com questions 3166840 what is the difference between casting and co
将配置文件的内容读取到与其关联的 dll 中

我已将字符串保存在 dll 应用程序的设置中我想找回它们这是我的 dll 的配置文件
如果已命中断点 A，则启用断点 B

我经常发现自己在代码中的某处设置断点 A 并在命中断点时手动启用一个或多个断点一个典型的情况是当我正在调试单元测试并且不关心前面的测试时 void testAddZeros Number a 0 Number b 0 Number res
给定 WSDL 的 Web 服务客户端

我正在尝试用 Java 创建一个 Web 服务客户端我不知道该怎么做这是 WSDL 的 URL https testservices gatewayedi com PayerList payerlist asmx wsdl https
合并多列，排除空值

我试图弄清楚如何组合多个列不包括 NA 值输入数据框 data lt data frame id c 1 3 Item1 c Egg Item2 c Chicken Flour Item3 c Bread Item4 c Milk 所需
docker 中的 Plotly dash 不加载资源

我有一个多页破折号应用程序在本地运行时可以按预期工作女服务员服务 listen 0 0 0 0 80 web app wsgi application 因此资产文件夹中的所有资产都正确加载图像加载了src app get asset
有没有更好的方法来计算中位数（而不是平均值）

假设我有以下表定义 CREATE TABLE x i serial primary key value integer not null 我想计算的中位数value 不是AVG 中位数是将集合分为包含相同数量元素的两个子集的值如果元素个数
Tensorflow Callback：如何将最佳模型保存在内存而不是磁盘上

我使用 Tensorflow 使用以下函数进行回归 import tensorflow as tf def ff args kwargs model tf keras models Sequential model add tf keras
jQuery 对象和 DOM 元素

我想了解 jQuery 对象和 DOM 元素之间的关系当 jQuery 返回一个元素时它显示为 object Object 在警报中什么时候getElementByID返回一个显示为的元素 object HTMLDivElement
重载+以支持元组

我希望能够用 python 写这样的东西 a 1 2 b 3 4 c a b c would be 4 6 d 3 b d would be 9 12 我意识到您可以重载运算符以与自定义类一起使用但是有没有办法重载运算符以与对一起使用当
在 Linux 中查找最小文件的名称？

假设您必须找到目录中第四小的非隐藏文件的名称执行此操作的正确命令是什么假设我是一个只知道的人ls l head tail line and awk print 陈述 From man ls S按大小降序对输出进行排序 r反转输出的顺
Thread.sleep() 停止我的绘画？

我正在制作一个程序尝试为一张在屏幕上移动的卡片设置动画就像您实际上从桌子上绘制它一样这是动画的代码 public void move int x int y int curX this x the entire class exten
sklearn：用户定义的时间序列数据交叉验证

我正在尝试解决机器学习问题我有一个特定的数据集时间序列元素对于这个问题我使用著名的 python 库 sklearn 这个库中有很多交叉验证迭代器还有几个迭代器用于您自己定义交叉验证问题是我真的不知道如何定义时间序列的简单交叉验证

sklearn：用户定义的时间序列数据交叉验证

sklearn：用户定义的时间序列数据交叉验证 的相关文章

随机推荐

热门标签

sklearn：用户定义的时间序列数据交叉验证的相关文章