为什么 sklearn.feature_selection.RFECV 每次运行给出不同的结果

2023-11-30

我尝试进行特征选择RFECV但每次都会给出不同的结果，交叉验证是将样本 X 划分为随机块还是顺序确定性块？

另外，为什么分数不同grid_scores_ and score(X,y)？为什么分数有时是负数？

交叉验证是否将样本 X 划分为随机块或顺序确定性块？

CV 默认将数据划分为确定性块。您可以通过将 shuffle 参数设置为 True 来更改此行为。

然而，RFECV uses sklearn.model_selection.StratifiedKFold如果 y 是二元或多类。

这意味着它将分割数据，使每个折叠具有相同（或几乎相同的类比例）。为了做到这一点，每个折叠中的确切数据在 CV 的不同迭代中可能会略有变化。然而，这不应导致数据发生重大变化。

如果您使用 cv 参数传递 CV 迭代器，则可以通过指定随机状态来修复分割。随机状态与算法做出的随机决策相关。每次使用相同的随机状态将确保相同的行为。

另外，为什么 grid_scores_ 和 Score(X,y) 的分数不同？

grid_scores_ 是交叉验证分数的数组。 grid_scores_[i] 是第 i 次迭代的交叉验证分数。这意味着第一个分数是所有特征的分数，第二个分数是删除一组特征时的分数，依此类推。每个中删除的特征数量等于步骤参数的值。默认情况下 = 1。

Score(X, y) 选择最佳特征数量并返回这些特征的分数。

为什么分数有时是负数？

这取决于您使用的估算器和评分器。如果您没有设置评分器，RFECV 将使用估计器的默认评分函数。一般来说，这是准确性，但在您的特定情况下，可能会返回负值。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

scikitlearn

crossvalidation

为什么 sklearn.feature_selection.RFECV 每次运行给出不同的结果的相关文章

没有循环匹配指定的签名和转换错误

我是 python 和机器学习的初学者当我尝试将数据放入 statsmodels formula api OLS fit 时出现以下错误回溯最近一次调用最后一次文件第 47 行位于 regressor OLS sm OLS y
类型错误：fit_transform() 需要 2 个位置参数，但给出了 3 个

我有熊猫数据框df 我想对连续和分类特征进行编码df使用不同的编码器我觉得用起来很舒服make column transformer 但是下面显示的代码失败了LabelEncoder 但可以很好地与OneHotEncoder handle
ImageDataGenerator 预测类 - 为什么预测未正确从概率转换为预测类？

我有一个这样设置的目录 images val class1 class2 test all classes train class1 class2 每个目录中都有一组图像我想预测测试中的每个图像是否属于 1 类或 2 类我写这个是为了读
Scikit-learn 具有使用“特征”的自定义评分函数

我正在尝试使用一种名为 SERA 平方误差相关区域的新指标作为本文中提到的不平衡回归的自定义评分函数 https link springer com article 10 1007 s10994 020 05900 9 https lin
scikit-learn - 具有置信区间的 ROC 曲线

我可以使用 ROC 曲线scikit learn with fpr tpr thresholds metrics roc curve y true y pred pos label 1 where y true是基于我的黄金标准的值列表即
在提供给 sklearn 管道中的分类器之前获取所选特征的名称和数量

我在用sel SelectFromModel ExtraTreesClassifier 10 threshold mean 选择我的数据集中最重要的特征然后我想将这些选定的特征提供给我的 keras 分类器但是我的基于 keras 的神
导入错误：无法导入名称“_print_elapsed_time”

你好我正在尝试使用 sklearn 中的 make pipeline 模块但是当我尝试使用以下命令导入它时 from sklearn pipeline import make pipeline 我收到此错误 ImportError ca
Scikit Learn - K-Means - 肘部 - 标准

今天我想学习一些关于 K means 的知识我已经了解该算法并且知道它是如何工作的现在我正在寻找正确的 k 我发现肘部准则作为检测正确的 k 的方法但我不明白如何将它与 scikit learn 一起使用在 scikit learn
将预训练的手套词嵌入与 scikit-learn 结合使用

我已经使用 keras 来使用预先训练的词嵌入但我不太确定如何在 scikit learn 模型上执行此操作我也需要在 sklearn 中执行此操作因为我正在使用vecstack集成 keras 序列模型和 sklearn 模型这就
sklearn：使用 Pipeline 和 TransformedTargetRegressor 缩放 x（数据）和 y（目标）

我想使用 Pipeline 和 TransformedTargetRegressor 来处理所有缩放数据和目标是否可以混合 Pipeline 和 TransformedTargetRegressor 如何从 TransformedTar
如何指定聚类的距离函数？

我想对给定距离的点进行聚类奇怪的是似乎 scipy 和 sklearn 聚类方法都不允许指定距离函数例如在sklearn cluster AgglomerativeClustering 我唯一可以做的就是输入一个亲和力矩阵这将非常
ValueError：不支持连续[重复]

这个问题在这里已经有答案了我正在使用 GridSearchCV 进行线性回归的交叉验证不是分类器也不是逻辑回归我还使用 StandardScaler 对 X 进行标准化我的数据框有 17 个特征 X 和 5 个目标 y 观察约11
Sklearn 随机 Logistic 回归给出错误“ValueError：类的数量必须大于 1”

我发现了 sklearn Randomized Logistic 中的一个错误由于我花了很长时间才解决它所以我会将其发布在这里以防其他人遇到同样的问题发生的情况是在格式完美的数据上 sklearn RandomizedLogist
从 scikit_learn 反转 MinMaxScaler

为了为我的生成神经网络提供数据我需要将一些数据标准化在 1 和 1 之间我用MinMaxScaler来自 Sklearn 效果很好现在我的生成器将输出 1 到 1 之间的数据如何恢复MinMaxScaler获得真实数据让我们首先
sklearn 中的 pca.inverse_transform

将我的数据拟合后 X 我的数据 pca PCA n components 1 pca fit X X pca pca fit transform X 现在 X pca 具有一维当我根据定义执行逆变换时它不是应该返回原始数据即 X 二维
Scikit Learn GridSearchCV 无需交叉验证（无监督学习）

是否可以在没有交叉验证的情况下使用 GridSearchCV 我正在尝试通过网格搜索优化 KMeans 聚类中的聚类数量因此我不需要或想要交叉验证 The 文档 http scikit learn org stable modules g
使用 joblib 加载 pickled scikit-learn 模型时出现 KeyError

我有一个对象其中包含两个scikit learn模型一个IsolationForest and a RandomForestClassifier 我想对其进行 pickle 然后将其解开并用于生成预测除了两个模型之外该对象还包含几个
Python：由于 OSError 无法安装软件包：[Errno 2] 没有这样的文件或目录

我尝试使用pip安装sklearn 并且我收到以下错误消息错误由于 OSError 无法安装软件包 Errno 2 没有这样的文件或目录 C Users 13434 AppData Local Packages PythonSoftwa
生成具有相同类别的终端叶子的决策树

我对决策树比较陌生并且一直坚持我的决策树算法我使用交叉验证和参数调整来优化以下示例的分类 https medium com haydar ai learning data science day 22 cross validation
float() 参数必须是字符串或数字，而不是“时间戳”

我无法使 scilearn 与日期时间系列一起工作找到了这篇文章但对我没有帮助 Pandas 类型错误 float 参数必须是字符串或数字 https stackoverflow com questions 41256626 panda

随机推荐

iPhone如何在按音量键时隐藏音量覆盖

我做了很多事情来解决这个问题比如添加MPVolumeView 有人说系统音量HUD 如果您在当前添加 MPVolumeView 实例则会隐藏但这不起作用我添加观察者来观察体积的变化并拍照但现在我不知道如何隐藏音量HUD 我尝试过
将数字划分为显示在用户表单标签中的唯一排序数字

我想将数字分成唯一的排序数字例如数字可以是 127425 我希望结果为 12457 这意味着已排序并删除了重复项我认为最好是用例子来解释 Number Result 127425 12457 2784425 24578 121 12
限制 Java 中的文本字段

有没有办法限制文本字段只允许数字 0 100 从而排除字母符号等我找到了一种方法但它比看起来必要的要复杂得多如果必须使用文本字段则应该使用JFormattedTextField with a 数字格式化程序您可以设置 Numbe
Pharo 中的彩色窗口主题？

如何在 Pharo 中切换到彩色窗口主题不确定你指的是哪个主题但你尝试过吗世界菜单 gt 系统 gt 设置 gt 外观 gt 形态 gt 用户界面主题选择框将让您选择窗口颜色主题
Git "git config --global user.name" 为什么存在这个选项？

Git 初学者警报我有一个基本问题为什么 GIT 允许更改用户名作为配置选项 git config global user name trojan 这个选项是否会为提交者冒充并在历史日志中造成混乱打开大门为什么不像从用于连接 GIT
在运行时（动态）创建简单的 POJO 类（字节码）

我有以下场景我正在编写一些工具可以对数据库运行用户输入的查询并返回结果最简单的方法是将结果返回为 List
将 NiFi 中同一列中的字符串值替换为整数值

我想更换一个字符串值并将该值输入为整数值使用 Nifi ReplaceText 我不知道如何在 NiFi 中实现这一点所以我的场景如下我将有一个 CSV 文件其中包含几个带有整数的字段和几个作为字符串总值的字段对于具有字符串值的
onclick 显示 div，但在单击其他 div 时隐藏

我正在使用本主题答案 1 中的代码显示 div onclick 并隐藏触发它的图像 img src Icons note add png then the function would apply a display none to it
将阿拉伯语文本转换为 HTML 代码字符

我正在尝试发送一封包含阿拉伯文本的电子邮件我的问题是当我将阿拉伯文本添加到电子邮件中时它会将其更改为随机字母与电子邮件的字符编码有关我无法更改是否有内置函数或自定义函数可以用来将阿拉伯语转换为 HTML 代码以便它随后出现在我
BigQuery 中的“立即关注”页面路径

我正在 BigQuery 中工作以了解有多少用户完成了特定的页面路径在会话中的任何时刻假设页面路径是第 1 页 gt 第 2 页 gt 第 3 页页面必须按顺序排列我可以使用 BQ 建立页面路径但此方法仅适用于识别在会话中的任何
如何在 Windows 服务中为 Clearcase View 映射网络驱动器？

我想在 Windows 服务内的网络驱动器上映射 Clearcase 视图我尝试过net use命令但无法正常工作您应该能够运行与该命令相同类型的命令当路径太长时使用即subst subst X c path to my View
将指针传递给函数值不会改变[重复]

这个问题在这里已经有答案了 include
Spring Integration - 以编程方式创建/拆卸通道

是否可以以编程方式创建拆卸 Spring Integration 通道而不是在 Spring 配置中静态声明它们我的情况是这样的我有一个需要推送通知的网络应用程序因此我使用长轮询这些长轮询调用需要在服务器上阻塞直到收到事件我
JavaScript（ES6）：在条件表达式中使用扩展运算符（？-运算符）[重复]

这个问题在这里已经有答案了在 JavaScript 中可以使用以下方法将数组与另一个数组合并扩展运算符如下 1 2 3 4 5 6 gt 1 2 3 4 5 6 但是似乎没有资格在三元内部使用扩展运算符表达 true 1 2 3
对 URL 参数进行解码

我正在与一个服务器交谈该服务器过去向我发送如下 HTTP 字符串 path to my handler action query id 112 type vca info ch 0 type event ev16 sts begin 因此
打开时仅展开 viewPanel 中的一些分类列

我正在使用 ViewPanel 来显示分类视图该视图有 4 列类别总计还有 3 个附加列我想打开此视图以便展开前 3 个分类列并折叠第 4 个分类列是否有某种类型的 SSJS CSJS 我可以添加到可以执行此操作的视图中在 v
如何跨两个不同的域使用 cookie？

我需要使用 cookie 在两个不同域之间共享 SSO 信息这可以在 PHP 中完成吗如何实现在两个域上放置从另一个域中提取的图像或其他 Web 元素使用 URL 通知其他域用户 X 位于域 A 上并让域 B 将该用户 ID 与
如何创建一个水平菜单，其中每个项目的宽度和间距相等？

这是我到目前为止所得到的 fiddle 但它有两个问题我已经硬编码了每个的宽度li to 33 我不想这样做这样我就可以轻松添加更多项目我想在每个项目之间放置一些间距背景颜色中的间隙但是一旦我添加边距一个项目就会沿着一条线向下移
在会话中存储用户ID？

为了呈现用户特定数据我在哪里存储当前登录用户的 userID 会议是的会议是提供该信息的合适场所假设您正在使用 ASP NET 框架中内置的身份验证功能您将要么从 HttpContext Current User Identity
为什么 sklearn.feature_selection.RFECV 每次运行给出不同的结果

我尝试进行特征选择RFECV但每次都会给出不同的结果交叉验证是将样本 X 划分为随机块还是顺序确定性块另外为什么分数不同grid scores and score X y 为什么分数有时是负数交叉验证是否将样本 X 划分为随机块或顺

为什么 sklearn.feature_selection.RFECV 每次运行给出不同的结果

为什么 sklearn.feature_selection.RFECV 每次运行给出不同的结果 的相关文章

随机推荐

热门标签

为什么 sklearn.feature_selection.RFECV 每次运行给出不同的结果的相关文章