特征选择过滤器 - mutual_info_regression(连续目标变量的互信息)

2023-11-04

文章目录

函数

sklearn.feature_selection.mutual_info_regression(X, y, discrete_features='auto', n_neighbors=3, copy=True, random_state=None)

估计一个连续目标变量的互信息。

两个随机变量之间的互信息(MI)是非负值,用于衡量变量之间的依存关系。当且仅当两个随机变量是独立的,并且等于较高的值意味着较高的依赖性时,它等于零。

该函数依赖于非参数方法,该方法基于k-邻近邻居距离的熵估计。

参数说明

Parameters
----------
	X:array_like or sparse matrix, shape (n_samples, n_features)
  	   Feature matrix.
       特征矩阵。

	y:array_like, shape (n_samples,)
       Target vector.
       标签向量。

	discrete_features:{'auto', bool, array_like}, default ‘auto’
					   如果为'auto',则将其分配给False(表示稠密)X,将其分配给True(表示稀疏)X。
			           如果是bool,则确定是考虑所有特征是离散特征还是连续特征。
			           如果是数组,则它应该是具有形状(n_features,)的布尔蒙版或具有离散特征索引的数组。

	n_neighbors: int, default=3
				 用于连续变量的MI估计的邻居数;
				 较高的值会减少估计的方差,但可能会带来偏差。

	copy: bool, default=True
	      是否复制给定的数据。如果设置为False,则初始数据将被覆盖。

	random_state: int, RandomState instance or None, optional, default None
				  确定随机数生成,以将小噪声添加到连续变量中以删除重复值。
				  在多个函数调用之间传递int以获得可重复的结果。
				  
Returns
-------
	mi: ndarray, shape (n_features,)
		每个特征和标签之间的估计相互信息。

笔记

  1. 使用术语“离散特征”而不是将它们命名为“分类”,因为它可以更准确地描述要素。例如,图像的像素强度是离散的特征(但很难分类),如果将其标记为这样,您将获得更好的结果。还要注意,将连续变量视为离散变量,反之亦然通常会产生错误的结果,因此请注意这一点。

  2. 真正的共同信息不能是负面的。如果其估计结果为负,则将其替换为零。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

特征选择过滤器 - mutual_info_regression(连续目标变量的互信息) 的相关文章

随机推荐

  • webpack5之loader配置(四)

    总述 要明白为什么要引入loader 因为webpack只能理解js和json这样的文件 这是webpack开箱可用的自带能力 loader可以让 webpack去解析其他类型的文件 并且将这些文件转化为有效的模块以供我们应用程序使用 如何
  • 国产CAE的涅槃-岩土行业高性能离散元软件MatDEM

    作者 刘春博士 一 导读 2019年9月11日 ANSYS公司公开宣称 收购LSTC公司 一举获得其旗下拥有LS DYNA 结构 流体 电磁的多物理场求解器 LS PrePost 前后处理器 LS OPT LS TASC 参数优化 拓扑优化
  • 微信小程序——关于图片

    属性 类型 默认值 必填 说明 src string 否 图片资源地址 mode string scaleToFill 否 图片裁剪 缩放的模式 webp boolean false 否 默认不解析 webP 格式 只支持网络资源 lazy
  • 我在训练maskrcnn模型识别羊的时候发现,用了1500张图片,模型的损失是逐渐降低的,预测框标注的很好,但是掩膜图层识别效果非常差,resnet使用的是101,详细说出为什么这种原因,并列出详细的...

    在训练 Mask R CNN 模型识别羊时 用了 1500 张图片 模型的损失是逐渐降低的 说明模型在训练过程中较好地学习了预测框标注的特征 然而 掩膜图层识别效果非常差 这可能是由以下几种原因造成的 数据不足 如果训练数据中羊的掩膜图层标
  • QT环境搭建:解决Linux系统下QT(qDebug和console)无输出

    在Linux下调试时突然发现无论怎样qDebuge无法输出了 寻找了半天 发现是环境变量出了问题 我的环境是统信的UOS 解决办法就是修改QT LOGGING RULES变量 1 查看是否是这个变量的问题 export p grep QT
  • linux各种版本下载地址

    http blog chinaunix net uid 26760055 id 3138203 html 首先提供两个镜像站 http mirrors sohu com http mirrors 163 com Red Hat Enterp
  • linux ubuntu18.04安装(更新)cmake版本 (坑是真滴多,我都给你趟过去了)

    笔者就是想学一手网络编程 通过本地clion编写代码 在云服务器上跑起来 这就涉及到了cmake版本问题 本地编译器cmake版本为3 22 3 云服务器的版本过于低了 用这个语句装的版本为3 10 好多人都不建议用这个装 但是这个不装的话
  • 简单的整理一下VIM环境配置和插件安装

    http www zhaiqianfeng com 2017 02 install vim plugins html 先占个坑 周末有时间再写
  • Java Stream流

    目录 1 Stream 流的获取方法 2 Stream 流的常见中间方法 3 Stream 流的常见终结方法 4 Stream 流的收集方法 获取 Stream 流 创建一条流水线 并把数据放到流水线上准备进行操作 中间方法 流水线上的操作
  • nginx篇10-限速三剑客之limit_req

    本文主要是对nginx官方limit req相关模块的限速原理的解释和一些个人理解 主要参考的文章为Rate Limiting with NGINX and NGINX Plus和nginx的ngx http limit req modul
  • C++编码规范(1):代码注释

    当你阅读别人的代码时如果没有注释那会是件比较痛苦的事 一说到注释我们马上想到是通过 或 这样来添加一些描述信息 这只是狭义的注释 广义的注释我们可以理解为 任何有助于理解代码的信息都可以看成注释 我们可以把写代码和写文章类比下 自然语言会有
  • Qt - 获取屏幕分辨率

    欢迎转载 请注明出处 https blog csdn net qq 39453936 spm 1010 2135 3001 5343 原文链接 https blog csdn net qq 39453936 article details
  • MySQL必知必会——第十七章组合查询

    组合查询 本章讲述如何利用UNION操作符将多条SELECT语句组合成一个结果集 组合查询 多数SQL查询都只包含从一个或多个表中返回数据的单条SELECT语句 MySQL也允许执行多个查询 并将结果作为单个查询结果返回 这些组合查询通常称
  • chatgpt提问句式整理

    你不知道 GPT知道 1 元问题 我想了解xxxx 我应该向你问哪些问题 2 请给我列出xxx领域 行业相关的 最常用的50个概念 并做简单解释 如果有英文缩写 请给出完整的英文解释 3 请详细介绍一下elon musk的主要生平事迹 请详
  • 设计模式:再谈单例模式

    单例模式可以说是每个人问设计模式都会脱口而出的几个设计模式之一 为什么之前写过一次了 现在我又写一遍 肯定不是重新写一遍怎么是设计模式 这次写的单例模式主要围绕的关键词有 延迟加载 高并发 线程安全 为什么说用枚举的单例模式优雅且怎么做到的
  • 服务器出现漏洞如何处理

    1 从基本做起 及时安装系统补丁 不管是什么操作系统 都是在更新中不断完善 都存在着漏洞 这些漏洞就是电脑被入侵的最 好通道 所以及时打补丁更新系统 防止被攻击利用 是服务器最重要的安全保证之一 2 安装杀毒软件 现在网络上的病毒非常猖獗
  • ConcurrentHashMap中有十个提升性能的细节,你都知道吗?

    历史文章推荐 HashMap面试 看这一篇就够了 七种方式教你在SpringBoot初始化时搞点事情 Java序列化的这三个坑千万要小心 Java中七个潜在的内存泄露风险 你知道几个 JDK 16新特性一览 啥 用了并行流还更慢了 Inno
  • layui上传文件php上传接口异常,layui.upload上传图片报错“请求上传接口出现异常”...

    layui upload上传图片报错 请求上传接口出现异常 且接口报404问题 在调试layui upload上传图片时候报错 请求上传接口出现异常 且接口返回是404 返回接口丢失了 复盘处理流程 花了一些事件 做了如下的一些问题筛选处理
  • 企业信息化快速开发平台 JeeSite

    JeeSite是基于多个优秀的开源项目 高度整合封装而成的高效 高性能 强安全性的 开源 Java EE快速开发平台 JeeSite本身是以Spring Framework为核心容器 Spring MVC为模型视图控制器 MyBatis为数
  • 特征选择过滤器 - mutual_info_regression(连续目标变量的互信息)

    文章目录 函数 参数说明 函数 sklearn feature selection mutual info regression X y discrete features auto n neighbors 3 copy True rand