特征选择过滤器 - mutual_info_regression（连续目标变量的互信息）

2023-11-04

文章目录

- - 函数
  - 参数说明

函数

sklearn.feature_selection.mutual_info_regression(X, y, discrete_features='auto', n_neighbors=3, copy=True, random_state=None)

估计一个连续目标变量的互信息。

两个随机变量之间的互信息（MI）是非负值，用于衡量变量之间的依存关系。当且仅当两个随机变量是独立的，并且等于较高的值意味着较高的依赖性时，它等于零。

该函数依赖于非参数方法，该方法基于k-邻近邻居距离的熵估计。

参数说明

Parameters
----------
	X：array_like or sparse matrix, shape (n_samples, n_features)
  	   Feature matrix.
       特征矩阵。

	y：array_like, shape (n_samples,)
       Target vector.
       标签向量。

	discrete_features：{'auto', bool, array_like}, default ‘auto’
					   如果为'auto'，则将其分配给False（表示稠密）X，将其分配给True（表示稀疏）X。
			           如果是bool，则确定是考虑所有特征是离散特征还是连续特征。
			           如果是数组，则它应该是具有形状（n_features，）的布尔蒙版或具有离散特征索引的数组。

	n_neighbors: int, default=3
				 用于连续变量的MI估计的邻居数;
				 较高的值会减少估计的方差，但可能会带来偏差。

	copy: bool, default=True
	      是否复制给定的数据。如果设置为False，则初始数据将被覆盖。

	random_state: int, RandomState instance or None, optional, default None
				  确定随机数生成，以将小噪声添加到连续变量中以删除重复值。
				  在多个函数调用之间传递int以获得可重复的结果。
				  
Returns
-------
	mi: ndarray, shape (n_features,)
		每个特征和标签之间的估计相互信息。

笔记

使用术语“离散特征”而不是将它们命名为“分类”，因为它可以更准确地描述要素。例如，图像的像素强度是离散的特征（但很难分类），如果将其标记为这样，您将获得更好的结果。还要注意，将连续变量视为离散变量，反之亦然通常会产生错误的结果，因此请注意这一点。
真正的共同信息不能是负面的。如果其估计结果为负，则将其替换为零。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

机器学习

python

特征选择过滤器 - mutual_info_regression（连续目标变量的互信息）的相关文章

从正在运行的 python 脚本检测优化标志是否为 -O 或 -OO

有时我想生成一个子进程其优化标志与启动父进程时使用的优化标志相同我可以使用类似的东西 optimize not debug 但这样我就可以匹配两者 O and OO flags 是否有一些 python 内部状态包含该信息经过一番深
如何确定非阻塞套接字是否真正连接？

这个问题不仅限于Python 这是一个一般的套接字问题我有一个非阻塞套接字想要连接到一台可访问的机器在另一端该端口不存在为什么 select 仍然成功我预计会超时 sock send 因管道损坏而失败 select 之后如何确定
Python 3 __getattribute__ 与点访问行为

我读了一些关于 python 的对象属性查找的内容这里 https blog ionelmc ro 2015 02 09 understanding python metaclasses object attribute lookup h
如何使用Python将WebP图像转换为Gif？

我已经尝试过这个 from PIL import Image im Image open this webp im save that gif gif save all True 这给了我这个错误类型错误不支持的操作数类型 tuple
可以在 TensorFlow 中使用排名相关作为成本函数吗？

我正在处理偶尔充满异常值的极其嘈杂的数据因此我主要依靠相关性来衡量我的神经网络的准确性是否可以明确使用诸如等级相关性斯皮尔曼相关系数之类的东西作为我的成本函数到目前为止我主要依赖 MSE 作为相关性的代理我现在面临三个主要障碍
PIL Image.size 返回相反的宽度/高度

使用PIL确定图像的宽度和高度在特定图像上幸运的是只有这一个但这很麻烦从 image size 返回的宽度高度是相反的图片 http storage googleapis com cookila 533ebf752b9d1f7c
错误：permission_manager_qt.cpp(82) 不支持的权限类型：13

我正在开发具有内置浏览器功能的 python 代码 PyQt 5 13 import sys from PyQt5 QtCore import from PyQt5 QtGui import from PyQt5 QtWidgets imp
matplotlib matshow 标签

我一个月前开始使用 matplotlib 所以我仍在学习我正在尝试用 matshow 制作热图我的代码如下 data numpy array a reshape 4 4 cax ax matshow data interpolation
如何在python中检索aws批处理参数值？

流程 Dynamo DB gt Lambda gt 批处理如果将角色 arn 插入动态数据库它是从 lambda 事件中检索的然后使用submit job角色 arn 的 API 被传递为 parameters role arn ar
Python 中的 @staticmethod 与 @classmethod

方法和方法有什么区别装饰的 https peps python org pep 0318 with staticmethod http docs python org library functions html staticmethod和
为什么我用 beautifulSoup 刮的时候有桌子，但没有 pandas

尝试抓取条目页面转换为制表符分隔格式主要拉出序列和 UniProt 登录号当我跑步时 url www signalpeptide de index php sess m listspdb bacteria s details id 10
如何列出 python PDB 中的当前行？

在 perl 调试器中如果重复列出离开当前行的代码段可以通过输入命令返回到当前行点我无法使用 python PDB 模块找到任何类似的东西如果我list如果我自己离开当前行并想再次查看它似乎我必须记住当前正在执行的行号对我来说
Django 在选择列表更改时创建毫无意义的迁移

我正在尝试使用可调用创建一个带有选择字段的模型以便 Django 在选择列表更改时不会创建迁移如中所述this https stackoverflow com questions 31788450 stop django from cr
将一个列表的元素除以另一个列表的元素

我有两个清单比如说 a 10 20 30 40 50 60 b 30 70 110 正如你所看到的列表 b 由一个列表的元素总和组成其中 window 2 b 0 a 0 a 1 10 20 30 etc 如何获得另一个列表该列表由
Airflow Python 单元测试？

我想为我们的 DAG 添加一些单元测试但找不到任何单元测试有 DAG 单元测试框架吗有一个端到端的测试框架存在但我猜它已经死了 https issues apache org jira browse AIRFLOW 79 https
导入错误：没有名为 google.auth 的模块

当我尝试导入时firebase admin in python 2 7我收到错误导入错误没有名为 google auth 的模块这是Docker文件 https github com ammaratef45 Attendance bl
如何禁止 celery 中的 pickle 序列化

Celery 默认使用 pickle 作为任务的序列化方法如中所述FAQ http ask github com celery faq html isn t using pickle a security concern 这代表一个安全漏
检查字符串是否只有字母和空格 - Python

试图让 python 返回一个字符串仅包含字母和空格 string input Enter a string if all x isalpha and x isspace for x in string print Only alphabe
在 Python 模块中使用 InstaLoader

我正在尝试使用 Instaloader 下载与主题标签相关的照片以进行图像分析我在GitHub存储库中找到了一个全面的方法如何在终端中执行它但是我需要将脚本集成到Python笔记本中这是脚本 instaloader no vide
来自 django 教程 was_published_recently.admin_order_field = 'pub_date'

From Django 教程 https www jetbrains com help pycharm 2017 1 creating and running your first django project html d28041e21

随机推荐

webpack5之loader配置（四）

总述要明白为什么要引入loader 因为webpack只能理解js和json这样的文件这是webpack开箱可用的自带能力 loader可以让 webpack去解析其他类型的文件并且将这些文件转化为有效的模块以供我们应用程序使用如何
国产CAE的涅槃-岩土行业高性能离散元软件MatDEM

作者刘春博士一导读 2019年9月11日 ANSYS公司公开宣称收购LSTC公司一举获得其旗下拥有LS DYNA 结构流体电磁的多物理场求解器 LS PrePost 前后处理器 LS OPT LS TASC 参数优化拓扑优化
微信小程序——关于图片

属性类型默认值必填说明 src string 否图片资源地址 mode string scaleToFill 否图片裁剪缩放的模式 webp boolean false 否默认不解析 webP 格式只支持网络资源 lazy
我在训练maskrcnn模型识别羊的时候发现，用了1500张图片，模型的损失是逐渐降低的，预测框标注的很好，但是掩膜图层识别效果非常差，resnet使用的是101，详细说出为什么这种原因，并列出详细的...

在训练 Mask R CNN 模型识别羊时用了 1500 张图片模型的损失是逐渐降低的说明模型在训练过程中较好地学习了预测框标注的特征然而掩膜图层识别效果非常差这可能是由以下几种原因造成的数据不足如果训练数据中羊的掩膜图层标
QT环境搭建：解决Linux系统下QT（qDebug和console）无输出

在Linux下调试时突然发现无论怎样qDebuge无法输出了寻找了半天发现是环境变量出了问题我的环境是统信的UOS 解决办法就是修改QT LOGGING RULES变量 1 查看是否是这个变量的问题 export p grep QT
linux各种版本下载地址

http blog chinaunix net uid 26760055 id 3138203 html 首先提供两个镜像站 http mirrors sohu com http mirrors 163 com Red Hat Enterp
linux ubuntu18.04安装（更新）cmake版本（坑是真滴多，我都给你趟过去了）

笔者就是想学一手网络编程通过本地clion编写代码在云服务器上跑起来这就涉及到了cmake版本问题本地编译器cmake版本为3 22 3 云服务器的版本过于低了用这个语句装的版本为3 10 好多人都不建议用这个装但是这个不装的话
简单的整理一下VIM环境配置和插件安装

http www zhaiqianfeng com 2017 02 install vim plugins html 先占个坑周末有时间再写
Java Stream流

目录 1 Stream 流的获取方法 2 Stream 流的常见中间方法 3 Stream 流的常见终结方法 4 Stream 流的收集方法获取 Stream 流创建一条流水线并把数据放到流水线上准备进行操作中间方法流水线上的操作
nginx篇10-限速三剑客之limit_req

本文主要是对nginx官方limit req相关模块的限速原理的解释和一些个人理解主要参考的文章为Rate Limiting with NGINX and NGINX Plus和nginx的ngx http limit req modul
C++编码规范(1):代码注释

当你阅读别人的代码时如果没有注释那会是件比较痛苦的事一说到注释我们马上想到是通过或这样来添加一些描述信息这只是狭义的注释广义的注释我们可以理解为任何有助于理解代码的信息都可以看成注释我们可以把写代码和写文章类比下自然语言会有
Qt - 获取屏幕分辨率

欢迎转载请注明出处 https blog csdn net qq 39453936 spm 1010 2135 3001 5343 原文链接 https blog csdn net qq 39453936 article details
MySQL必知必会——第十七章组合查询

组合查询本章讲述如何利用UNION操作符将多条SELECT语句组合成一个结果集组合查询多数SQL查询都只包含从一个或多个表中返回数据的单条SELECT语句 MySQL也允许执行多个查询并将结果作为单个查询结果返回这些组合查询通常称
chatgpt提问句式整理

你不知道 GPT知道 1 元问题我想了解xxxx 我应该向你问哪些问题 2 请给我列出xxx领域行业相关的最常用的50个概念并做简单解释如果有英文缩写请给出完整的英文解释 3 请详细介绍一下elon musk的主要生平事迹请详
设计模式：再谈单例模式

单例模式可以说是每个人问设计模式都会脱口而出的几个设计模式之一为什么之前写过一次了现在我又写一遍肯定不是重新写一遍怎么是设计模式这次写的单例模式主要围绕的关键词有延迟加载高并发线程安全为什么说用枚举的单例模式优雅且怎么做到的
服务器出现漏洞如何处理

1 从基本做起及时安装系统补丁不管是什么操作系统都是在更新中不断完善都存在着漏洞这些漏洞就是电脑被入侵的最好通道所以及时打补丁更新系统防止被攻击利用是服务器最重要的安全保证之一 2 安装杀毒软件现在网络上的病毒非常猖獗
ConcurrentHashMap中有十个提升性能的细节，你都知道吗？

历史文章推荐 HashMap面试看这一篇就够了七种方式教你在SpringBoot初始化时搞点事情 Java序列化的这三个坑千万要小心 Java中七个潜在的内存泄露风险你知道几个 JDK 16新特性一览啥用了并行流还更慢了 Inno
layui上传文件php上传接口异常,layui.upload上传图片报错“请求上传接口出现异常”...

layui upload上传图片报错请求上传接口出现异常且接口报404问题在调试layui upload上传图片时候报错请求上传接口出现异常且接口返回是404 返回接口丢失了复盘处理流程花了一些事件做了如下的一些问题筛选处理
企业信息化快速开发平台 JeeSite

JeeSite是基于多个优秀的开源项目高度整合封装而成的高效高性能强安全性的开源 Java EE快速开发平台 JeeSite本身是以Spring Framework为核心容器 Spring MVC为模型视图控制器 MyBatis为数
特征选择过滤器 - mutual_info_regression（连续目标变量的互信息）

文章目录函数参数说明函数 sklearn feature selection mutual info regression X y discrete features auto n neighbors 3 copy True rand

特征选择过滤器 - mutual_info_regression（连续目标变量的互信息）

文章目录

函数

参数说明

特征选择过滤器 - mutual_info_regression（连续目标变量的互信息） 的相关文章

随机推荐

热门标签

特征选择过滤器 - mutual_info_regression（连续目标变量的互信息）的相关文章