无监督特征选择算法综述

2023-10-29

无监督特征选择算法

image-20210316214949121

Filter方法

只使用数据的内在属性,不使用聚类等其他辅助方法

速度快

单变量

Information based methods

  1. SUD(Sequential backward selection method for Unsupervised Data)
    • 基于距离相似度的熵值作为指标,进行相关性排序,选择特征
  2. SVD-Entropy
    • 过其奇异值来测量原始数据矩阵的熵,评估每个特征对熵的贡献,并根据它们各自的熵值对特征进行排序。
    • 三种选择最终特征子集的不同方法:简单排序、向前选择和向后消除
  3. Representation Entropy
    • 表示熵是数据集中信息压缩的一种度量

Spectral-similarity based methods

拉普拉斯评分。在拉普拉斯算子中,特征的重要性通过其方差和局部保持能力来评估,在拉普拉斯算子中,特征的重要性通过其方差和局部保持能力来评估。

  1. SPEC (SPECtrum decomposition)
  2. USFSM (Unsupervised Spectral Feature Selection Method for mixed data)

多变量

Statistical/information based methods

  1. FSFS (Feature Selection using Feature Similarity)
    • 将原始特征集划分成簇,使得同一簇中的特征高度相似,而不同簇中的特征不相似
    • 计算每个特征的k-NN特征。然后,选择具有最紧凑子集的特征,并且丢弃其k-NN最近特征
  2. RRFS (Relevance Redundancy Feature Selection),
    • 该方法分两步选择特征。在该方法中,首先,根据相关性度量对特征进行排序。然后,在第二步中,按照在前一步中生成的顺序,使用特征相似性度量来评估特征,以量化它们之间的冗余度。之后,选择冗余度最低的前p个特征。

Bio-inspired methods

  1. UFSACO (Unsupervised Feature Selection based on Ant Colony Optimization)
    • 遗传算法优先选择高信息素值和低相似性,直到达到预先指定的停止标准(迭代次数)。最后,选择那些具有最高信息素值的特征
  2. MGSACO (Microarray Gene Selection based on Ant Colony Optimiza-
    tion)
  3. RR-FSACO (Relevance-Redundancy Feature Selection based on
    ACO)
  4. UPFS (Unsupervised Probabilistic Feature Selection using ant colony optimization)

Spectral/sparse learning methods

  1. mR-SP (minimum-Redundancy SPectral feature selection)
    • 结合SPEC排序和最小冗余最优性准则的特征选择方法
  2. LLDA-RFE (Laplacian Linear Discriminant Analysis-based Recursive Feature Elimination)
    • 该方法利用对象之间的相似性,将线性判别分析(LDA)扩展到无监督情况(LLDA)。其思路是递归地删除LLDA判别向量绝对值最小的特征,以识别可能揭示样本中聚类的特征。
  3. MCFS (Multi-Cluster Feature Selection)
  4. MRSF (Minimize the feature Redundancy for Spectral Feature selection)
  5. UDFS(Unsupervised Discriminative Feature Selection algorithm)
    • 通过同时利用离散矩阵和特征相关性中包含的判别信息进行特征选择。
  6. NDFS (Nonnegative Discriminative Feature Selection)
  7. RUFS (Robust Unsupervised Feature Selection)
    • 同时实现鲁棒聚类和鲁棒特征选择。
  8. SPNFSR (Structure-Preserving Non-negative Feature Self-Representation)

Wrapper方法

使用聚类算法评估特征子集

计算量较大

Sequential methods

  1. SS-SFS(Simplified Silhouette Sequential Forward Selection)
    1. 该方法根据简化轮廓准则选择质量最好的特征子集。在该方法中,使用前向选择搜索来生成特征子集。使用k-means聚类算法对每个特征子集进行聚类,并通过simplied-silhouette准则测量的聚类质量来评价特征子集的质量

Bio-inspired methods

  1. ELSA(evolutionary local selection algorithm)
    • 一种基于k-means和高斯混合聚类算法的进化局部选择算法,来搜索特征子集和聚类数目
  2. multi-objective genetic algorithm (MOGA)

Iterative

  1. LLC-fs (Local Learning-based Clustering algorithm with feature selection)

  2. EUFS (Embedded Unsupervised Feature Selection)

    • 通过稀疏学习将特征选择直接嵌入到聚类算法中
  3. DGUFS (Dependence Guided Unsupervised Feature Selection)

Hybrid方法

综合上面两种方法,在计算速度和模型效果之间做一个折衷

  1. BFK( a hybrid UFS method non-based on ranking)
    • 该方法从包装器阶段开始,通过在用户指定的集群范围内的数据集上运行kmeans聚类算法。采用简化轮廓准则对聚类进行评价,并选取值最高的聚类。随后,在滤波阶段,利用马尔可夫方法,通过贝叶斯网络选择一个特征子集

常用用于分类和聚类的特征选择方法

image-20210317090533566

不同领域的特征选择算法应用

image-20210317090659551

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

无监督特征选择算法综述 的相关文章

随机推荐

  • Subquery and Wrapping query

    Subquery Progressive query Into Wrapping query 1 Using fluent syntax string names Tom Dick Harry Mary Jay IEnumerable
  • odoo15 owl 组件实验

    视图有两种形式 一种是利用odoo MVC框架的QWeb模板引擎进行渲染 另一种是独立于odoo的模板引擎 利用前端框架搭建视图与用户交互 并调用odoo的控制器与odoo交互 odoo15提供了一套全新的前端框架owl 最主要的是owl的
  • 利用 AES 对 log4j 日志文件加密

    总览 本文简要介绍了 AES 算法加密的方式 以及如何利用 AES 对 log4j 输出的日志进行加密 背景 在互联网时代下 JAVA 大多用来做后端开发 由于后端的程序大多都部署在自己的服务器上 客户接触不到程序的日志文件 因此 多数情况
  • nacos无法正常下线问题记录

    问题描述 公司搭建了nacos集群 但是在微服务下线时会无法正常下线 点击下线提示 caused errCode 500 errMsg do metadata operation failed caused com alibaba naco
  • 基于vue2和element-ui的项目框架模板加强版

    前言 我的上篇博客讲了如何基于vue2和element ui搭建一个基础的项目框架模板 有兴趣的可以看下 文章有点长 这篇博客就谈谈可以在基础框架模板上增添哪些功能 ie兼容 ie兼容之前是让我很头痛的一件事 但经过我的反复摸索 百度 哈哈
  • Unity新手基础知识系列—序

    前提提要 本系列主要内容是根据 Unity中文文档来总结的 其实本人也是现在正在学习Unity相关基础 可能有一些理解不到位或者理解错误的地方 望大家指正 为什么写这个系列 1 为了记录自己学习的内容 方便以后自己再查阅 2 巩固知识体系
  • 力扣:只出现一次的数字

    给定一个非空整数数组 除了某个元素只出现一次以外 其余每个元素均出现两次 找出那个只出现了一次的元素 class Solution public int singleNumber int nums int result 0 for int
  • c语言字符串替换函数StrReplace(char strRes[],char from[], char to[])可直接使用

    将如下函数添加到文件中 可直接调用 StrReplace char strRes char from char to strRes 原始字符串 rom 需要替换的字符 串只替换第一次出现的位置 to 需要替换成什么字符串 成功返回 1 失败
  • 【牛客·剑指offer】Python JZ4二维数组查找、JZ3 数组中的重复数字、JZ5 替换空格、JZ6 从尾到头打印链表

    一 JZ4二维数组查找 描述 在一个二维数组array中 每个一维数组的长度相同 每一行都按照从左到右递增的顺序排序 每一列都按照从上到下递增的顺序排序 请完成一个函数 输入这样的一个二维数组和一个整数 判断数组中是否含有该整数 1 2 8
  • 【Unity】模仿GUILayout.SelectionGird绘制一组互斥的按钮

  • STM32的中断介绍

    目录 一 STM32中断应用概览 1 简介 2 中断编程的顺序 1 使能中断请求 2 中断优先级分组 3 配置NVIC寄存器 初始化NVIC InitTypeDef 4 编写中断服务函数 二 EXTI 外部中断 事件控制器 1 简介 2 E
  • 解决dubbo问题:com.alibaba.dubbo.rpc.RpcException: Forbid consumer (很可能是一个访问都没有注册成功)

    线下环境经常出现类似这种异常 com alibaba dubbo rpc RpcException Forbid consumer access service from registry use dubbo version 2 5 3 P
  • CVPR2020超分辨率重建论文阅读笔记

    为什么要进行超分辨率重建 1 视觉效果不吸引人 2 影响下游方法使用 如分割等 3 电子显示产品分辨率提高 需要更高分辨率的图像 超分辨率重建问题面临难点和存在问题如下 1 病态问题 一对多 同样的LR图像对应无数解 2 MSE指标可能导致
  • STM32 基础系列教程 38 - Lwip_http

    前言 HTTP协议 HyperText Transfer Protocol 超文本传输协议 是因特网上应用最为广泛的种网络传输协议 所有的WWW文件都必须遵守这个标准 HTTP是一个基于TCP IP通信协议来传递数据 HTML 文件 图片文
  • CNN经典网络模型(四):GoogLeNet简介及代码实现(PyTorch超详细注释版)

    目录 一 开发背景 二 网络结构 三 模型特点 四 代码实现 1 model py 2 train py 3 predict py 4 spilit data py 五 参考内容 一 开发背景 GoogLeNet在2014年由Google团
  • @Validated 注解不起作用 怎么办?@Validated 无效 解决办法

    有一种可能是之前没有查到的 那就是pom缺少依赖 在项目的pom xml 文件中添加以上依赖 可有效解决问题
  • MySQL触发器trigger的使用

    Q 什么是触发器 A 触发器是与表有关的数据库对象 在满足定义条件时触发 并执行触发器中定义的语句集合 触发器的特性 1 有begin end体 begin end 之间的语句可以写的简单或者复杂 2 什么条件会触发 I D U 3 什么时
  • 线程的六种状态

    1 New 新建状态 线程刚被创建 start方法之前的状态 2 Runnable 运行状态 得到时间片运行中状态 Ready就绪 未得到时间片就绪状态 3 Blocked 阻塞状态 如果遇到锁 线程就会变为阻塞状态等待另一个线程释放锁 4
  • repo 使用

    repo 使用 repo start 创建并切换分支 repo start newbranchname all projectName repo start是对git checkout b 命令的封装 git checkout b 是在当前
  • 无监督特征选择算法综述

    无监督特征选择算法 Filter方法 只使用数据的内在属性 不使用聚类等其他辅助方法 速度快 单变量 Information based methods SUD Sequential backward selection method fo