【知识点】机器学习降维方法

2023-05-16

摘抄文章：打破“维度的诅咒”，机器学习降维大法好

为什么数据需要降维

机器模型用来帮忙预测一个目标变量，但是不一定输入图像的每一个特征都对应目标变量，这会使模型变得复杂。
这里所说的降维的纬度，就是图像的特征，对于图像分类模型来说，一个像素点就是一个特征

降维技术

1 特征选择

实用python的 scikit-learn库，使用散点图和热图来可视化不同特征的协方差，如果有高度相同的特征，就只留一个。

你可能会发现，在你的数据集的25个特征中，有7个对目标变量的影响占到了95%。所以能够删除18个特征，使机器学习模型变得更简单，而不会对模型的准确性产生太大影响。

2 投影技术

投影技术也被称为特征提取

这是在没有办法删除特征的时候使用的技术

这个技术现在也是看得似懂非懂

在这里插入图片描述
这是一堆围绕三维焦点的像“瑞士卷”的数据点集，可以采”用局部线性嵌入”(LLE)的方法来降维，降维完如下所示

这样就可以使用最简单的机器学习算法（线性回归）建模。

还可以使用主成分分析PCA来降维

投影技术存在两个缺点：

一旦你开发了投影技术，就必须先将新数据点转换到低维空间，然后再通过机器学习模型运行它们。但如果这个预处理步骤的成本太大，最后模型的收益太小的话，可能不太值。
转换后的数据点可能不能直接代表其原始特征，如果将它们再转换回原始空间可能很麻烦，某些情况下也不太可行，因此这可能会很难解释模型的推论。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

【知识点】机器学习降维方法的相关文章

C语言 malloc() + 结构体指针定义结构体变量

之前在学习链表的过程中 xff0c 笔者认为新节点必须如下定义 xff1a struct Node p struct Node int val p pNext int main Node Node1 Node Node2 Node Node
Windows JDK8 安装

Windows JDK8 安装准备步骤安装完成准备准备jdk8 官网下载 xff1a https www oracle com java technologies javase javase jdk8 downloads html 根
openmv与其他单片双向串口通信

Openmv与其他单片双向串口通信目的为了让openmv进行阈值切换或者只运行某一部分代码 xff0c 因此需要openmv与其他单片建立双向通信进行更改内部参数起因 openmv自带接收函数uart read 进行接收 xff0c
树莓派学习笔记4-opencv网络图传-1

前记为了实现QT编写的上位机显示下位机树莓派的opencv实时画面 xff0c 因此需要进行opencv的网络图传 xff0c 包括以下内容 1 QT编写TCP服务端并配置opencv显示摄像头画面 2 python网络编程客户端发送op
Ubuntu学习笔记5-安装Arduino及ros配置

Ubuntu学习笔记5 安装Arduino及ros配置前言由于需要编写ESP32代码作为ros下位机使用 xff0c 顺带想体验一下ubuntu下开发 xff0c 因此在ubutnu20 04上安装Arduino并测试 xff0c 不过
OpenStack部署（五）

部署版本 xff1a pike 部署环境 xff1a CentOS7 6 配置文件中所有controller可修改为控制节点ip地址配置过程中使用 echo 验证命令执行情况 Networking service 安装与配置neutron
爬虫要违法了吗？小编告诉大家：守住规则，大胆去爬

最近我学习和实践网络爬虫 xff0c 总想着在这儿抓点数据在那儿抓点数据但不知为什么 xff0c 抓取别人网站数据时 xff0c 总会产生莫名恐慌生怕自己一不小心就侵权了 xff0c 然后被关在监狱摩擦所以我想现在这个时候 xff0c
CXF开发总结

CXF开发总结 xff08 3种模式 xff09 基于SOAP Server端开发导包 xff0c 下载cxf包 xff0c 地址http cxf apache org xff0c 导入eclipse为web service服务提供类定义
年度最受欢迎的Python的书籍，还不来看看！

Python是一种通用的解释型编程 xff0c 主要用于Web开发机器学习和复杂数据分析 Python对初学者来说是一种完美的语言 xff0c 因为它易于学习和理解 xff0c 随着这种语言的普及 xff0c Python程序员的机会也越
Html5下载功能实现

downloader模块管理网络文件下载任务 xff0c 用于从服务器下载各种文件 xff0c 并支持跨域访问操作通过plus downloader获取下载管理对象 Downloader下载使用HTTP的GET POST方式请求下载文件
卡尔曼滤波总结(KF、EKF、UKF)

1 马尔科夫参考 xff1a https zhuanlan zhihu com p 489239366 2 协方差矩阵 1 xff09 对于一个样本集合S xff0c 如果每个样本是一个n维空间中的一个列向量 xff0c 则使用协方差矩阵
Centos7搭建Squid代理服务器

Centos7搭建Squid代理服务器 sumu s home 1 无需验证版 http 1 1 安装 yum install squid 1 2 修改配置文件打开文件 vim etc squid squid conf修改 http ac
Python 3.6解决报错：'NoneType' object has no attribute 'decode'的办法

for repo dict in repo dicts names append repo dict 39 name 39 plot dict 61 39 value 39 repo dict 39 stargazers count 39
手把手教你实现ROS依赖任意第三方库+lpsolve求解整数线性规划问题为例

How to link dynamic libraries use third party libraries in ROS lpsolve solver as examples 喜欢的话请关注 xff0c 欢迎github 给个小星星 g
UCOS-III

一 UCOSIII 简介 UCOSIII 是一个可裁剪可固化可剥夺的多任务系统 xff0c 没有任务数目的限制 xff0c 是 UCOS 的第三代内核 xff0c UCOSIII 有以下几个重要的特性 xff1a 可剥夺多任务管理 x
【Python】词频统计(written in python and Mapreduce)

一利用Python进行词频统计 xff08 一 xff09 计算机等级考试中常用的方法首先是一个比较标准的考试中使用的方法 xff0c 针对英文文本 xff1a span class token keyword def span spa
数据处理技巧(5)：MATLAB 读取txt中的数据

全是数字的类型 txt 的数据是有数字的 xff0c 如下图 xff1a 读取结点坐标 xff0c 保存在 NodeCoor 数组当中 xff0c 共1331行3列 filename span class token operator 61
基于51单片机的模拟自动感应门系统protues仿真

硬件设计 xff08 末尾附文件 xff09 代码设计 include lt reg51 h gt 调用头文件 define uchar unsigned char 宏定义 define uint unsigned int 宏定义端口定义
linux测试程序

stresslinux super pi prime mprime nbench cpuburn gamut mersenne prime stress cpu burn in memtester memtest86 memtest86 4
mysql 删除多余0的问题

0 43 CAST 字段 AS CHAR 别名可加可不加

随机推荐

三维点沿指定向量方向到平面的距离计算方法及C++代码实现

设平面外一点为P p1 p2 p3 xff0c 指定的方向向量为d 61 d1 d2 d3 xff0c 平面Q方程为Ax 43 By 43 Cz 61 D xff0c 设系数ABC已经归一化 xff0c 则其法向量为n 61 A B C 则
ubuntu使用proxychains给终端设置代理

有时 xff0c 我们需要下载一些国外网站上的东西 xff0c 如果用国内网络直接下载的话 xff0c 往往是连接不上的或者有时下载一个东西速度很慢 xff0c 这都是因为国内网络限制的问题 xff0c 大大影响了我们的工作效率解决方法
int为什么占4个字节？一个字节为什么是8位？

不知道大家有没有思考过这样的问题 xff0c 一个字节为什么是8位呀 xff0c 也许还有小伙伴不知道我说的这些是什么 xff0c 没关系往下看第一个解释 xff08 历史 xff09 是IBM为System 360设计了一套8位EBCD
K8S之kubectl命令详解及示例

目录 1 查看类命令 2 操作类命令 3 进阶命令操作 4 kubectl replace 重启pod的四种方法 5 kubectl语法 1 查看类命令获取节点和服务版本信息 kubectl get nodes 获取节点和服务版本信息 x
ROS运动规划学习五---global_planner

文章目录前言一 global planner功能包结构二 planner core1 执行过程2 calculatePotentials 3 getPlanFromPotential 总结前言本节将学习ROS中的全局规划期global
ROS自定义消息---发布数组和整型数据

ROS自定义消息数组和整型数据前言一 ROS中的消息数据格式二自定义话题消息1 新建msg文件2 编写发布者和接收者程序总结前言 ROS自带的消息格式已经包含一维数组 xff0c 有时候我们需要定义多维数组 xff0c 以及混合数
Markdown中的公式、字母表示汇总

Markdown中的公式字母表示汇总 1 常用希腊字母表2 数学公式最近几个月打了很多Markdown公式 xff0c 隔一段时间就会忘一些表示方式 xff0c 还不如在这里慢慢汇总记录 xff0c 以后要用的时候来查就行了 xff01
CMake项目中神器：CMakeLists.txt

首次接触 CMake xff0c 见识了 CMakeLists txt 的强大后 xff0c 赶紧整理出来分享一下参考资料 xff1a Cmake 3 6 W3Cschool参考手册本文讲述了一个 CMake 项目 xff0c 在从单文
TCP详解之拥塞控制

概述 TCP模块还有一个重要任务 xff0c 就是提高网络利用率 xff0c 降低丢包率 xff0c 并保证网络资源对每条数据流的公平性 xff0c 这就是所谓的拥塞控制拥塞控制的四个部分 xff1a 慢启动拥塞避免快速重传快速恢复
frps搭建自己的内网穿透服务器

frps搭建自己的内网穿透服务器开发过程中 xff0c 很多时候我们需要用到内网穿透 xff0c 将自己的服务器映射到外网 xff0c 下面说一下怎么用frps搭建自己的内网穿透服务器 frps Github地址里面有中文文档 xff0
更换backbone心得

1 对于目标检测 xff0c backbone相当于连接中间环节 xff0c 连接着图片输入和后面的检测头 xff0c 所以在更换网络时候只要注意输入backbone的数据形式以及后面一个环节要求输入的形式 xff0c 把backbone的
from torch._C import *ImportError: DLL load failed while importing _C: 找不到指定的模块。

更新torch的版本 xff0c 原先是1 4 0出现这个问题 xff0c 更新到1 11 0后解决 pip install torch 61 61 1 11 0 43 cpu torchvision 61 61 0 12 0 43 cpu
模型衡量标准recall precision accuracy f1score（hmean）

问题背景 xff1a 在处理分类问题时 xff0c 会遇到一种情况 xff1a 假设一个二元分类问题 xff1a 假设我们的预测算法是 xff1a xff0c 这个算法忽略特征值 xff0c 不管任何情况下都是预测等于0 毫无疑问这是一个糟
layoutlmV3使用步骤

1 layoutlm系列的预训练权重全都是放在huggingface上面 xff0c 安装官方教程如果下载失败 xff0c 可以在linux系统下载 xff0c 然后将下载的缓存文件保存或者在官网上下载并保存需要下载的文件如下图 2 将
Python引用路径

0 官方建议 xff0c 总是优先使用绝对引用 xff0c 只有在引用路径较为复杂导致引用代码很长时 xff0c 才考虑使用相对引用绝对引用优点是清晰且直接 xff0c 可以很容易就确定引用文件位置 xff1b 且即使当前文件的位置发生
关于batch normalization的理解

套餐 xff1a 卷积 43 BN 43 激活 xff0c 原始的BN0 61 X E X std xff0c 减去均值除以标准差 xff0c 改进后的BN 61 BN0 43 xff0c 其中和是通过模型学习得到的原因 xff1a
基于tablemaster的表格检测与表格重构。

1 结果展示原图1 原图1的结果原图2 原图2的结果
【文献笔记】【精读】MobileNet V1

文章目录 1 论文结构2 研究的问题3 文献综述3 1 当前 xff08 2017 xff09 已有的DNN的问题3 2 当前已有的网络轻量化的方法 4 MobileNet 简介4 1 本网络创新点4 2 本网络优点 5 MobileNet
【知识点】神经网络输入归一化区别：[0, 1]和[-1, 1]

1 前置知识 1 1 ReLU的单侧抑制参考 xff1a RELU的单侧抑制单侧抑制含义 xff1a relu的曲线是一个折线 xff0c 在小于0的部分一直为0 xff0c 而在大于0的部分是一条斜率为1的直线单侧抑制的优点 xff
【知识点】机器学习降维方法

摘抄文章 xff1a 打破维度的诅咒 xff0c 机器学习降维大法好为什么数据需要降维机器模型用来帮忙预测一个目标变量 xff0c 但是不一定输入图像的每一个特征都对应目标变量 xff0c 这会使模型变得复杂这里所说的降维的纬度 x

热门标签