如何在 Python 中使用 PCA/SVD 进行特征选择和识别？

2024-01-29

我正在跟进Python 中的主成分分析 https://stackoverflow.com/questions/1730600/principal-component-analysis-in-python在Python下使用PCA，但我很难确定which可供选择的特征（即我的哪些列/特征具有最佳方差）。

当我使用scipy.linalg.svd，它会自动对我的奇异值进行排序，所以我无法分辨它们属于哪一列。

示例代码：

import numpy as np
from scipy.linalg import svd
M = [
     [1, 1, 1, 1, 1, 1],
     [3, 3, 3, 3, 3, 3],
     [2, 2, 2, 2, 2, 2],
     [9, 9, 9, 9, 9, 9]
]
M = np.transpose(np.array(M))
U,s,Vt = svd(M, full_matrices=False)
print s

在不对奇异值进行排序的情况下，是否有其他方法可以解决此问题？

Update:看起来这可能是不可能的，至少根据 Matlab 论坛上的这篇文章：http://www.mathworks.com/matlabcentral/newsreader/view_thread/241607 http://www.mathworks.com/matlabcentral/newsreader/view_thread/241607。如果有人知道其他情况，请告诉我:)

我对 PCA 的印象是错误的特征选择，而相反特征提取.

相反，PCA 创建了一系列新的特征，每个特征都是输入特征的组合。

来自 PCA，如果你真的想做的话特征选择，您可以查看输入特征在 PCA 创建的特征上的权重。例如，matplotlib.mlab.PCA库提供属性中的权重（有关图书馆的更多信息 http://www.clear.rice.edu/comp130/12spring/pca/pca_docs.shtml#a):

from matplotlib.mlab import PCA
res = PCA(data)
print "weights of input vectors: %s" % res.Wt

听起来像特征提取不过，route 是使用 PCA 的方法。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何在 Python 中使用 PCA/SVD 进行特征选择和识别？的相关文章

使用特定的类/函数预加载 Jupyter Notebook

我想预加载一个笔记本其中包含我在另一个文件中定义的特定类函数更具体地说我想用 python 来做到这一点比如加载一个配置文件包含所有相关的类函数目前我正在使用 python 生成笔记本并在服务器上自动启动它们因为不同的
Python 中的哈希映射

我想用Python实现HashMap 我想请求用户输入根据他的输入我从 HashMap 中检索一些信息如果用户输入HashMap的某个键我想检索相应的值如何在 Python 中实现此功能 HashMap
跟踪 pypi 依赖项 - 谁在使用我的包

无论如何是否可以通过 pip 或 PyPi 来识别哪些项目在 Pypi 上发布可能正在使用我的包也在 PyPi 上发布我想确定每个包的用户群以及可能尝试积极与他们互动预先感谢您的任何答案即使我想做的事情是不可能的这实际上是不
使用 kivy textinput 的 'input_type' 属性的问题

您好我在使用 kivy 的文本输入小部件的 input type 属性时遇到问题问题是我制作了两个自定义文本输入其中一个称为 StrText 其中设置了 input type text 然后是第二个文本输入名为 NumText 其
使用 xlrd 打开 BytesIO (xlsx)

我正在使用 Django 需要读取上传的 xlsx 文件的工作表和单元格使用 xlrd 应该可以但因为文件必须保留在内存中并且可能不会保存到我不知道如何继续的位置本例中的起点是一个带有上传输入和提交按钮的网页提交后文件被捕获req
Python 2：SMTPServerDisconnected：连接意外关闭

我在用 Python 发送电子邮件时遇到一个小问题 me my email address you recipient s email address me email protected cdn cgi l email protectio
从Python中的字典列表中查找特定值

我的字典列表中有以下数据 data I versicolor 0 Sepal Length 7 9 I setosa 0 I virginica 1 I versicolor 0 I setosa 1 I virginica 0 Sepal
“隐藏”内置类对象、函数、代码等的名称和性质[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我很好奇模块中存在的类builtins无法直接访问的例如 type lambda 0 name function of module
在 Sphinx 文档中*仅*显示文档字符串？

Sphinx有一个功能叫做automethod从方法的文档字符串中提取文档并将其嵌入到文档中但它不仅嵌入了文档字符串还嵌入了方法签名名称参数我如何嵌入only文档字符串不包括方法签名 ref http www sphinx do
如何通过 TLS 1.2 运行 django runserver

我正在本地 Mac OS X 机器上测试 Stripe 订单我正在实现这段代码 stripe api key settings STRIPE SECRET order stripe Order create currency usd em
Numpy - 根据表示一维的坐标向量的条件替换数组中的值

我有一个data多维数组最后一个是距离另一方面我有距离向量r 例如 Data np ones 20 30 100 r np linspace 10 50 100 最后我还有一个临界距离值列表称为r0 使得 r0 shape Dat
加快网络抓取速度

我正在使用一个非常简单的网络抓取工具抓取 23770 个网页scrapy 我对 scrapy 甚至 python 都很陌生但设法编写了一个可以完成这项工作的蜘蛛然而它确实很慢爬行 23770 个页面大约需要 28 小时我看过scr
不同编程语言中的浮点数学

我知道浮点数学充其量可能是丑陋的但我想知道是否有人可以解释以下怪癖在大多数编程语言中我测试了 0 4 到 0 2 的加法会产生轻微的错误而 0 4 0 1 0 1 则不会产生错误两者计算不平等的原因是什么在各自的编程语言中可以采
仅第一个加载的 Django 站点有效

我最近向 stackoverflow 提交了一个问题标题为使用mod wsgi在apache上多次请求后Django无限加载 https stackoverflow com questions 71705909 django infini
如何使用原始 SQL 查询实现搜索功能

我正在创建一个由 CS50 的网络系列指导的应用程序这要求我仅使用原始 SQL 查询而不是 ORM 我正在尝试创建一个搜索功能用户可以在其中查找存储在数据库中的书籍列表我希望他们能够查询书籍表中的 ISBN 标题作者列目前它
Pandas 将多行列数据帧转换为单行多列数据帧

我的数据框如下 code df Car measurements Before After amb temp 30 268212 26 627491 engine temp 41 812730 39 254255 engine eff 15
根据列 value_counts 过滤数据框（pandas）

我是第一次尝试熊猫我有一个包含两列的数据框 user id and string 每个 user id 可能有多个字符串因此会多次出现在数据帧中我想从中导出另一个数据框一个只有那些user ids列出至少有 2 个或更多string
Python：XML 内所有标签名称中的字符串替换（将连字符替换为下划线）

我有一个格式不太好的 XML 标签名称内有连字符我想用下划线替换它以便能够与 lxml objectify 一起使用我想替换所有标签名称包括嵌套的子标签示例 XML
将 Python 中的日期与日期时间进行比较

所以我有一个日期列表 datetime date 2013 7 9 datetime date 2013 7 12 datetime date 2013 7 15 datetime date 2013 7 18 datetime date
Kivy - 单击按钮时编辑标签

我希望 Button1 在单击时编辑标签 etykietka 但我不知道如何操作你有什么想法吗 class Zastepstwa App def build self lista WebOps getList layout BoxLayo

随机推荐

运行 paramiko 时 Python 模块 ecdsa 错误

我正在尝试安装 paramiko 模块它失败并出现以下错误 python test py Traceback most recent call last File test py line 30 in
为什么当我为 CABasicAnimation 设置较低的持续时间值时，它会跳跃？

示例项目 http cl ly 1W3V3b0D2001 http cl ly 1W3V3b0D2001 我在用着CABasicAnimation创建一个类似于饼图的进度指示器类似于iOS 7应用程序下载动画动画设置如下 void dr
在 Cloud Firestore 安全规则中将字符串转换为 Int

I am 来自这个问题 https stackoverflow com q 48795711 6509751 我想过开始对它进行赏金因为它已经几个月没有受到任何关注而且随着时间的推移我没有看到任何答案但我认为我的愿望有点不同如果有一
使用 addTextTrack() 动态更改 videojs 字幕

我正在尝试构建一些类似视频库的东西您可以通过单击缩略图来选择要显示的视频现在我正处于为所选视频加载适当字幕的阶段感谢谷歌我了解到 videojs 有一个名为 addTextTrack 的方法来帮助我但不幸的是没有一个好的示例或文档
JRuby - Warbler 不保留符号链接

使用 warbler 打包应用程序时符号链接会丢失符号链接指向的实际内容将打包为 WAR 的一部分就我而言我有一个从 public images upload 到 var myproject upload 的符号链接在 tomca
删除网络推送通知

有没有办法在显示后删除网络推送通知要将其从设备上的通知列表中删除或将其标记为已读我认为这不能从服务器完成并且我一直在寻找 Javascript API 但我没有找到任何东西我试图解决的更广泛的问题是如何在多个屏幕浏览器设备上
背后的概念是什么：类型-元素-镜子

我正在使用 Java 6 的注释处理即可以在其中找到什么javax annotation processing 不是 Java 5 的 APT 我想知道各种之间的概念差异是什么Element Type and Mirror类群岛由于我不太
使用 python 处理 ember.js 标记的 html

我有以下场景我们正在使用web2py http www web2py com在服务器端我们正在服务一些ember js http emberjs com pages 目前这些 ember js 页面位于 iframe 内因为ember
docker：如何显示两个图像之间的差异

我有一个 Dockerfile 其中包含一系列执行 apt get install 的 RUN 指令例如几行 RUN apt get install y tree RUN apt get install y git 执行 docker
Windows Azure 存储（Blob、表、队列）是否针对 Windows Azure 角色的访问进行了优化？

我目前正在考虑在 Windows Azure 上托管弹性搜索 http www elasticsearch org 执行加载应用程序并在 Java 下运行它并不那么困难现在 ElasticSearch仅支持亚马逊的S3 http ela
Jetpack Compose 使用 CoroutineScope 滚动 LazyColumn 结果错误 A MonotonicFrameClock 在此 CoroutineContext 中不可用

退房这个例子 https developer android com codelabs jetpack compose layouts 5使用状态和协程滚动列表 Composable fun ScrollingList val listSi
使用一次更新设置多列

如何在mysql中使用更新查询设置表的多列只需添加参数用逗号分隔 UPDATE tablename SET column1 value1 column2 value2 也可以看看 mySQL 更新手册 http dev mysql co
如何在 VS2010 Express 中使静态库独立于发布/调试？

我正在编写一个应用程序并链接 SDL 和 OpenGL 在我的代码中我有以下几行 pragma comment lib sdl lib pragma comment lib sdlmain lib pragma comment lib o
根据方法参数生成唯一的缓存键

我有一个基本的存储库框架它最终执行查询并将结果映射回对象例如 public SomeEntity Get id return base GetItem
如何在 iOS 中正确变形文本？

我拼命地想改变smallLabel into a bigLabel By morphing 我的意思是转换一个标签的以下属性以匹配另一个标签的相应属性并具有平滑的动画字体大小字体粗细框架即边界和位置所需的效果应该类似于使用大标题
在 2.6 上合并 n 字典并添加值的最快方法[重复]

这个问题在这里已经有答案了我有一个字典列表我想将其组合成一个字典并添加列表中每个字典中的值例如 ds 1 1 2 0 3 0 1 2 2 1 3 0 1 3 2 2 3 1 4 5 最终结果应该是一个字典 merged 1 6 2
PHP：$_POST 全局变量的总长度是多少？

我想知道是否有人知道全球邮政的总长度例如 POST formInput hello world how long can I be 我正在创建一个网站有人会在其中输入未知数量的字符textarea 因此可能是一个 Word 文档的 2
重定向 ip6tables 中的端口

如何使用 ip6tables 将一个端口重定向到另一个本地端口例如像这样的东西 ip6tables t nat A 预路由 j 重定向 p tcp dport 443 to ports 8443 嗯这是一个老问题但因为我需要做同样的事
Android 模拟 Espresso 测试的 Dagger2 注入依赖项

我注入了严重的依赖项 dagger2 应用我想经营一个浓缩咖啡测试无需测试浏览整个应用程序并登录到应用程序我想开始我的 teleActivity 并模拟登录管理器然而在任何 test 函数中当我们调用 onCreate 时我们已
如何在 Python 中使用 PCA/SVD 进行特征选择和识别？

我正在跟进Python 中的主成分分析 https stackoverflow com questions 1730600 principal component analysis in python在Python下使用PCA 但我很难确定

如何在 Python 中使用 PCA/SVD 进行特征选择和识别？

如何在 Python 中使用 PCA/SVD 进行特征选择和识别？ 的相关文章

随机推荐

热门标签

如何在 Python 中使用 PCA/SVD 进行特征选择和识别？的相关文章