主成分分析Python代码

2023-11-01

对于主成分分析详细的介绍：主成分分析（PCA）原理详解https://blog.csdn.net/zhongkelee/article/details/44064401

import numpy as np
import pandas as pd

'''标准PCA算法'''
def standeredPCA(data,N):                                   #data:数据集DataFrame  N:降维后需要的维数
    n=data.shape[1]                                         #数据集data的列数，即维度
    m=data.shape[0]                                         #数据集data的行数
    colname=list(data.columns)                              #提取列名
    AVG=[]                                                  #原始各个维度的平均值

    for i in range(n):
        avg=0
        s=list(data[colname[i]])
        num=len(s)
        for j in s:
            avg+=j
        avg=avg/num
        AVG.append(avg)

    '''将每一列数据都转换成列表型'''
    df=[]                                                   #存储每一列的数据
    for i in range(n):
        ls=list(data[colname[i]])
        df.append(ls)

    '''数据中心化'''
    for i in range(n):
        t=df[i]
        for j in range(len(t)):
            t[j]=t[j]-AVG[i]

    '''求特征协方差矩阵'''
    A=np.zeros((n,n))
    for i in range(n):
        for j in range(n):
            p=df[i]
            q=df[j]
            for k in range(m):
                A[i][j]+=p[k]*q[k]
            A[i][j]=A[i][j]/(m-1)

    '''求协方差的特征值和特征向量'''
    B=np.linalg.eig(A)
    P=B.eigenvalues                                         #特征值
    Q=B.eigenvectors                                        #特征向量
    U=[index for index, value in sorted(list(enumerate(P)), key=lambda x:x[1])]     #对特征值排序输出索引值序列
    U=sorted(U,reverse=True)                                #特征值从大到小排序的索引值
    u=[]                                                    #输出排在前N个的索引值
    for i in range(N):
        u.append(U[i])
    r=[]                                                     #需要的特征值
    t=[]                                                     #需要的特征向量
    for i in u:
        r.append(P[i])
        T=[]
        for j in Q:
            T.append(j[i])
        t.append(T)

    '''得到通过PCA后获得的N个特征的数据'''
    W=[]                            #存储通过PCA后得到的每一个特征的数据【列表】
    for i in range(N):
        a=[]                        #存储通过PCA的特征数据
        b=t[i]
        for j in range(m):          #遍历数据的行
            f=0
            for k in range(n):      #遍历数据的列
                f=f+df[k][j]*b[k]
            a.append(f)
        W.append(a)

    '''输出经过PCA降维处理后得到的N个特征数据'''
    fdata=pd.DataFrame(W)
    fdata=fdata.T
    print("经过PCA降维后得到的结果如下：")
    print(fdata)
          
    '''计算特征信息提取率'''
    sum=0
    for i in P:
        sum+=i
    fsum=0
    for i in u:
        fsum+=P[i]
    PCAprecent=fsum/sum
    print("PCA数据特征的信息提取率是：{}".format(PCAprecent))


if __name__=="__main__":
    df = {'x': [2.5, 0.5, 2.2, 1.9, 3.1, 2.3, 2, 1, 1.5, 1.1], 'y': [2.4, 0.7, 2.9, 2.2, 3.0, 2.7, 1.6, 1.1, 1.6, 0.9]}
    data = pd.DataFrame(df)
    standeredPCA(data, 1)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

开发语言

PCA

主成分分析

主成分分析Python代码的相关文章

min() arg 是一个空序列

我试图找到矩阵行中的最小元素但有两个条件 1 它必须 gt 0 2 并且这个点一定不能被访问 is visited k is False 我下一步正在尝试做 min x for x in matr sum i if x gt 0 if i
Json.dump 失败并显示“必须是 unicode，而不是 str”TypeError

我有一个 json 文件其中恰好有大量中文和日文以及其他语言字符我将其加载到我的 python 2 7 脚本中使用io open如下 with io open multiIdName json encoding utf 8 as j
如何在python 2.7.8中将非英文字母的字典写入文件？

这是一个简单的例子 test location 北京 country 中国 the values are Chinese 在文件 test log 中 location 北京 country 中国在python 2 7 8中当我需要输出
为什么我会得到“ufunc 'multiply' did not contains a loop with Signature Matching types dtype('S32') dtype('S32') dtype('S32')”，其值来自 raw_

我正在尝试创建一个非常简单的程序它将绘制一个抛物线其中v是速度 a是加速度和x是时间用户将输入值v and a then v and a and x将决定y 我试图用这个来做到这一点 x np linspace 0 9 10 a ra
使用 Python 将阿拉伯语或任何从右到左书写系统的字符串打印到 Linux 终端

非常简单的例子是 city print city 我期望输出是但实际上输出是相反的字符串字母看起来有点不同因为它们有开始中间和结束形式我无法将其粘贴到此处因为复制粘贴会再次更正字符串的顺序如何在 Linux 终端上正确打印阿拉
如何将嵌套的Python字典转换为简单的命名空间？

假设我有一个深度为 N 的嵌套字典如何将每个内部嵌套字典转换为简单的命名空间 example input key0a test key0b key1a key2a keyNx key2b test key1b test example o
Python 中嵌套列表的排序和分组

我有以下数据结构列表的列表 4 21 1 14 2008 10 24 15 42 58 3 22 4 2somename 2008 10 24 15 22 03 5 21 3 19 2008 10 24 15 45 45 6 21 1 1
使用 argparse 指定默认文件名，但不使用 --help 打开它们？

假设我有一个对文件执行一些操作的脚本它在命令行上获取此文件的名称但如果未提供则默认为已知文件名 content txt 说与蟒蛇的argparse 我使用以下内容 parser argparse ArgumentParser des
如何从 Python 3.5 降级到 3.4

我想安装 kivy 链接在这里 https kivy org docs installation installation windows html install win dist 用于项目但是当尝试使用 pip 安装它所依赖的包时
t /= d 是什么意思？ Python 和错误

t current time b begInnIng value c change In value d duration def easeOutQuad swing function x t b c d alert jQuery easi
自适应支付 API 错误 580001

我正在 python 中向 paypal 自适应支付 API 发出 PAY 请求并收到通用错误 id 580001 没有其他信息 headers API credentials for the API caller business ac
如何向 RetrievalQA.from_chain_type 添加内存？或者，如何向 ConversationalRetrievalChain 添加自定义提示？

如何向 RetrievalQA from chain type 添加内存或者如何向 ConversationalRetrievalChain 添加自定义提示在过去的两周里我一直在尝试制作一个可以通过文档聊天的聊天机器人因此不仅仅是
Python itertools groupby 中令人不安的奇怪行为/错误？

我在用itertools groupby解析一个短的制表符分隔的文本文件文本文件有几列我想做的就是对具有特定值的所有条目进行分组x在特定的列中下面的代码对名为的列执行此操作name2 寻找变量中的值x 我尝试使用以下方法来做到这一点c
pandas-更改重采样时间序列的开始和结束日期

我有一个时间序列我将其重新采样到这个数据框中df 我的数据是从6月6日到6月28日它希望将数据从6月1日延长到6月30日计数列仅在较长时间内具有 0 值而我的实际值是从 6 日到 28 日 Out 123 count Timesta
枚举上的 random.choice

我想用random choice on an Enum I tried class Foo Enum a 0 b 1 c 2 bar random choice Foo 但是这段代码失败了KeyError 我怎样才能随机选择一个成员Enum
执行许多插入重复键更新错误：未使用所有参数

所以我一直在尝试使用 python 2 7 15 使用 mysql connector 执行此查询但由于某种原因它似乎不起作用并且总是返回错误并非所有参数都被使用表更新有一个主键即 ID 这是我尝试运行此 SQL 的查询 sql
如何使用 PyAudio 选择特定的输入设备

通过 PyAudio 录制音频时如何指定要使用的确切输入设备我的电脑有两个麦克风一个内置一个通过 USB 我想使用 USB 麦克风进行录音这流类 https people csail mit edu hubert pyaudio
将同一 numpy 数组的两个视图组合成单个视图而不复制数组？

我有一个大型 2d numpy 数组我想删除它的子集并处理函数剩下的内容我需要对许多子集执行此操作因此理想情况下我不想每次都创建数组的副本该函数不会更改数组中的任何值 mat np load filename mat 1 mat i
IOError：在 Linux 上的 ReportLab 中使用 matplotlib PNG 时“解码器 zip 不可用”，适用于 Windows

我正在使用 ReportLab 打印 matplotlib 生成的图表我可以在我的 Windows 开发机器上毫无问题地执行此操作然而当我部署到 Ubuntu 服务器时渲染失败并出现所述错误我假设我缺少一个 Python 模块但
使用 TkInter 绑定设置不可交互（点击）覆盖

我已经浏览了其他几篇关于类似问题的帖子所有这些似乎都指向this https stackoverflow com questions 29458775 tkinter see through window not affected by

随机推荐

java中的数组上

目录数组的概述一维数组的使用声明初始化数组元素的引用数组元素的默认初始化值一维数组的内存解析多维数组多维数组的使用二维数组的内存解析数组的概述数组 Array 是多个相同类型数据按一定顺序排列的集合并使用
常用正则表达式例子

原文 http blog sina com cn s blog 4c646b600100evq3 html 1 d 匹配非负整数正整数 0 2 0 9 1 9 0 9 匹配正整数 3 d 0 匹配非正整数负整数 0 4 0 9 1 9
【蓝桥杯】第十四届蓝桥杯模拟赛（第三期）C++ （弱go的记录，有问题的话求指点）

博主是菜鸡啦代码仅供参考只确定能过样例嘻嘻第一题填空题问题描述请找到一个大于 2022 的最小数这个数转换成十六进制之后所有的数位不含前导 0 都为字母 A 到 F 请将这个数的十进制形式作为答案提交答案提交这是一道
css的list,CSS List 入门教程

CSS List 入门教程 list指得是在css中的li等标签的控制了面list也有四个属性其实有五个我们只讲常用的4个了他们分别为 list style list style image list style position l
【thinkphp5学习笔记之一】安装

一安装composer 1 点此下载composer 然后运行 2 打开cmd 按行分别输入以下代码要求php安装并且路径配置完毕 php r copy https install phpcomposer com installer c
51单片机实战教程之C语言基础（二 C语言运算符）

Keil C51基础之运算符详解一算术运算符包括加减乘除取模自加自减示例 5 3 结果 2 char a 5 a 结果 5 1 a为6 a 结果 6 1 a为 5 二关系运算符包括小于 lt 小于等于 lt 大于 g
Chrome 截图页面全图

打开谷歌浏览器按F12 弹出开发者工作开发者工具中按下快捷键组合Ctrl Shift P Windows 在命令行中输入 Screen 可以看到三个选项根据不同需求进行选择具体如下图所示整个网页 Capture full siz
圆周率 π 是否隐藏了本个宇宙的设计者留给这个宇宙的智慧文明的某种信息？...

还是太naive了我要是宇宙设计者我就把信息藏在蔡廷常数里这才是对人类最大的嘲讽蔡廷常数其含义是找随机生成一段程序这段程序不会陷入死循环的概率可以证明这是一个确定存在的无理数但是同样可以证明它是不可以被计算出来的实际上能
LeetCode:58. 最后一个单词的长度

给你一个字符串 s 由若干单词组成单词前后用一些空格字符隔开返回字符串中最后一个单词的长度单词是指仅由字母组成不包含任何空格字符的最大子字符串示例 1 输入 s Hello World 输出 5 解释最后一个单词是 Wor
'umi' 不是内部或外部命令

1 首先需要安装Node js 一路下一步安装并确保 node 版本是 8 10 或以上 mac 下推荐使用 nvm 来管理 node 版本安装完成后通过node v 命令查看其版本号 2 推荐使用 yarn 管理 npm 依赖并
Unity批量预设体替换材质球

using System Collections using System Collections Generic using UnityEditor using UnityEngine using UnityEngine UI using
linux查看端口的使用情况

lsof 查看端口占用语法格式 lsof i 端口号 lsof i 8080 查看8080端口占用 lsof abc txt 显示开启文件abc txt的进程 lsof c abc 显示abc进程现在打开的文件 lsof c p 1234
docker配置文件挂载(容器数据管理)

目录数据卷容器数据管理什么是数据卷数据集操作命令创建和查看数据卷挂载数据卷案例案例给nginx挂载数据卷案例给MySQL挂载本地目录总结数据卷容器数据管理在之前的nginx案例中修改nginx的html页面时
大数据平台测试-后端代码覆盖率工具

一后端覆盖率工具在后端开发中常用的覆盖率工具包括 JaCoCo Java Code Coverage JaCoCo 是一个流行的 Java 代码覆盖率工具它可以在编译期间插入字节码收集覆盖率信息并生成报告 JaCoCo 支持行覆
VScode react @ import引入路径智能提示

1 安装Path Intellisense插件 2 在settings json中配置 path intellisense mappings workspaceRoot src 3 在项目package json所在同级目录下创建文件jsc
Object Detection

目标检测神文非常全而且持续在更新转发自 https handong1587 github io deep learning 2015 10 09 object detection html 如有侵权联系删除我会跟进原作者博客持续更新
TransactionTemplate 事务编程式写法

建议使用声明式事务 Transactional rollbackFor Exception class 粒度不够拆分方法 import org springframework transaction support Transaction
题目68 求随机整书数组中两个数和绝对值最小值（ok）

给定一个随机的整数数组可能存在正整数和负整数 nums 请你在该数组中找出两个数其和的绝对值 nums x nums y 为最小值并返回这两个数按从小到大返回以及绝对值每种输入只会对应一个答案但是数组中同一个元素不能使用两遍
Python(8):循环语句

Python循环语句今天重点学习关于循环的关键字 for while else ranage break continue pass while 一般形式 while 判断条件 condition 执行语句块statements 直接上代
主成分分析Python代码

对于主成分分析详细的介绍主成分分析 PCA 原理详解https blog csdn net zhongkelee article details 44064401 import numpy as np import pandas as p

主成分分析Python代码

主成分分析Python代码 的相关文章

随机推荐

热门标签

主成分分析Python代码的相关文章