查看相关性
方法一:
#df.to_csv('data1.csv') import matplotlib.pyplot as plt import seaborn as sns #变量相关性分析 fig,ax = plt.subplots() fig.set_size_inches(10,10) sns.heatmap(df.corr(),annot=True,cmap='rainbow',ax=ax) plt.xticks(rotation=90) plt.show() |
方法二:
#检查样本特征相关性有无多重相似特征,去除多重相关性特征(保留一列) #特征之间的相关性, 计算数据的相关性 #先读入数据 import numpy as np cor = df.corr() cor.iloc[:,:] = np.tril(cor,k =-1) cor = cor.stack() print(cor[(cor>0.55) | (cor<-0.55) ]) print(cor) |
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)