我有一个问题,我有如下所示的巨大数据集(相关系数矩阵)
A B C D E
A 1, 0.413454352,0.615350574,0.479720098,0.34261232
B 0.413454352,1, 0.568124328,0.316543449,0.361164436
C 0.615350574,0.568124328,1, 0.633182519,0.790921334
D 0.479720098,0.316543449,0.633182519,1, 0.450248008
E 0.34261232, 0.361164436,0.790921334,0.450248008,1
我想获取此数据框中单元格值大于 0.6 的所有值,它应该与行名称和列名称一起,如下所示
row_name col_name value
1 A C 0.61
2 C A 0.61
3 C D 0.63
3 C E 0.79
4 D C 0.63
5 E C 0.79
如果我们也可以忽略 (A,C) 或 (C,A) ..那就更好了。
我知道我可以使用 for 循环来完成此操作,但该方法对于大型数据集效率不高。