假设我有一个 3 个不同变量的频率表:M1、M2 和 M3,在不同的实例上:P1、... P4:
tupl = [(0.7, 0.2, 0.1), (0,0,1), (0.2,0.6,0.2), (0.6,0.4,0)]
df_test = pd.DataFrame(tupl, columns = ["M1", "M2", "M3"], index =["P1", "P2", "P3", "P4"])
现在,对于每一行,我希望能够将每个变量的出现情况提取为字符串,这样最终的输出将类似于:
output = pd.DataFrame([("M1+M2+M3"), ("M3"), ("M1+M2+M3"), ("M1+M2")], columns = ["label"], index = ["P1", "P2", "P3", "P4"])
我考虑过使用类似 np.where(df_test!=0) 的东西,但是如何将列名称作为字符串粘贴到输出中?