我有一个带有多重索引的数据框。我想知道我是否以正确的方式创建了数据框(见下文)。
01.01 02.01 03.01 04.01
bar total1 40 52 18 11
total2 36 85 5 92
baz total1 23 39 45 70
total2 50 49 51 65
foo total1 23 97 17 97
total2 64 56 94 45
qux total1 13 73 38 4
total2 80 8 61 50
df.index.values
结果是:
array([('bar', 'total1'), ('bar', 'total2'), ('baz', 'total1'),
('baz', 'total2'), ('foo', 'total1'), ('foo', 'total2'),
('qux', 'total1'), ('qux', 'total2')], dtype=object)
df.index.get_level_values
结果是:
<bound method MultiIndex.get_level_values of MultiIndex(levels=[[u'bar', u'baz', u'foo', u'qux'], [u'total1', u'total2']],
labels=[[0, 0, 1, 1, 2, 2, 3, 3], [0, 1, 0, 1, 0, 1, 0, 1]],names=[]
我最终希望将 df 转换为字典字典,以便第一个字典键是 ['bar','baz', 'foo','qux'] 之一,值是日期,并制作内部字典'total1' 和 'totals2' 作为键,值是 df 的整数。
另一种解释是,例如如果 dict1 是 dict 那么调用:
dict1['bar']
将导致输出:
{u'bar':{'01.01':{'total1':40,'total2':36},'02.01':{'total1':52,'total2':85},'03.01':{'total1':18,'total2':5},'04.01':{'total1':11,'total2':92} } }
为了实现这一目标,我需要如何以及需要改变什么?这是索引问题吗?