我有一个像这样的数据框:
Subject_id Subject Score
Subject_1 Math 5
Subject_1 Language 4
Subject_1 Music 8
Subject_2 Math 8
Subject_2 Language 3
Subject_2 Music 9
我想将它转换成字典,按 subject_id 分组
{'Subject_1': {'Math': 5,
'Language': 4,
'Music': 8},
{'Subject_2': {'Math': 8,
'Language': 3,
'Music': 9}
}
如果我只有一个主题,那么我可以这样做:
my_dict['Subject_1'] = dict(zip(df['Subject'],df['Score']))
但由于我有几个主题,键列表重复,所以我不能直接使用 zip。
数据框有一个.to_dict('index')
方法,但我需要在创建字典时能够按特定列进行分组。
我怎样才能做到这一点?
Thanks.
Use groupby http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.groupby.html具有自定义 lambda 函数和最后的转换输出Series
to_dict http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.to_dict.html:
d = (df.groupby('Subject_id')
.apply(lambda x: dict(zip(x['Subject'],x['Score'])))
.to_dict())
print (d)
{'Subject_2': {'Math': 8, 'Music': 9, 'Language': 3},
'Subject_1': {'Math': 5, 'Music': 8, 'Language': 4}}
Detail:
print (df.groupby('Subject_id').apply(lambda x: dict(zip(x['Subject'],x['Score']))))
Subject_id
Subject_1 {'Math': 5, 'Music': 8, 'Language': 4}
Subject_2 {'Math': 8, 'Music': 9, 'Language': 3}
dtype: object
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)