我有一个文本文件 (one.txt),其中包含任意数量的键值对(其中键和值由=
– e.g. 1=8
)。这里有些例子:
1=88|11=1438|15=KKK|45=00|45=00|21=66|86=a
4=13|11=1438|49=DDD|8=157.73|67=00|45=00|84=b|86=a
6=84|41=18|56=TTT|67=00|4=13|45=00|07=d
我需要创建一个包含字典列表的 DataFrame,每一行作为列表中的一个字典,如下所示:
[{1:88,11:1438,15:kkk,45:7.7....},{4:13,11:1438....},{6:84,41:18,56:TTT...}]
df = pd.read_csv("input.txt",names=['text'],header=None)
data = df['text'].str.split("|")
names=[ y.split('=') for x in data for y in x]
ds=pd.DataFrame(names)
print ds
如何通过拆分为每一行创建字典=
symbol?
它应该是一行多列。
DataFrame 应该将所有键作为行,将值作为列。
Example:
1 11 15 45 21 86 4 49 8 67 84 6 41 56 45 07
88 1438 kkk 00 66 a
na 1438 na .....