我有个问题与此类似但我需要采取进一步的措施。问题是我的文件包含 50k 多行。每行有 4 个值“Indicator”、“Country”、“Date”和“value”。我想根据国家/地区拆分我的 CSV。我不知道有多少个国家/地区,因此所有名称相似的国家/地区都应位于一个 CSV 文件中,依此类推。 CSV 文件也没有顺序。我正在使用 pandas,这是迄今为止我的代码:
import pandas as pd
def read_csvfile():
df = pd.read_csv('ebola_data_db_format.csv', sep= ',')
#remove the unneeded columns
df = df[df['Country'] != "Guinea 2"]
df = df[df['Country'] != "Liberia 2"]
#reset the index
df.reset_index(drop=True, inplace=True)
print (df.head(10))
read_csvfile()
我希望能够为每个国家/地区提供一个 CSV 文件,以便我可以单独绘制它们的数据。请帮助!
您可以使用分组:
country_dfs = {k:v for k,v in df.groupby('Country')}
要将它们保存在多个 csv 文件中:
for k, v in df.groupby('Country'):
v.to_csv(f'{k}.csv')
or from country_dfs
:
for k, v in country_dfs.items():
v.to_csv(f'{k}.csv')
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)