Pandas 根据列中的值将数据帧拆分为多个 csv

2023-12-09

我有个问题与此类似但我需要采取进一步的措施。问题是我的文件包含 50k 多行。每行有 4 个值“Indicator”、“Country”、“Date”和“value”。我想根据国家/地区拆分我的 CSV。我不知道有多少个国家/地区，因此所有名称相似的国家/地区都应位于一个 CSV 文件中，依此类推。 CSV 文件也没有顺序。我正在使用 pandas，这是迄今为止我的代码：

import pandas as pd
def read_csvfile():
    df = pd.read_csv('ebola_data_db_format.csv', sep= ',')
    
    #remove the unneeded columns
    df = df[df['Country'] != "Guinea 2"]  
    df = df[df['Country'] != "Liberia 2"]
   
    #reset the index
    df.reset_index(drop=True, inplace=True)
    print (df.head(10))

read_csvfile()

我希望能够为每个国家/地区提供一个 CSV 文件，以便我可以单独绘制它们的数据。请帮助！

您可以使用分组：

country_dfs = {k:v for k,v in df.groupby('Country')}

要将它们保存在多个 csv 文件中：

for k, v in df.groupby('Country'):
    v.to_csv(f'{k}.csv')

or from country_dfs:

for k, v in country_dfs.items():
    v.to_csv(f'{k}.csv')

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

DataFrame

csv

Pandas 根据列中的值将数据帧拆分为多个 csv 的相关文章

如何显示 pymongo.errors.OperationFailure 详细信息？

写入 MongoDB 时我在 python 中遇到 pymongo OperationsFailure 除了回溯之外还有没有办法打印出详细信息或代码属性另请参阅 http api mongodb org python current
Python Turtle 中的 onkeypress() 和 Listen() 问题

我的一个功能有问题我使用 Python 3 7 当我尝试使用onkeypress 函数什么也没有发生我尝试检查它但是当我按键时乌龟模块没有反应我尝试使用 w 键向上移动桨但这不起作用以下是我的 py 文件 main py im
Python + Selenium：驱动程序路径

是否有可能在不输入路径的情况下运行 Python Selenium 脚本exePython 行中每个脚本中的文件 driver webdriver Chrome 同样的问题也适用于 IE 驱动程序 Edge 驱动程序和 Gecko 驱动程
如何针对 Heroku 路由器的代理/缓冲情况优化 uWSGI？

我在 Heroku 的生产中使用 uWSGI 已有一年多了它似乎比 Gunicorn 处理所有事情都要好得多随着我们的流量扩大我试图更好地理解heroku的路由器和uWSGI之间的接口以优化和防止问题但它对我来说仍然相当不透明我
从两个列表中查找总和等于 x 的 2 个数字的最快方法

我的代码 n 3 a1 0 b1 10 a2 2 b2 2 if b1 gt n b1 n if b2 gt n b2 n diap1 x for x in range a1 b1 1 diap2 x for x in range a2 b
Tastypie：GET 的身份验证和 POST 的匿名

我使用 Django Tastypie 来管理我的用户集合是否可以允许匿名用户在 API 中发布在某个端点创建新用户时并限制经过身份验证的用户仅获取自己的用户而不是所有用户感谢您的帮助我发现最简单的事情就是对我正在使用的身份验证
AMLS 实验运行停留在“正在运行”状态

我运行了 Azure 机器学习服务实验并使用 Jupyter Notebook 记录了神经网络损失日志记录工作正常神经网络训练也按预期完成但实验一直停留在运行状态关闭计算资源不会关闭实验运行我无法从实验面板取消它此外运行没有
在Python中绘制像素的最佳方法[关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案我想知道用 x 和 y 值在 python 中绘制像素的最简单方法是什么可能最简单的方法是使用PIL http effbot org i
如何使用 BeautifulSoup 排除表中的某些行？

我已经从表格中获得了所需的数据但不想要各个玩家统计数据之间的缩写 Rk Pos Name 等如何在保留所需数据的同时排除这些数据包含缩写的行被归类为 thead 但我不知道如何使用该信息来跳过它我知道玩家的数据都被压缩在一起但现在
如何在Python中生成0-1矩阵的所有可能组合？

如何生成大小为 K N 的 0 1 矩阵的所有可能组合例如如果我取 K 2 和 N 2 我会得到以下组合 combination 1 0 0 0 0 combination 2 1 0 0 0 combination 3 0 1 0 0
由 asyncio.new_event_loop 创建的事件循环挂起

以下代码只是挂起而不打印任何内容 import asyncio async def foo loop print foo loop stop loop asyncio new event loop asyncio ensure future
使用 Cython 扩展模块分发共享库和一些 C 代码

我正在尝试从大型 C 共享库 libbig so 中获取一些函数并通过 Cython 将它们公开给 Python 为此我有一个小 C 文件 small cpp 它为我需要的共享库的功能提供了一个薄包装器从而可以轻松地通过 Cython
相比之下，超出了最大递归深度

我写了这段代码来计算组合的数量 def fact n return 1 if n 1 else n fact n 1 def combinations n k return fact n fact n k fact k while True
在 ubuntu 12.04 上安装 ReviewBoard

我正在尝试使用 easy install 在 ubuntu 12 04 上安装 ReviewBoard http www reviewboard org docs manual 1 7 admin installation linux ht
将 Pandas DataFrame 和元数据保存为 JSON 格式

我需要将 Pandas DataFrame 以及一些元数据保存到 JSON 格式的文件中 JSON 格式是必需的背景 A 我可以使用 JSON 成功地读取写入相当大的 Pandas DataframeDataFrame to json
Django 和 REST API 服务基于计算的请求

我在 Django 中编写了一个机器学习应用程序以便用户可以在表单中指定一些参数并训练模型模型训练完成后我想满足以下请求 curl http localhost 8000 model input XYZ 我希望 Django 返回给定
Numpy 相当于 if/else 不带循环

有没有任何Pythonic方法可以删除下面代码中的for循环和if else 此代码迭代 NumPy 数组并检查条件并根据条件更改值 gt gt gt import numpy as np gt gt gt x np random rand
从线程队列中获取所有项目

我有一个线程将结果写入队列在另一个线程 GUI 中我定期在 IDLE 事件中检查队列中是否有结果如下所示 def queue get all q items while 1 try items append q get nowai
如何在（最好是纯）Python 中解码 QR 码图像？

TL DR 我需要一种使用最好是纯 Python 从图像文件中解码 QR 码的方法我有一个带有 QR 码的 jpg 文件我想使用 Python 对其进行解码我发现有几个库声称可以做到这一点 PyQRCode 网站在这里 http p
检查Python multiprocessing.Connection 的实例吗？

Connection对象是在打开时创建的multiprocessing Pipe 然而尚不清楚如何检查一个对象是否是一个实例Connection 在Python3 3 4 3 3 3 2 中检测Connection我可以 from mu

随机推荐

寻找哈希函数 /Ordered Int/ 到 /Shuffled Int/

我正在寻找可以将有序整数索引值更改为随机哈希索引的恒定时间算法如果是可逆的就太好了我需要每个索引的哈希键都是唯一的我知道这可以通过在大文件中查找表来完成 IE 创建所有整数的有序集合然后随机打乱它们并以随机顺序写入文件然后您可以在
三维数组

在分类问题中我有c数据类别每个类别都有e该数据的示例每个示例由长度为的特征向量表示f 在 Matlab 中表示此结构的最佳方式是什么我可以用一个c by e元胞数组其中每个元素都是长度的一维数组f 但是我想避免使用元胞数组如
如何在 Python 中初始化空列表字典？

我尝试以编程方式创建列表字典但无法单独寻址字典键每当我创建列表字典并尝试附加到一个键时所有这些都会更新这是一个非常简单的测试用例 data data data fromkeys range 2 data 1 append hello
桌面的屏幕截图目标区域

我正在尝试用 C 重新创建一个 Winform 应用程序该应用程序具有与 Windows 截图工具提供的相同功能也就是说允许用户在桌面上拖动一个矩形并捕获其中的内容作为图像目前我只能用鼠标绘制一个矩形而且是在 winform 中
获取对