重新采样 Pandas 数据框并合并列中的字符串

2024-01-27

我想重新采样 pandas 数据框并将不同的函数应用于不同的列。问题是我无法正确处理带有字符串的列。我想应用一个将字符串与分隔符(例如“ - ”)合并的函数。这是一个数据示例:

import pandas as pd
import numpy as np
idx = pd.date_range('2017-01-31', '2017-02-03')
data=list([[1,10,"ok"],[2,20,"merge"],[3,30,"us"]])
dates=pd.DatetimeIndex(['2017-01-31','2017-02-03','2017-02-03'])
d=pd.DataFrame(data, index=,columns=list('ABC'))

            A   B          C
2017-01-31  1  10         ok
2017-02-03  2  20      merge
2017-02-03  3  30         us 

使用总和和均值聚合器对数字列 A 和 B 进行重新采样是可行的。然而,C 列可以与 sum 一起使用(但它被放置在第二位,这可能意味着某些事情失败)。

d.resample('D').agg({'A': sum, 'B': np.mean, 'C': sum})

              A               C     B
2017-01-31  1.0               a  10.0
2017-02-01  NaN               0   NaN
2017-02-02  NaN               0   NaN
2017-02-03  5.0        merge us  25.0

我想得到这个:

...
2017-02-03  5.0      merge - us  25.0

我尝试以不同的方式使用 lambda 但没有成功(未显示)。

如果我可以问第二个相关问题:我可以为此进行一些后处理,但是如何用零或“”填充不同列中缺失的单元格?


您的列的聚合函数'C'应该是一个join

d.resample('D').agg({'A': sum, 'B': np.mean, 'C': ' - '.join})

              A     B           C
2017-01-31  1.0  10.0          ok
2017-02-01  NaN   NaN            
2017-02-02  NaN   NaN            
2017-02-03  5.0  25.0  merge - us
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

重新采样 Pandas 数据框并合并列中的字符串 的相关文章

  • django 管理站点导航侧边栏搞砸了

    我最近在我的项目中添加了一个包并做了一个pip freeze gt requirements txt然后 然后我做了pip install r requirements txt到我的本地 它添加了一个侧边栏 I did a pip inst
  • 计时器显示负的已用时间

    我正在使用一个非常简单的代码来计算每个循环的时间for陈述 它看起来像这样 import time for item in list of files Start timing this loop start time clock Do a
  • uwsgi + Django REST框架:空闲时间后很少有缓慢的请求

    我正在运行 Django REST 框架 白天每分钟的请求率相当低 我注意到一个我无法解释或重现的问题 每天 在夜间或清晨 当我的 RPM 接近于零时 我会收到 1 10 个超慢的请求 我的平均响应时间100 到 200 毫秒之间 但是这个
  • 在 Chaquopy 中转换数组和张量

    我该怎么做呢 我看到你的帖子说你可以将 java 对象传递给 Python 方法 但这不适用于 numpy 数组和 TensorFlow 张量 以下以及其各种变体是我尝试过的 但没有成功 double anchors new double
  • Windows 中的信号处理

    在Windows中 我试图创建一个等待SIGINT信号的python进程 当它收到SIGINT时 我希望它只打印一条消息并等待SIGINT的另一次出现 所以我使用了信号处理程序 这是我的 signal receiver py 代码 impo
  • Pandas 过滤 - 非索引列上的 Between_time

    我需要过滤掉特定时间的数据 DataFrame 函数 Between time 似乎是执行此操作的正确方法 但是 它仅适用于数据帧的索引列 但我需要原始格式的数据 例如 数据透视表期望日期时间列具有正确的名称 而不是索引 这意味着每个过滤器
  • Python 包?

    好吧 我认为无论我做错了什么 它可能都是显而易见的 但我无法弄清楚 我已经阅读并重新阅读了有关包的教程部分 我唯一能想到的是这不起作用 因为我直接执行它 这是目录设置 eulerproject init py euler1 py euler
  • 添加反斜杠而不转义[重复]

    这个问题在这里已经有答案了 我需要逃离 字符串中的 字符 问题是每当我string string replace 结果是 添加额外的反斜杠来转义原始反斜杠 如何删除这个多余的反斜杠 结果 仅显示 实际上字符串是 gt gt gt str g
  • 使用 theano 进行多处理

    我正在尝试将 theano 与 cpu 多处理和神经网络库 Keras 结合使用 I use device gpu标记并加载 keras 模型 然后 为了提取超过一百万张图像的特征 我使用多处理池 该函数看起来像这样 from keras
  • 使用 string.whitespace 删除 Python 中的空格

    Python 的 string whitespace 很棒 gt gt gt string whitespace t n x0b x0c r 如何在不手动输入 t n 等正则表达式的情况下将其与字符串一起使用 例如 它应该能够转动 请不要伤
  • Python Pandas groupby、排名,然后根据自定义排名分配值

    问题设置 大熊猫数据框 df pd DataFrame Group A A A A A A A A A Subgroup Group 1 Group 1 Group 1 Group 1 Group 1 Group 1 Group 2 Gro
  • 如何判断Python对象是否是字符串?

    如何检查 Python 对象是否是字符串 常规字符串或 Unicode Python 2 Use isinstance obj basestring 对于要测试的对象obj Docs https docs python org 2 7 li
  • UTF-8 在 Python 日志记录中,如何?

    我正在尝试使用 Python 的日志记录包将 UTF 8 编码的字符串记录到文件中 作为一个玩具示例 import logging def logging test handler logging FileHandler home ted
  • Google App Engine 开发服务器中的 PyCrypto“ImportError:无法导入名称 blockalgo”

    我有一个使用 PyCrypto 使用 AES 加密字符串的函数 当我在单元测试中调用该函数时 一切正常 在生产环境中 它也运行得很好 但是 在GAE开发服务器上调用该函数时 会抛出错误 ImportError 无法导入名称blockalgo
  • Django:通过外键将两个表连接到第三个表?

    我有三个型号 class A Model class B Model id IntegerField a ForeignKey A class C Model id IntegerField a ForeignKey A 我想要得到 B i
  • 使用每日频率格式化 x 轴

    我正在尝试获取每日数据图 我有 3 个月的数据 每天都很难指出 如何格式化 x 轴 以便我可以获得每个日期 可以使用以下命令更改主要刻度的频率set major locator mdates DayLocator interval 5 如下
  • Python docker 容器在完成运行应用程序后立即关闭,即使指定保留在 -d -t 中

    我有一个 dockerfile FROM python 3 WORKDIR app ADD venv venv ADD data file1 csv gz data file1 csv gz ADD data file2 csv gz da
  • 无法运行特定的 .pyc 文件

    使用编译在unix工作的python文件后 import py compile py compile compile server py 我在同一目录中获得 pyc 文件 但是当我尝试在 putty 中使用 server pyc 运行该文件
  • Twitter 不再使用请求库 python

    我有一个 python 函数 它使用 requests 库和 BeautifulSoup 来抓取特定用户的推文 import requests from bs4 import BeautifulSoup contents requests
  • numpy 中的分层抽样

    在 numpy 中我有一个这样的数据集 前两列是索引 我可以通过索引将数据集分成多个块 即第一个块是 0 0 第二个块是 0 1 第三个块 0 2 然后是 1 0 1 1 1 2 等等 每个块至少有两个元素 索引列中的数字可能会有所不同 我

随机推荐

  • 断言失败:电影播放器​​的激活状态错误 (1)

    我正在 iPad 应用程序的一个页面上播放视频 m4v 然后它会转到另一个视图控制器来播放另一个视频 它播放正常 但是当第二个视频播放完毕时 它会抛出断言失败 错误是 Assertion failure in MPMoviePlayerCo
  • Getx Flutter - 更新列表中的项目不是反应性的

    我使用 getx 作为我的 flutter 应用程序的状态管理 但我在更新列表中的值时遇到困难 所以我有一个参数为 isFollowing 的用户模型 当我单击按钮时 isFollowing 变量将发生变化并且颜色也应更新 但这并没有发生
  • 放置 libgdx Screen 的正确位置在哪里

    您好 我正在开发一款游戏 我想知道如何处理资源 因为我遇到了内存问题 我有这样的事情 public SplashScreen implements Screen Override public void render float delta
  • Flexbox - 垂直居中并匹配大小

    我使用 Flex 有两个相邻的按钮 并且它们的内容垂直居中 到目前为止效果很好 但是 当在移动页面上查看我的网站时 使用响应式设计来缩放页面 第二个按钮 其中的文本较少 的大小会与其同伴的大小不同 因此 目标是垂直对齐按钮上的文本 并使两个
  • 投票 - 阻止客户端滥用 - ASP.NET MVC

    所以我设计了这个投票的东西 它不会让某人在 24 小时内为同一篇文章投票两次 然而 假设一个人投票 并且在看到该人能够投票或者他处于 24 小时窗口内之后 我禁用投票按钮 顺便说一句 这都是 Ajax 但是 当一个人关闭浏览器并重新打开甚至
  • tsql函数分割字符串

    我想知道是否有人可以帮助我 我需要一个 sql 函数来分割给定值 例如 1 00 Not specified 3 01 05 Global WM BB Operations 2 02 05 01 Global WM BB Operation
  • 从 Eclipse PDT 转换为 Vim [关闭]

    Closed 此问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 我真的很喜欢 VIM 它是我遇到过的少数几个能让你内心感到温暖和模糊的应用程序之一 然而 对于 PHP
  • 如何在 thenOpen 中获取 casper.js 中的响应状态 404 而不是 undefined?

    知道为什么下面的代码在任何一个中都没有捕获 404responsevar 或在http status 404 event 我使用 phantomjs 1 9 casperjs 1 0 2 和 Windows 7 运行此程序 var casp
  • 是否可以对 Xcode 项目的“构建阶段”部分中的“编译源”列表进行排序?

    我想根据名称对 Xcode 项目的 编译源 部分中的文件进行排序 是否可以 是的 您可以重新订购编译源Xcode 中的部分 但不是 GUI 中的部分 考虑到这已经是 IDE 的第 6 版 而且他们仍然没有解决这个基本功能 这很遗憾 正如 A
  • 如何在 Meteor Spacebars 模板中重复块 N 次?

    我在空格键模板中有这段代码 1
  • Lubridate 未在 R 中正确将日期时间转换为 POSIXct (dd/mm/yy hh:mm:ss) [关闭]

    Closed 这个问题是无法重现或由拼写错误引起 help closed questions 目前不接受答案 我正在尝试将日期时间从 csv 转换为 POSIXct 以进行数据分析 我已经尝试了多个代码 但要么得到 NA 要么格式错误 我当
  • pandas:根据另一个数据框的列选择数据框列

    我正在尝试对 a 进行子集化pandas基于另一个类似数据框中的列的数据框 我可以在 R 中轻松做到这一点 df1 lt data frame A 1 5 B 6 10 C 11 15 df2 lt data frame A 1 5 B 6
  • 使用队列的生产者/消费者线程

    我想创建某种Producer Consumer线程应用程序 但我不确定在两者之间实现队列的最佳方法是什么 所以我有两个想法 这两个想法都可能是完全错误的 我想知道哪个更好 如果它们都很糟糕那么实现队列的最佳方法是什么 我关心的主要是这些示例
  • 如何让 Microsoft C++ 编译器将未知标志视为错误而不是警告?

    出于各种原因 我希望能够编写脚本来检测 MS C 编译器是否支持特定标志 我正在使用 Windows 7 1 SDK 中的编译器 C gt cl version Microsoft R C C Optimizing Compiler Ver
  • JavaScript 中的跨域数据访问

    我们有一个 ASP Net 应用程序托管在我们的网络上并暴露给特定的客户端 该客户希望能够将数据从他们自己的服务器导入到我们的应用程序中 数据通过 HTTP 请求检索 并采用 CSV 格式 问题是他们不想将他们的服务器暴露给我们的网络 并请
  • 在 JavaFX 中调整选项卡内容的大小

    老实说 我对 JavaFX 以及 Java 中的任何 UI 开发都是完全陌生的 我正在使用 fxml 来定义我的屏幕布局 我想要一个使用选项卡的应用程序 第一个选项卡的内部布局与 IssueTracker 示例应用程序非常相似 我创建了下面
  • 递归函数依赖不起作用

    我正在尝试乘以单位数组 来自dimensional 在幻像类型中 我在功能依赖性方面遇到了麻烦 问题的简化版本如下 我有以下类型 data F a F String 其中字符串表示外语表达式 幻像类型表示类型列表 我可以做类似的事情 x F
  • 其他程序可以读取我的 NSUserDefaults 设置吗?

    在iPhone上 不包括越狱手机 其他应用程序可以读取您使用设置的值吗NSUserDefaults 我正在考虑为我们的服务保存客户的用户名 密码 并希望确保其安全 不可以 其他应用程序无法看到您的数据 也就是说 您可能应该考虑使用keych
  • 多线程 JDBC

    从架构上来说 处理 JDBC 多线程的最佳方法是什么 我有许多线程同时访问数据库 通过单个连接和语句 我收到以下错误消息 org postgresql util PSQLException 此结果集已关闭 我应该使用多个连接 多个语句还是有
  • 重新采样 Pandas 数据框并合并列中的字符串

    我想重新采样 pandas 数据框并将不同的函数应用于不同的列 问题是我无法正确处理带有字符串的列 我想应用一个将字符串与分隔符 例如 合并的函数 这是一个数据示例 import pandas as pd import numpy as n