Python Pandas 检查某个值在同一天内是否出现多次

2024-04-29

我有一个 Pandas 数据框，如下所示。我想做的是检查一个电台是否有变量yyy以及同一天的任何其他变量（如station1）。如果这是真的，我需要删除包含的整行yyy.

目前我正在使用iterrows()并循环搜索该变量出现的日期，将变量更改为“删除我”之类的内容，由此构建一个新的数据框（因为pandas 不支持原地替换 https://stackoverflow.com/questions/15972264/why-doesnt-this-function-take-after-i-iterrows-over-a-pandas-dataframe）并过滤新数据帧以删除不需要的行。这现在有效，因为我的数据帧很小，但不太可能扩展。

问题：这似乎是一种非常“非熊猫”的方法，是否有其他方法可以删除不需要的变量？

                dateuse         station         variable1
0   2012-08-12 00:00:00        station1               xxx
1   2012-08-12 00:00:00        station1               yyy
2   2012-08-23 00:00:00        station2               aaa
3   2012-08-23 00:00:00        station3               bbb
4   2012-08-25 00:00:00        station4               ccc
5   2012-08-25 00:00:00        station4               ccc
6   2012-08-25 00:00:00        station4               ccc

我可能会使用布尔数组进行索引。我们想要删除具有以下内容的行（无论如何，如果我明白你在追求什么！）yyy以及不止一个dateuse/station组合。

我们可以用transform广播每个的大小dateuse/station组合到数据帧的长度，然后选择长度> 1的组中的行。然后我们可以&这与其中yyys are.

>>> multiple = df.groupby(["dateuse", "station"])["variable1"].transform(len) > 1
>>> must_be_isolated = df["variable1"] == "yyy"
>>> df[~(multiple & must_be_isolated)]
               dateuse   station variable1
0  2012-08-12 00:00:00  station1       xxx
2  2012-08-23 00:00:00  station2       aaa
3  2012-08-23 00:00:00  station3       bbb
4  2012-08-25 00:00:00  station4       ccc
5  2012-08-25 00:00:00  station4       ccc
6  2012-08-25 00:00:00  station4       ccc

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

python27

pandas

Python Pandas 检查某个值在同一天内是否出现多次的相关文章

Flask 中“缺少 CSRF 令牌”，但它在模板中呈现

问题当我尝试登录使用 Flask login 时我得到Bad Request The CSRF session token is missing但令牌正在呈现在模板中 secret key 已设置并且我在本地运行localhost
为什么在访问 Python 对象属性时使用 getattr() 而不是 __dict__ ？

在具有一定程度的 Python 对象自省的源代码示例和 SO 答案中常见的模式是 getattr some object attribute name string 是否有理由优先选择这种模式 some object dict attri
如何在Windows中的Python 3.9下pip安装pickle？

我需要pickle https docs python org 3 9 library pickle html module pickle包安装在我的下面Python 3 9在 Windows 10 下我尝试过的当尝试与pip inst
在linux上安装python ssl模块，无需重新编译

是否可以在已经安装了 OpenSSL 的 Linux 机器上安装 python 的 SSL 模块而无需重新编译 python 我希望它就像复制几个文件并将它们包含在库路径中一样简单 Python版本是2 4 3 谢谢是否可以在已经安装了
如何从hdfs读取文件[重复]

这个问题在这里已经有答案了我在 project1目录下的hadoop文件系统中有一个文本文件名mr txt 我需要编写 python 代码来读取文本文件的第一行而不将 mr txt 文件下载到本地但我无法从 hdfs 打开 mr tx
Py2exe - Pmw WindowsError：[错误 3]

我正在尝试使用 Py2exe 构建独立的可执行文件我已经导入了 Pmw 类当我运行独立可执行文件时出现以下错误 Traceback most recent call last File py line 9 in
通过 Python 循环浏览网络上的目录并显示其内容（文件和其他目录）

同样的道理在Python中处理从源目录到目标目录的一组文件 https stackoverflow com questions 2593399 process a set of files from a source directory t
更改 Matplotlib 投影轴的背景颜色

我正在尝试使用 Cartopy 创建一个图形该图形需要在未投影的轴上绘制投影轴这是一个尽可能简单的代码版本它将轴上的内容替换为背景颜色 import matplotlib pyplot as plt import cartopy cr
Python-验证我的文档 xls 中是否存在工作表

我正在尝试在空闲时间设计一个小程序加载 xls 文件然后在要扫描的文档中选择一张纸步骤1 用户导入 xls文件导入程序后检查文件是否存在我能做到的第 2 步我要求用户提供要分析的文档表 xls 的名称这就是它停止的地方该程
为什么将模块级代码放入函数中然后调用该函数在Python中速度更快？

在亚历克斯马尔泰利的回应中使 Python 脚本面向对象 https stackoverflow com questions 1813117 making a python script object oriented 他提到在 Pyth
使用 if 语句的网格网格和用户定义函数的真值不明确

假设我有一个函数f x y 足够光滑然而有些值仅在有限的意义上存在以sin x x的价值x 0只存在于极限 x gt 0 中在一般情况下我用一个来处理这个问题if陈述如果我在情节中使用它meshgrid我收到一条错误消息 Val
如何包含位于模块中但在 Sphinx 中的类和方法之外的文档字符串/注释

我有一个utils我的包中的模块它由多个不需要实例化的杂项独立方法组成我想在其中放置一些通用注释文档字符串utils文件例如 import os import json Miscellaneous methods that help
无法使用 python rasterio、gdal 打开 jp2 （来自哨兵）

我试图在 python 中将 jp2 栅格产品作为栅格打开但当我们使用 raterio 和 gdal 包时没有成功我收到此错误 RasterioIOError b4 jp2 not recognized as a supported f
如何在matplotlib中调整x轴

I have a graph like this x轴上的数据表示小时所以我希望x轴设置为0 24 48 72 而不是现在的值很难看到 0 100 之间的数据 fig1 plt figure ax fig1 add subplot 11
无需访问 Internet 即可部署 Django 的简单方法？

我拥有的是使用 Django 开发的 Intranet 站点的开发版本以及放置在 virtualenv 中的一些外部库它运行良好我可以在任何具有互联网连接的计算机上使用相同的参数使用 pip 轻松设置 virtualenv 但是不幸
Python：如何在不先创建整个列表的情况下计算列表的总和？

通常我们必须 1 声明一个列表 2 使用以下方法计算该列表的总和sum 但现在我希望指定一个以 1 开头间隔为 4 100 个元素的列表如下所示 1 5 9 13 17 21 25 29 33 37 我不想涉及数学公式所以 1 如何在
Python 相当于 Scala 案例类

Python 中是否有与 Scala 的 Case Class 等效的东西就像自动生成分配给字段而无需编写样板的构造函数一样当前执行此操作的现代方法从 Python 3 7 开始是使用数据类 https www python org
两种 ODE 求解器之间的差异

我想知道两者之间有什么区别ODEINT and solve ivp用于求解微分方程它们之间有什么优点和缺点 f1 solve ivp f 0 1 y0 y0 is the initial point f2 odeint f y0 0 1
使用 pandas 单元格中列表的长度选择行[重复]

这个问题在这里已经有答案了我有一张表 df a b c 1 x y x 2 x z c d 3 x t e f g 只是想知道如何使用 c 列的长度选择行 such as df loc len df c gt 1 我知道这是不对的正确的
如何使用 Python/Django 在 Facebook 中获取（和使用）扩展权限

我正在尝试编写一个简单的应用程序让用户授予我的代码写入其页面的 Facebook 流的权限据我了解它应该很简单让用户单击一个按钮启动一个弹出窗口其中包含我的 Facebook 应用程序中的页面在该页面中他们单击授予的内容流发

随机推荐

在 WP7 中进行同步 Http/REST 调用？

我一直在开发 Windows Phone 7 应用程序并尝试使用 HttpWebRequest GetResponse 进行同步 REST 调用但编译器抱怨 GetResponse 不可用我在HttpWebRequest中找到了Beg
如何使 PHPunit 在警告时返回非零退出状态

当在一些失败并出现警告的测试中调用 PHPunit 时我得到 phpunit c phpunit xml group app Warning MongoCollection insert expects parameter 1 to be
jQuery 动画，不流畅

你知道动画猫如何才能移动得更流畅吗很卡顿不知道如何让它变得更流畅 jQuery fx interval 没有帮助 http christianhaller com jquery animate img html http christi
LibUsb 声明接口访问被拒绝 Java

我希望能够从 USB 计步器读取数据我正在 Java 中尝试此操作并且使用 LibUsb 和 Usb4Java 库我似乎无法认领 USB 管道或类似的东西我正在使用的代码 final Context context new Cont
VB.NET 使用 system.net.tcpclient 编写 telnet 客户端

当我连接到我的Solaris盒子时这对我不起作用服务器正在回传有谁知道我做错了什么 Imports System Net Imports System Net Sockets Imports System Text Public Cla
添加滑动删除UITableViewCell

我正在制作一个清单应用程序UITableView 我想知道如何添加滑动删除UITableViewCell 这是我的 ViewController swift import UIKit class ViewController UIViewC
itunesconnect 应用程序 - 恢复到以前的版本

我发布了我的应用程序的更新并获得批准尽管它包含一个严重的本地化错误大多数用户都得到了错误的语言但它还是获得了批准有什么方法可以快速恢复到以前的版本暂停当前版本的当前下载或者其他任何可能有助于解决此问题的方法我几年前确实读过以下
nodejs 强大的改变 uploadDir

我有一个项目正在努力完成我想上传图像我可以上传图像但不能上传应该上传的空中图像好的让我们编写代码 app post register function req res var form new formidable Incoming
Android 中客户端服务器通信的选项

我目前正处于论文项目的研究阶段我的项目是一个针对移动设备的订票系统我选择以 Android 为目标我预计需要带有中央服务器的客户端服务器架构因此目前正在研究 Android 如何与这样的服务器进行通信服务器将授予客户端访问票务信
观察嵌套对象的属性

小提琴示例 http emberjs jsbin com aviyUnA 9 edit html js 输出 http emberjs jsbin com aviyUnA 9 edit html js output 这是我的模型 name
使用参与者模型进行基于时间的模拟

我们有一个单线程应用程序可以模拟数十万个对象随着时间的推移与共享内存模型的交互显然它无法在多 CPU 硬件上进行扩展在阅读了一些有关基于代理的建模和函数式编程参与者模型的内容后我正在考虑使用消息传递范例进行重写这个想法非常简单
为开发/QA/产品配置 Java EE 6

我有一个使用 Maven 构建的 Java EE 6 应用程序在 NetBeans 7 中编写代码并部署在 GlassFish 3 1 2 上当我接近完成时我发现自己正在部署演示版本问题是我没有任何非常简单的方法来构建不同的环境例
ModemManager：mmcli 获取信号强度

我无法检索 Sierre Wireless MC7304 上的信号强度另外通过 mmcli 发送 AT 命令似乎不起作用 sudo mmcli m org freedesktop ModemManager1 Modem 0 signal
jquery 切换兄弟元素的可见性

我在一个页面上有几个 div 每个 div 都有一个标题我可以单击该标题来切换相应 div 的可见性 div 设置为display none默认情况下我用过 ids在每个 div 的点击功能中但是因为我在同一页面上有多个 div 我想
Typescript：声明与另一个变量具有相同类型的变量

有没有办法用另一个变量的类型来声明一个变量例如我声明一个具有某种类型的类成员然后我想在同一类型的函数中声明另一个变量但我不想修改原来的声明也不想重复它看起来你应该能够做类似的事情 class Foo bar key string
如何从扩展服务工作人员创建网络工作人员

我将首先解释我想要实现的目标我想创建一个扩展程序可以在不同 chrome 窗口上的选项卡之间切换并显示每个选项卡 X 时间我发现了一个类似的扩展但它是使用manifest V2完成的并且不支持多个窗口我想通过为每个窗口创建一个
Nestjs拦截并修改传出的http请求

所以我可能错过了一些东西或者做错了一些事情我有一个 NestJS 应用程序正在尝试向外部 API 发出 http 请求我希望能够拦截此传出请求并在执行之前修改其标头我尝试使用拦截器但没有成功传入的 http 请求被拦截但传出的请
由于权限被拒绝，无法绑定到某些端口

在过去 3 个月左右的时间里我遇到了随机错误无法绑定身份服务器在本地开发工作站上运行的特定端口起初我以为是我的机器坏了所以我重置了所有东西这在两个月内解决了这个问题现在它又回来了与此同时其他开发人员也看到了同样的问题我们所
Eclipse 调试器 - 跳转到或仅显示挂起的线程

我有一个带有很多线程的 Java 应用程序在调试时当一个线程中的执行被断点停止时在所有线程之间滚动以查找挂起的线程是非常烦人的有没有办法按钮快捷键等跳转到挂起的线程或者更好隐藏所有未挂起的线程我同意这很烦人而且答案非常
Python Pandas 检查某个值在同一天内是否出现多次

我有一个 Pandas 数据框如下所示我想做的是检查一个电台是否有变量yyy以及同一天的任何其他变量如station1 如果这是真的我需要删除包含的整行yyy 目前我正在使用iterrows 并循环搜索该变量出现的日期将变量更改为

Python Pandas 检查某个值在同一天内是否出现多次

Python Pandas 检查某个值在同一天内是否出现多次 的相关文章

随机推荐

热门标签

Python Pandas 检查某个值在同一天内是否出现多次的相关文章