根据 pandas DataFrame 中的值序列生成索引元组

2024-02-10

这是我之前问题的后续：根据 pandas DataFrame 列中的值序列查找行索引 https://stackoverflow.com/questions/61735585/finding-the-index-of-rows-based-on-a-sequence-of-values-in-a-column-of-pandas-da

我想获得一个索引为非常糟糕的元组列表，后跟第一次出现“坏”的索引：

import random

df = pd.DataFrame({
    'measure': [random.randint(0,10) for _ in range(0,20)],
})

df['status'] = df.apply(
    lambda x: 'good' if x['measure'] > 4 else 'very bad' if x['measure'] < 2  else 'bad',
    axis=1)

这是数据框：

    measure    status
0         8      good
1         8      good
2         0  very bad
3         5      good
4         2       bad
5         3       bad
6         9      good
7         9      good
8        10      good
9         5      good
10        1  very bad
11        7      good
12        7      good
13        6      good
14        5      good
15       10      good
16        3       bad
17        0  very bad
18        3       bad

我怎样才能得到这样的组合的元组？

[(2,4), (10,16), (17,18)]

IIUC，你可以尝试：

# filters only rows with bad and very bad
m = df[df['status'].isin(['bad','very bad'])] 

# check id current row is very bad and next row is bad
c = m['status'].eq('very bad') & m['status'].shift(-1).eq('bad')

# if true return next row as true too and get only index values
idx = m[c|c.shift()].index

# convert every 2 items into a tuple
res = [*zip(idx[::2],idx[1::2])]

[(2, 4), (10, 16), (17, 18)]

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

python3x

pandas

DataFrame

根据 pandas DataFrame 中的值序列生成索引元组的相关文章

Argparse nargs="+" 正在吃位置参数

这是我的解析器配置的一小部分 parser add argument infile help The file to be imported type argparse FileType r default sys stdin parser
Pandas 中允许重复列

我将一个大的 CSV 包含股票财务数据文件分割成更小的块 CSV 文件的格式不同像 Excel 数据透视表之类的东西第一列的前几行包含一些标题公司名称 ID 等在以下列中重复因为一家公司有多个属性而不是一家公司只有一栏在前几行
从零开始的 numpy 形状意味着什么

好的我发现数组的形状中可以包含 0 对于将 0 作为唯一维度的情况这对我来说是有意义的它是一个空数组 np zeros 0 但如果你有这样的情况 np zeros 0 100 让我很困惑为什么这么定义呢据我所知这只是表达空数组的
忽略 Mercurial hook 中的某些 Mercurial 命令

我有一个像这样的善变钩子 hooks pretxncommit myhook python path to file myhook 代码如下所示 def myhook ui repo kwargs do some stuff 但在我的例子中
如何计算numpy数组中元素的频率？

我有一个 3 D numpy 数组其中包含重复的元素 counterTraj shape 13530 1 1 例如 counterTraj 包含这样的元素我只显示了几个元素 array 136 129 130 103 102 101 我
Pandas 数据帧到 numpy 数组 [重复]

这个问题在这里已经有答案了我对 Python 很陌生经验也很少我已经设法通过复制粘贴和替换我拥有的数据来使一些代码正常工作但是我一直在寻找如何从数据框中选择数据但无法理解这些示例并替换我自己的数据总体目标如果有人真的可以帮助
切片 Dataframe 时出现 KeyError

我的代码如下所示 d pd read csv Collector Output csv df pd DataFrame data d dfa df copy dfa dfa rename columns OBJECTID Object ID
使用 Python pandas 计算调整后的成本基础（股票买入/卖出的投资组合分析）

我正在尝试对我的交易进行投资组合分析并尝试计算调整后的成本基础价格我几乎尝试了一切但似乎没有任何效果我能够计算调整后的数量但无法获得调整后的购买价格有人可以帮忙吗这是示例交易日志原始数据 import pandas as pd
使用 OLS 回归预测未来值（Python、StatsModels、Pandas）

我目前正在尝试在 Python 中实现 MLR 但不确定如何将我找到的系数应用于未来值 import pandas as pd import statsmodels formula api as sm import statsmodels
TensorFlow的./configure在哪里以及如何启用GPU支持？

在我的 Ubuntu 上安装 TensorFlow 时我想将 GPU 与 CUDA 结合使用但我却停在了这一步官方教程 http www tensorflow org get started os setup md 这到底是哪里 con
Python urllib.request.urlopen：AttributeError：'bytes'对象没有属性'data'

我正在使用 Python 3 并尝试连接到dstk 我收到错误urllib包裹我对SO进行了很多研究但找不到与这个问题类似的东西 api url self api base street2coordinates api body jso
从 python 发起 SSH 隧道时出现问题

目标是在卫星服务器和集中式注册数据库之间建立 n 个 ssh 隧道我已经在我的服务器之间设置了公钥身份验证因此它们只需直接登录而无需密码提示怎么办我试过帕拉米科它看起来不错但仅仅建立一个基本的隧道就变得相当复杂尽管代码示例将受
Python 将日志滚动到变量

我有一个使用多线程并在服务器后台运行的应用程序为了无需登录服务器即可监控应用程序我决定包括Bottle http bottlepy org为了响应一些HTTP端点并报告状态执行远程关闭等我还想添加一种查阅日志文件的方法我可以使用以
创建嵌套字典单行

您好我有三个列表我想使用一行创建一个三级嵌套字典 i e l1 a b l2 1 2 3 l3 d e 我想创建以下嵌套字典 nd a 1 d 0 e 0 2 d 0 e 0 3 d 0 e 0 b a 1 d 0 e 0 2 d 0
使用yield 进行字典理解

作为一个人为的例子 myset set a b c d mydict item yield join item s for item in myset and list mydict gives as cs bs ds a None b N
当鼠标悬停在上面时，intellisense vscode 不显示参数或文档

我正在尝试将整个工作流程从 Eclipse 和 Jupyter Notebook 迁移到 VS Code 我安装了 python 扩展它应该带有 Intellisense 但它只是部分更糟糕我在输入句点后收到建议但当将鼠标悬停在其上方
无法在前端使用 JavaScript Fetch API 将文件上传到 FastAPI 后端

我正在尝试弄清楚如何将图像发送到我的 API 并验证生成的token那是在header的请求到目前为止这就是我所处的位置 app post endreProfilbilde async def endreProfilbilde requ
限制 django 应用程序模型中的单个记录？

我想使用模型来保存 django 应用程序的系统设置因此我想限制该模型使其只能有一条记录极限怎么办尝试这个 class MyModel models Model onefield models CharField The fiel
字典和数组作为类变量与实例变量

这是赚取积分的简单方法请解释以下内容 class C a b 0 c def init self self x def d self k v self x k v self a k v self b v self c append v d
从 Twitter API 2.0 获取 user.fields 时出现问题

我想从 Twitter API 2 0 端点加载推文并尝试获取标准字段作者文本和一些扩展字段尤其是用户字段端点和参数的定义工作没有错误在生成的 json 中我只找到标准字段但没有找到所需的 user fields 用户

随机推荐

使用 vue.js 和 vuetify 进行服务器端表单验证

我看到了很多有关使用 Vuetify 进行客户端验证的文档但发现很难找到有关 vuetify 和 vue 的服务器端验证消息的文档 PROBLEM 我有这个组件
将数组组分组为单独的子数组组[重复]

这个问题在这里已经有答案了我有一个带有字符串的 JS 数组例如 let a a a a b c c b b b d d e e e 我需要比较数组内的重复字符串如果存在重复字符串它将像这样分隔 a a a b c c b b b d
PHP 中先调用父构造函数再调用子构造函数

我想知道是否可以在 PHP 中继承子代的 construct 之前调用父代的 construct Example class Tag construct Called first class Form extends Tag constru
MySQL：GROUP_CONCAT 与 LEFT JOIN

我在使用 MySQL 的 GROUP CONCAT 函数时遇到问题我将使用一个简单的帮助台数据库来说明我的问题 CREATE TABLE Tickets id INTEGER NOT NULL PRIMARY KEY requester
Python 多处理似乎不使用多个核心

我想使用 Python 多重处理来运行预测模型的网格搜索当我查看核心使用情况时它似乎总是只使用一个核心知道我做错了什么吗 import multiprocessing from sklearn import svm import it
如何从Python开始计算下个月的38天

例如让我们考虑发票日期 09 11 2021 但是 payment period 为 38 天那么它应该从 1 12 2021 开始到 7 01 2022 因为 12 月有 31 天那么 due date 将是 7 01 2022 发
使用nginx和gunicorn在django中通过ip限制对管理url的访问

我试图通过在 nginx 中使用简单的基于主机的访问控制来限制对 django 应用程序管理部分的访问不幸的是 nginx 似乎不遵守配置请求这是我在 nginx 中这个特定部分的设置 gunicorn setup location p
C++：将指针变量传递给函数

我有一个类节点 class Node public int item Node nextLink 在函数外部我声明一个 Node 指针 Node newNode 然后我将此指针传递给函数 foo void foo Node node no
如何在 Pandas 数据框中选择基于行的类别

这确实微不足道但不敢相信我已经闲逛了一个小时仍然可以找到答案所以在这里 df pd DataFrame cats a b vals 1 2 df cats df cats astype category df 我的问题是如何选择 ca
读取接收和发送的网络流量字节

在 Objective C 中获取网络流量发送和接收字节的最简单方法是什么这并不容易而且它来自 C 而不是 Objective C 但是您需要的所有信息都存储在返回给您的接口地址的 ifa data 字段中获取ifaddrs 3 您可以
Google 地图 API 密钥警报

我的 Google 地图 API 密钥有问题我收到一条警报说 This web site needs a different Google Maps API key 当我按确定收到警报时地图正在加载并且工作正常同样的问题已经发布
如何向 Python shell 添加制表符补全？

当使用启动 django 应用程序时python manage py shell 我得到一个 InteractiveConsole shell 我可以使用制表符完成等 Python 2 5 1 r251 54863 Apr 15 2008
Rails image_tag 旋转图像

我使用亚马逊的 S3 进行图像存储并配置了载波和雾图像似乎存储正确但是当我有肖像图像宽度小于高度时它无法正确显示而是将图像旋转到其一侧任何正确方向的指示将不胜感激上传者 image uploader rb class
C/C++ 处理程序 SIGFPE 是什么？

好吧我搜索了有关 SIGFPE 的文章然后我写了一些测试但它的行为很奇怪那我只好在这里发帖寻求帮助了 GCC G 或 ISO C 是否明确定义了除以零会发生什么 1 我搜索了这篇文章除以零不会抛出 SIGFPE https sta
在 swift 3 中以编程方式设置 UIImageView AspectRatio 约束

我在故事板中有一个 UIImageView 其 AspectRatio 为 1 1 在某些情况下我想在 ViewController 中以编程方式更改为 2 1 我在 ViewController 中创建该约束的引用但无法设置该约束您可
使用引导工具提示进行 Javascript 验证

当验证返回 false 时我在启动输入字段的引导工具提示时遇到问题更多细节我有想法用 javascript 函数验证我的表单这工作得很好但是当验证错误时一定会发生一些事情我正在考虑引导工具提示简单易于控制现在对我来说是最好
Django ModelChoiceField 允许创建对象

姜戈的ModelChoiceField https docs djangoproject com en 1 8 ref forms fields django forms ModelChoiceField是从模型派生表单时用于外键的默认表单
当使用 unicorn 启动 Rails 时，Nginx 失败（13：权限被拒绝）

我的 Rails 应用程序在服务器上运行Unicorn and Nginx 但是在配置Nginx并启动它之后我收到错误 2015 08 03 15 43 44 crit 13951 0 1 stat home ec2 user apps
使用 Python 从 Google Drive / Workspace 下载电子表格

您能否生成一个 Python 示例说明如何下载给定密钥和工作表 ID 的 Google Sheets 电子表格 gid 我不能我已经搜索了 API 的版本 1 2 和 3 我运气不好我无法弄清楚他们复杂的类似 ATOM 的 feed
根据 pandas DataFrame 中的值序列生成索引元组

这是我之前问题的后续根据 pandas DataFrame 列中的值序列查找行索引 https stackoverflow com questions 61735585 finding the index of rows based on

根据 pandas DataFrame 中的值序列生成索引元组

根据 pandas DataFrame 中的值序列生成索引元组 的相关文章

随机推荐

热门标签

根据 pandas DataFrame 中的值序列生成索引元组的相关文章