在 Pandas DataFrame 中界定值高于特定阈值的连续区域

2023-11-23

我有一个 Pandas Dataframe，其索引和值在 0 到 1 之间，如下所示：

 6  0.047033
 7  0.047650
 8  0.054067
 9  0.064767
10  0.073183
11  0.077950

我想检索元组超过 5 个连续值均超过某个阈值（例如 0.5）的区域的起点和终点。这样我就会有这样的东西：

 [(150, 185), (632, 680), (1500,1870)]

其中第一个元组属于从索引 150 开始的区域，有 35 个行中全部大于 0.5 的值，并以索引 185 结束（不包含）。

我首先只过滤大于 0.5 的值，如下所示

 df = df[df['values'] >= 0.5]

现在我有这样的价值观：

632  0.545700
633  0.574983
634  0.572083
635  0.595500
636  0.632033
637  0.657617
638  0.643300
639  0.646283

我无法显示我的实际数据集，但以下数据集应该是一个很好的表示

import numpy as np
from pandas import *

np.random.seed(seed=901212)

df = DataFrame(range(1,501), columns=['indices'])
df['values'] = np.random.rand(500)*.5 + .35

产量：

 1  0.491233
 2  0.538596
 3  0.516740
 4  0.381134
 5  0.670157
 6  0.846366
 7  0.495554
 8  0.436044
 9  0.695597
10  0.826591
...

其中区域 (2,4) 有两个大于 0.5 的值。然而这太短了。另一方面，连续有 19 个值高于 0.5 的区域 (25,44) 将被添加到列表中。

您可以通过查看系列和单行移位值来找到每个连续区域的第一个和最后一个元素，然后过滤彼此充分分开的对：

# tag rows based on the threshold
df['tag'] = df['values'] > .5

# first row is a True preceded by a False
fst = df.index[df['tag'] & ~ df['tag'].shift(1).fillna(False)]

# last row is a True followed by a False
lst = df.index[df['tag'] & ~ df['tag'].shift(-1).fillna(False)]

# filter those which are adequately apart
pr = [(i, j) for i, j in zip(fst, lst) if j > i + 4]

例如，第一个区域是：

>>> i, j = pr[0]
>>> df.loc[i:j]
    indices    values   tag
15       16  0.639992  True
16       17  0.593427  True
17       18  0.810888  True
18       19  0.596243  True
19       20  0.812684  True
20       21  0.617945  True

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

NumPy

pandas

在 Pandas DataFrame 中界定值高于特定阈值的连续区域的相关文章

在 Numpy 中切片后确定结果数组的形状

我很难理解在 numpy 中切片后如何确定结果数组的形状例如我使用以下简单代码 import numpy as np array np arange 27 reshape 3 3 3 slice1 array 1 2 1 slice2
即使使用 .loc[row_indexer,col_indexer] = value 时也会设置 WithCopyWarning

这是我的代码中得到的行之一SettingWithCopyWarning value1 Total Population value1 Total Population replace to replace value 4 然后我将其更改为
如何使用Python将WebP图像转换为Gif？

我已经尝试过这个 from PIL import Image im Image open this webp im save that gif gif save all True 这给了我这个错误类型错误不支持的操作数类型 tuple
python 中分割字符串以获得一个值？

需要帮助假设我在名为 input 的变量中有一个字符串 Sam Person name kind input split 通过执行上述操作我得到两个具有不同字符串 Sam 和 Person 的变量有没有办法只获取第一个值 name S
Pandas重置索引未生效[重复]

这个问题在这里已经有答案了我不确定我在哪里误入歧途但我似乎无法重置数据帧上的索引当我跑步时test head 我得到以下输出正如您所看到的数据帧是一个切片因此索引超出范围我想做的是重置该数据帧的索引所以我跑test rese
如何使用 python urllib 在 HTTP/1.1 中保持活力

现在我正在这样做 Python3 urllib url someurl headers HOST somehost Connection keep alive Accept Encoding gzip deflate opener urll
“char”/“character”类型的类型提示

char 或 character 没有内置的原始类型因此显然必须使用长度为 1 的字符串但是为了暗示这一点并暗示它应该被视为一个字符如何通过类型提示来实现这一点 grade chr A 一种方法可能是使用内置的 chr 函数来表示这一
无法打开 Python。错误 0xc000007b

我最近一直在学习 Python 3 我在我的上网本 32 位 Windows 7 上创建简单的小程序没有任何问题当我将它安装在我的上网本上时我没有遇到任何问题但现在我已经开始使用它了我想将它安装在我的台式机上并且我有一个我的桌面
在径向（树）网络x图中查找末端节点（叶节点）

给定下图是否有一种方便的方法来仅获取末端节点我所说的端节点是指那些具有一个连接边的到节点我认为这些有时被称为叶节点 G nx DiGraph fromnodes 0 1 1 1 1 1 2 3 4 5 5 5 7 8 9 10 ton
如何通过双击在浏览器中打开 ipynb 文件

以前我安装了 Canopy 当时我只需双击 ipynb 文件并在浏览器中打开它们即可但是后来我需要Anaconda 一旦我安装了它这个功能就没有了现在我只希望能够简单地双击 ipynb 文件然后该文件就会在 Firefox 中
Python 中的 @staticmethod 与 @classmethod

方法和方法有什么区别装饰的 https peps python org pep 0318 with staticmethod http docs python org library functions html staticmethod和
在可编辑的QSqlQueryModel中实现setEditStrategy

这是后续这个问题 https stackoverflow com questions 49752388 editable qtableview of complex sql query 在那里我们创建了 QSqlQueryModel 的可
将输入发送到 python 子进程而不等待结果

我正在尝试为一段代码编写一些基本测试该代码通常通过 stdin 无休止地接受输入直到给出特定的退出命令我想检查程序是否在给出一些输入字符串时崩溃经过一段时间来考虑处理但似乎无法弄清楚如何发送数据而不是陷入等待我不知道的输出关心我
conda-env list / conda info --envs 如何查找环境？

我一直在尝试 anaconda miniconda 因为我的用户使用随 miniconda 安装的结构生物学程序并且作者都没有 A 考虑到可能存在其他 miniconda 应用程序 B 他们的程序将在多用户环境中使用因此使用 Arch
select() 可以在 Windows 下使用 Python 中的文件吗？

我正在尝试在 Windows 下运行以下 python 服务器 An echo server that uses select to handle multiple clients at a time Entering any line o
如何通过字符串匹配加速 pandas 行过滤？

我经常需要过滤 pandas 数据框df by df df col name string value 并且我想加快行选择操作有没有快速的方法可以做到这一点例如 In 1 df mul df 3000 2000 3 reset inde
Python - 如何查询定义方法的类？

我的问题有点类似于this one https stackoverflow com questions 5520580 how do you get all classes defined in a module but not impor
检查字符串是否只有字母和空格 - Python

试图让 python 返回一个字符串仅包含字母和空格 string input Enter a string if all x isalpha and x isspace for x in string print Only alphabe
在 Python 模块中使用 InstaLoader

我正在尝试使用 Instaloader 下载与主题标签相关的照片以进行图像分析我在GitHub存储库中找到了一个全面的方法如何在终端中执行它但是我需要将脚本集成到Python笔记本中这是脚本 instaloader no vide
Django South - 将 null=True 字段转换为 null=False 字段

我的问题是转变的最佳做法是什么null True场变成null False使用 Django South 的字段具体来说我正在与ForeignKey 你应该先写一个数据迁移 http south aeracode org docs t

随机推荐

Github 页面上自定义域的子域

我们可以在 Github Pages 中使用我们自己的自定义域例如我有我的页面 http example com这指向http 用户名 github io project 但现在我需要为我的存储库中的另一个文件夹创建一个子域喜欢 ht
如何跟踪 QWebKit 中的链接？

具有以下 html 的 DOM a href op order img class img button src picture gif alt border 0 a 如何跟踪 QWebKit 特别是 QWebPage 中的链接 href
spring-kafka - 如何从头开始阅读一个主题，同时从末尾阅读另一个主题？

我正在编写一个 spring kafka 应用程序其中我需要阅读 2 个主题 test1 和 test2 public class Receiver private static final Logger LOGGER LoggerFac
垂直和水平居中div，没有定义高度[重复]

这个问题在这里已经有答案了我想在页面中央显示一个 div 而不必为元素定义设置高度以便高度动态适合页面内容这可能吗我愿意使用 JS jQuery 解决方案只要它们有优雅的后备但我更喜欢纯 CSS 解决方案这是我当前的代码它将
jQuery 和 Google 地图 json 响应

我在从 google 地图 api 获取地理位置信息时遇到问题代码非常简单 ajax type GET cache false url http maps googleapis com maps api geocode json data
使用 join 时 Spark 迭代时间呈指数增长

我对 Spark 很陌生我正在尝试实现一些迭代算法以马尔可夫模型表示的质心进行聚类期望最大化所以我需要进行迭代和连接我遇到的一个问题是每次迭代时间都会呈指数增长经过一些实验我发现在进行迭代时需要保留将在下一次迭代中重用的 RD
Astyanax：简单写入抛出此异常：没有足够的字节来读取组件的值

我是 astyanax 的新手尝试了一些示例程序并收到此错误这是一个简单的写法看起来我做了一些基本错误的事情不使用复合键 Caused by InvalidRequestException why Not enough bytes
自定义警报的 UILocalNotification 重复间隔（周日、周一、周二、周三、周四、周五、周六）

我在用着UILocalNotification用于报警目的我有一个基于工作日周日周一周二周三周四周五周六重复的自定义选项很多应用程序都执行了这个过程我尽力了我的水平但我无法让它发挥作用请大家帮帮我您不能使用以下命
Google 我的商家 API 始终返回 429 代码

error code 429 message 超出配额指标的配额请求并限制服务的每分钟请求消费者的 mybusinessaccountmanagement googleapis com project number xxx erro
删除字符串中的常见字母

所以我有一个有趣的问题我正在尝试写一些混乱的单词我需要知道哪些字母我用过哪些字母我没有到目前为止我有以下代码 def remove common x y sort sort lambda x join c for c in sort
如何在自定义混合任务中从 Ecto 获取数据

我想在自定义混合任务中通过 Ecto 显示来自数据库的数据如何在我的任务中获取 Ecto 存储库或启动它我尝试过类似的方法但没有成功 defmodule Mix Tasks Users List do use Mix Task us
如何获取android中最近1个月的数据使用情况？

我需要获取上个月的数据使用统计信息有什么方法可以在android中明智地计算数据使用日期吗 I used 交通统计用于获取数据使用情况的类但它提供了自设备启动以来给定 UID 的设备的所有数据使用情况对于那些仍在寻找的人请将其放入
如何检查 Javascript 函数是否是构造函数

我注意到并非所有 Javascript 函数都是构造函数 var obj Function prototype console log typeof obj function true obj OK new obj TypeError ob
Pandas 数据框的元组列表列表？

我有一个元组列表列表其中每个元组的长度相等并且我需要将元组转换为 Pandas 数据帧使得数据帧的列等于元组的长度并且每个元组item 是跨列的行条目我咨询过有关此主题的其他问题例如将元组列表列表转换为 pandas 数据框
空基类是不是不好的设计？

我的 DTO 类需要一个基类它将在我的通用接口中使用但 DTO 类没有任何共同点它们只是包含一些属性的愚蠢类 public void GetGridData IDataForGrid
从图像中减去平均值

我正在用 Theano 实现 CNN 在论文中我必须在训练 CNN 之前进行图像预处理 We extracted RGB patches of 61x61 dimensions associated with each poselet a
TypeScript：如何同时使用粗箭头和这个？

我正在使用非常有用的局部脂肪箭头保存this回调中的上下文但是有时我需要访问该值this如果我没有使用粗箭头的话就会有一个例子是事件回调其中this具有事件发生的元素的值我知道在这个特定的示例中您可以使用event current
使用新的 1.0 SDK 使用 Firebase 的云函数生成自定义身份验证令牌

As of email protected and email protected firebase admin应用程序初始化时不再接受应用程序配置我有一个 firestore 函数可以使用 firebase admin 生成自定义令牌
如果我将 minAPI 设置为 21，我是否需要 AppCompat？

我决定将 Android 的最低 API 版本设为 21 但这是否意味着不再使用 AppCompat 没有意义了只使用简单的材料设计没有AppCompat 等等不您应该始终使用 AppCompat 这可确保您的应用程序在所有 API
在 Pandas DataFrame 中界定值高于特定阈值的连续区域

我有一个 Pandas Dataframe 其索引和值在 0 到 1 之间如下所示 6 0 047033 7 0 047650 8 0 054067 9 0 064767 10 0 073183 11 0 077950 我想检索元组超过

在 Pandas DataFrame 中界定值高于特定阈值的连续区域

在 Pandas DataFrame 中界定值高于特定阈值的连续区域 的相关文章

随机推荐

热门标签

在 Pandas DataFrame 中界定值高于特定阈值的连续区域的相关文章