当列数动态时，如何从数据框中过滤数据？

2024-04-18

我有一个如下所示的数据框

    A_Name  B_Detail  Value_B  Value_C   Value_D ......
0   AA      X1        1.2      0.5       -1.3    ......
1   BB      Y1        0.76     -0.7      0.8     ......
2   CC      Z1        0.7      -1.3      2.5     ......
3   DD      L1        0.9      -0.5      0.4     ......
4   EE      M1        1.3      1.8       -1.3    ......
5   FF      N1        0.7      -0.8      0.9     ......
6   GG      K1        -2.4     -1.9      2.1     ......

这只是数据框的一个示例，我可以有 n 个列，例如（Value_A，Value_B，Value_C，............ Value_N）

现在我想过滤所有列（Value_A，Value_B，Value_C，...）的绝对值小于1的所有行。

如果列数有限，您可以通过简单地在数据框中的列上放置“和”条件来过滤数据，但我无法弄清楚在这种情况下该怎么做。

我不知道此类列的数量是多少，我唯一知道此类列将以“值”为前缀。

在上面的情况下输出应该是这样的

    A_Name  B_Detail  Value_B  Value_C   Value_D ......
1   BB      Y1        0.76     -0.7      0.8     ......
3   DD      L1        0.9      -0.5      0.4     ......
5   FF      N1        0.7      -0.8      0.9     ......

Use filter http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.filter.html with abs http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.abs.html and all http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.all.html用于创建mask进而boolean indexing http://pandas.pydata.org/pandas-docs/stable/indexing.html#boolean-indexing:

mask = (df.filter(like='Value').abs() < 1).all(axis=1)
print (mask)
0    False
1     True
2    False
3     True
4    False
5     True
6    False
dtype: bool

print (df[mask])
  A_Name B_Detail  Value_B  Value_C  Value_D
1     BB       Y1     0.76     -0.7      0.8
3     DD       L1     0.90     -0.5      0.4
5     FF       N1     0.70     -0.8      0.9

所有组合在timings:

#len df = 70k, 5 columns
df = pd.concat([df]*10000).reset_index(drop=True)

In [47]: %timeit (df[(df.filter(like='Value').abs() < 1).all(axis=1)])
100 loops, best of 3: 7.48 ms per loop

In [48]: %timeit (df[df.filter(regex=r'Value').abs().lt(1).all(1)])
100 loops, best of 3: 7.02 ms per loop

In [49]: %timeit (df[df.filter(like='Value').abs().lt(1).all(1)])
100 loops, best of 3: 7.02 ms per loop

In [50]: %timeit (df[(df.filter(regex=r'Value').abs() < 1).all(axis=1)])
100 loops, best of 3: 7.3 ms per loop

#len df = 70k, 5k columns
df = pd.concat([df]*10000).reset_index(drop=True)
df = pd.concat([df]*1000, axis=1)
#only for testing, create unique columns names
df.columns = df.columns.str[:-1] + [str(col) for col in list(range(df.shape[1]))]
print (df)

In [75]: %timeit ((df[(df.filter(like='Value').abs() < 1).all(axis=1)]))
1 loop, best of 3: 10.3 s per loop

In [76]: %timeit ((df[(df.filter(regex=r'Value').abs() < 1).all(axis=1)]))
1 loop, best of 3: 10.3 s per loop

In [77]: %timeit (df[df.filter(regex=r'Value').abs().lt(1).all(1)])
1 loop, best of 3: 10.4 s per loop

In [78]: %timeit (df[df.filter(like='Value').abs().lt(1).all(1)])
1 loop, best of 3: 10.1 s per loop

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

NumPy

pandas

DataFrame

当列数动态时，如何从数据框中过滤数据？的相关文章

DataFrame 中的字符串，但 dtype 是对象

为什么 Pandas 告诉我我有对象尽管所选列中的每个项目都是一个字符串即使在显式转换之后也是如此这是我的数据框
将 Django 表单中的所有 CharField 表单字段输入转换为小写

我使用 Django 表单进行用户注册用户可以在其中输入优惠券代码我希望在优惠券代码字段中输入的所有字符都转换为小写我尝试过在保存方法自定义清理方法和自定义验证器中使用 lower 但这些方法没有运气下面是我的代码 class S
使用 Python 中的 IAM 角色访问 AWS API Gateway

我有一个 AWS API 网关我想使用它来保护其安全IAM 角色 http docs aws amazon com apigateway latest developerguide permissions html 我正在寻找一个包来帮助
在python中调用subprocess.Popen时“系统找不到指定的文件”

我正在尝试使用svnmerge py合并一些文件它在底层使用 python 当我使用它时我收到一个错误系统找不到指定的文件工作中的同事正在运行相同版本的svnmerge py 以及 python 2 5 2 特别是 r252 609
如何将同步函数包装在异步协程中？

我在用着aiohttp https github com aio libs aiohttp构建一个 API 服务器将 TCP 请求发送到单独的服务器发送 TCP 请求的模块是同步的对于我来说是一个黑匣子所以我的问题是这些请求阻塞了整
如何在 Keras 中使用部分输入进行训练，其余部分用于损失函数

我是 Keras 新手正在尝试实现神经网络机器学习模型输入张量看起来像 X1 X2 和输出 Y 注意 X1 和 X2 是相关的在模型中只有 X1 将用于训练但 X1 和 X2 都将传递给损失函数该损失函数是 X1 X2 y pr
如何在python中递归复制目录并覆盖全部？

我正在尝试复制 home myUser dir1 及其所有内容及其内容等 home myuser dir2 在Python中此外我希望副本覆盖中的所有内容dir2 It looks like distutils dir util co
Matplotlib 将颜色图 tab20 更改为三种颜色

Matplotlib 有一些新的且非常方便的颜色图选项卡颜色图 https matplotlib org examples color colormaps reference html 我错过的是生成像 tab20b 或 tab20c 这
如何将reportlab与Google应用程序引擎一起使用

我无法在谷歌应用程序引擎下正确导入reportlab 根据以下guide http blog notdot net 2010 04 Generating PDFs on App Engine Python and introducing M
将参数传递给 __enter__

刚刚学习 with 语句尤其是这篇文章 http effbot org zone python with statement htm 问题是我可以传递一个参数给 enter 我有这样的代码 class clippy runner def
django如何将字符串转换为模块？

我试图了解 django 的另一个神奇之处它可以将字符串转换为模块 In settings py INSTALLED APPS声明如下 INSTALLED APPS django contrib auth django contrib c
Scikit Learn - K-Means - 肘部 - 标准

今天我想学习一些关于 K means 的知识我已经了解该算法并且知道它是如何工作的现在我正在寻找正确的 k 我发现肘部准则作为检测正确的 k 的方法但我不明白如何将它与 scikit learn 一起使用在 scikit learn
Pandas DataFrame：如何计算组中第一行和最后一行的差异？

这是我的熊猫数据框 import pandas as pd import numpy as np data column1 338 519 871 1731 2693 2963 3379 3789 3910 4109 4307 4800 4
Melt() 函数复制数据集

我有一个这样的表 id name doggo floofer puppo pupper 1 rowa NaN NaN NaN NaN 2 ray NaN NaN NaN NaN 3 emma NaN NaN NaN pupper 4 sop
字母尺度和随机文本上的马尔可夫链

我想使用 txt 文件中的一本书中的字母频率生成随机文本以便每个新字符 string lowercase 取决于前一个如何使用马尔可夫链来做到这一点或者使用每个字母都有条件频率的 27 个数组更简单我想使用来自的字母频率生成随机文本
使用Python重命名目录中的多个文件

我正在尝试使用以下 Python 脚本重命名目录中的多个文件 import os path Users myName Desktop directory files os listdir path i 1 for file in files
Django - 缺少 1 个必需的位置参数：'request'

我收到错误 get indiceComercioVarejista 缺少 1 个必需的位置参数要求当尝试访问 get indiceComercioVarejista 方法时我不知道这是怎么回事 views from django ht
如何将 Pandas Dataframe 中的字符串转换为字符列表或数组？

我有一个名为的数据框data 其中一列包含字符串我想从字符串中提取字符因为我的目标是对它们进行一次性编码并使之可用于分类包含字符串的列存储在预测因子如下 predictors pd DataFrame data columns Seq
Python 中的迭代器 (iter()) 函数。 [关闭]

Closed 这个问题是无法重现或由拼写错误引起 help closed questions 目前不接受答案对于字典我可以使用iter 用于迭代字典的键 y x 10 y 20 for val in iter y print val 当
从 Flask 中的 S3 返回 PDF

我正在尝试在 Flask 应用程序的浏览器中返回 PDF 我使用 AWS S3 来存储文件并使用 boto3 作为与 S3 交互的 SDK 到目前为止我的代码是 s3 boto3 resource s3 aws access key id

随机推荐

我无法访问 SQL 2005 实例的所有原因

我已经安装了 SQL 2005 Express 的实例
如何将循环中的变量更新为对循环内创建的值的引用？

我想进入一个带有变量的循环n这是函数借用的每一步 n取新值当退出循环时工作在其他变量的帮助下完成并且n will never再次使用如果我不使用引用我会有这样的东西 fn test n Thing gt usize stuff
JDBC.SQLServerException：结果集没有当前行

因此我创建的解决方案引发了此异常 jdbc SQLServerException The result set has no current row在下面代码中标记的行上 public String get64BitEncodedImag
Scala 映射函数签名的解释？

此代码将函数应用于整数列表并将选项列表中的每个值设置为值 4 val l List 1 2 3 4 5 gt l List Int val v 4 gt v Int 4 def g v Int List v 1 v v 1 gt g v
CSS 容器 div 未获取高度

我希望我的容器 div 获得其子级高度的最大值不知道孩子的身高div将会有我正在尝试JSFiddle http jsfiddle net gtdfY 2 容器div为红色哪个没有出现为什么添加以下属性 c overflow hid
为什么 DOMDocument 嵌套段落 (
) 标记？

有没有办法阻止 DOMDocument 嵌套标签这是一个例子 dom gt loadHTML p text1 p p text2 p LIBXML HTML NOIMPLIED LIBXML HTML NODEFDTD Outputs
python删除字符串中的2个字符

python搜索字符 x 下一步删除该字符 x 字符 x 1字符串中的位置 Example x 1 520 2 529 我要搜索x 并删除和之前的数字最后我希望它看起来像x 520 529 在我创建这个主题之前我只发现用一个字符替换一
OpenGL：仅使用一个帧缓冲区并切换目标纹理

我是否可以只创建一个帧缓冲区对象并通过在需要时切换其目标纹理来实现相同的结果而不是使用多个帧缓冲区对象在所有情况下这都是一个坏主意吗如果是为什么我一直在实现一个功能render SetTargetTexture 在我的程序的 AP
在大多数设备上使用 Google 地图 v2 时应用程序崩溃

我正在尝试编写一些使用 Google 地图 API 的应用程序地图显示在主要活动中在某些手机包括模拟器上应用程序启动后立即崩溃它唯一兼容的手机是我的 Galaxy S1 它运行 CM10 1 4 2 2 它在我的 HTC DES
通过iPhone编程发送短信？ [复制]

这个问题在这里已经有答案了可能的重复如何在 iPhone 上以编程方式发送短信 https stackoverflow com questions 10848 how to programmatically send sms on th
Java - 在 try/catch 中执行 try/catch 是一种不好的做法吗？

我有一些代码想要在发生异常时执行但该代码也可能生成异常但我从未见过有人在另一个 try catch 中执行 try catch 我的做法很糟糕也许有更好的方法 Uri uri Uri parse some url Intent int
TensorFlow 设备上下文、流和上下文切换

In the GPU设备 https github com tensorflow tensorflow blob master tensorflow core common runtime gpu gpu device cc L264代码
访问 Azure 上 ASP.NET 5 中的连接字符串

在 ASP NET 5 中我们如何以编程方式访问 Azure Web 应用程序的连接字符串我已经能够检索到TEST APP SETTINGS值但不是TestConnString one 这是我尝试过的 services Configur
在 Chrome 中拖动时更改 HTML5 Canvas 上的光标

我正在研究如何在拖动鼠标时更改 HTML5 画布上的光标遇到了这个拖动鼠标时更改 HTML5 Canvas 上的光标 https stackoverflow com questions 4945874 change cursor ove
Android 初始屏幕横向和纵向

如何修改此代码以设置横向和纵向的启动屏幕我设法在纵向模式下工作并且工作正常我喜欢我为这两个方向做的请修改此代码这是我的 SplashActivity java public class SplashActivity extends
在 F# 中处理 Deedle 时间序列中的缺失值 (1)

这是一个小例子我想处理系列上自定义函数的缺失值假设我已经获得了一系列 series4 val it Series
如何取回被过滤的数据（React Context API）

我正在使用reactjs ReactContextAPI apexChart 创建一个仪表板应用程序其中 1000 长度的 JSON 数据将在 7 8 个不同的图表上可视化并且包含 6 7 个变量过滤器关于应用程序结构的基本想法 De
为什么我在 C++ 的语句表达式中得到“操作可能未定义”？

为了简单描述问题请看下面的代码 int main int a 123 if a a 0 return 0 我从 Wsequence point 收到此警告 Line 4 warning operation on a may be unde
我应该使用 akka.http.scaladsl.util.FastFuture 而不是 scala.concurrent.Future 吗？

我应该使用 akka http scaladsl util FastFuture 而不是 scala concurrent Future 吗评论说 Provides alternative implementations of the b
当列数动态时，如何从数据框中过滤数据？

我有一个如下所示的数据框 A Name B Detail Value B Value C Value D 0 AA X1 1 2 0 5 1 3 1 BB Y1 0 76 0 7 0 8 2 CC Z1 0 7 1 3 2 5 3 DD L

当列数动态时，如何从数据框中过滤数据？

当列数动态时，如何从数据框中过滤数据？ 的相关文章

随机推荐

热门标签

当列数动态时，如何从数据框中过滤数据？的相关文章