我可以将 pandas.dataframe.isin() 与数字容差参数一起使用吗？

2024-04-14

我事先查看了以下帖子。有没有办法将 DataFrame.isin() 与近似因子或容差值一起使用？或者还有其他方法可以吗？

如果列中的值位于一组值列表中，则过滤数据框行 https://stackoverflow.com/questions/12065885/how-to-filter-the-dataframe-rows-of-pandas-by-within-in

使用值列表从 pandas 数据框中选择行 https://stackoverflow.com/questions/12096252/use-a-list-of-values-to-select-rows-from-a-pandas-dataframe

EX)

df = DataFrame({'A' : [5,6,3.3,4], 'B' : [1,2,3.2, 5]})

In : df
Out:
   A    B
0  5    1
1  6    2
2  3.3  3.2
3  4    5  

df[df['A'].isin([3, 6], tol=.5)]

In : df
Out:
   A    B
1  6    2
2  3.3  3.2

你可以做类似的事情numpy isclose http://docs.scipy.org/doc/numpy/reference/generated/numpy.isclose.html:

df[np.isclose(df['A'].values[:, None], [3, 6], atol=.5).any(axis=1)]
Out: 
     A    B
1  6.0  2.0
2  3.3  3.2

np.isclose 返回此：

np.isclose(df['A'].values[:, None], [3, 6], atol=.5)
Out: 
array([[False, False],
       [False,  True],
       [ True, False],
       [False, False]], dtype=bool)

这是两两比较df['A']的元素和[3, 6]（这就是为什么我们需要df['A'].values[: None]- 用于广播）。由于您正在寻找它是否接近列表中的任何一个，因此我们调用.any(axis=1)在最后。

对于多列，稍微更改切片：

mask = np.isclose(df[['A', 'B']].values[:, :, None], [3, 6], atol=0.5).any(axis=(1, 2))
mask
Out: array([False,  True,  True, False], dtype=bool)

您可以使用此掩码对 DataFrame 进行切片（即df[mask])

如果你想比较df['A'] and df['B']（以及可能的其他列）使用不同的向量，您可以创建两个不同的掩码：

mask1 = np.isclose(df['A'].values[:, None], [1, 2, 3], atol=.5).any(axis=1)
mask2 = np.isclose(df['B'].values[:, None], [4, 5], atol=.5).any(axis=1)
mask3 = ...

然后切片：

df[mask1 & mask2]  # or df[mask1 & mask2 & mask3 & ...]

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

我可以将 pandas.dataframe.isin() 与数字容差参数一起使用吗？的相关文章

理解Python中的元类和继承[重复]

这个问题在这里已经有答案了我对元类有一些困惑具有继承性 class AttributeInitType object def init self kwargs for name value in kwargs items setattr
以类似字典的方式将新项目添加到某些结构化数组中

我想扩展 numpy 中的结构化数组对象以便我可以轻松添加新元素例如对于一个简单的结构化数组 gt gt gt import numpy as np gt gt gt x np ndarray 2 dtype names A B fo
Django/gevent socket.IO 与 redis pubsub。我把东西放在哪里？

我有一个独立的 python 脚本它只是从 Twitter 的流 API 捕获数据然后在收到每条消息时使用 redis pubsub 将其发布到频道 tweets 这是该脚本 def main username username pa
识别 Windows 版本

我正在编写一个打印出详细 Windows 版本信息的函数输出可能是这样的元组 32bit XP Professional SP3 English 它将支持 Windows XP 及更高版本我一直坚持获取 Windows 版本例如专业
从 SQL Server 中调用 Python 文件

我的文件名中有 Python 脚本 C Python HL py 在此 Python 脚本中有预测模型以及对 SQL 数据库中某些表的更新我想将此文件称为 SQL 作业我怎样才能做到这一点这个问题不一样如何在 SQL Server
python: X 服务器上的致命 IO 错误 11（资源暂时不可用）：0.0

我正在尝试读取一些图像稍后打算对它们执行一些任务同时将图像读入内存我想显示动画 gif 图像为此我必须使用线程现在它给出错误 python Fatal IO error 11 Resource temporarily unava
通过 Python 在 PostgreSQL 中的 unicode 字符串中是否允许空字节？

unicode 字符串中是否允许空字节我不问 utf8 我的意思是 unicode 字符串的高级对象表示背景我们通过 Python 在 PostgreSQL 中存储包含空字节的 unicode 字符串如果我们再次读取字符串字符串会
可重用的 Tensorflow 卷积网络

我想重用来自Tensorflow 专业人士的 MNIST CNN 示例 http www tensorflow org tutorials mnist pros index md 我的图像尺寸为 388px X 191px 只有 2 个输出
在Python中随机化列表[重复]

这个问题在这里已经有答案了我想知道是否有一个好方法来震动 Python 中的项目列表例如 1 2 3 4 5 可能会被动摇随机化 3 1 4 2 5 任何顺序都同样可能 from random import shuffle list
可变和不可变类变量如何初始化？

运行下面的示例代码 class S i 0 a def init self self i 1 self a append 1 s1 S print s1 i s1 a s2 S print s2 i s2 a 输出将是 1 1 1 1 1
在 Python 中将 int 转换为 ASCII 并返回

我正在为我的网站制作一个 URL 缩短器我当前的计划我愿意接受建议是使用节点 ID 来生成缩短的 URL 因此理论上节点 26 可能是short com z 节点 1 可能是short com a 节点 52 可能是short c
包装 C++ Qt 小部件以便在 Python 中与 PySide 一起使用

在 Python 中使用自定义 Qt 显示小部件包装自定义 C 库以便在基于 PySide 的 QApplication 中使用的最佳方法是什么 C 库是否需要特殊处理才能使用 SWIG 进行包装封装的 Qt 小部件能否与 PySide
将 Matlab MEX 文件中的函数直接嵌入到 Python 中

我正在使用专有的 Matlab MEX 文件在 Matlab 中导入一些仿真结果当然没有可用的源代码 Matlab 的接口实际上非常简单因为只有一个函数返回一个 Matlab 结构体我想知道是否有任何方法可以直接从Python调用M
调试 python Web 服务

我正在使用找到的说明here http www diveintopython net http web services user agent html 尝试检查发送到我的网络服务器的 HTTP 命令但是我没有看到按照教程中的建议在控制
captureWarnings 设置为 True 不会捕获警告

我想记录所有警告我以为这样的设定captureWarnings to True应该可以解决问题但事实并非如此代码 import logging import warnings from logging handlers import
Windows 10 上的 Tensorflow 安装问题

我正在尝试在 Win 10 计算机上安装 Tensorflow 我成功安装了Python 3 7 然后尝试按照tensorflow org上的安装说明进行操作执行时 pip install tensorflow 我收到以下错误消息错误
如何在特定时间启动Tornado周期性回调？

目前在我的 Tornado 应用程序中我正在使用定期调用回调PeriodicCallback每隔一小时像这样 import tornado ioloop from tornado ioloop import PeriodicCallba
使用 PuLP 进行线性优化，变量附加条件

我必须用 Pull 解决 Python 中的整数线性优化问题我解决了基本问题现在我必须添加额外的约束有人可以帮助我用逻辑指示器添加条件吗逻辑限制是如果 A gt 20 则 B gt 5 这是我的代码 from pulp impor
矩阵求逆 (3,3) python - 硬编码与 numpy.linalg.inv

对于大量矩阵我需要计算定义为的距离度量尽管我确实知道强烈建议不要使用矩阵求逆但我没有找到解决方法因此我尝试通过对矩阵求逆进行硬编码来提高性能因为所有矩阵的大小均为 3 3 我预计这至少会是一个微小的改进但事实并非如此为什么
如何访问模板缓存？ - 姜戈

I am 缓存 HTML在几个模板内例如 cache 900 stats stats endcache 我可以使用以下方式访问缓存吗低级图书馆例如 html cache get stats 我确实需要对模板缓存进行一些细粒度的控制有任

随机推荐

如何更改 NSPopover 背景颜色包括三角形部分？

我该如何改变NSPopover背景颜色包括三角形部分吗它实际上要简单得多并且您不需要私有 API 使视图控制器的根视图成为自定义类 implementation MyPopoverRootView void viewDidMoveToW
在 Python 中为方法生成控制流图的最简单方法是什么？

我正在编写一个程序来尝试比较两种方法我想为所有匹配的方法生成控制流图 CFG 并使用拓扑排序来比较两个图有一个Python包叫做staticfg https pypi org project staticfg 它正是从一段 Python
为什么不再需要指明ByVal/ByRef？

我刚刚安装了 Visual Studio 2010 Service Pack 在 Windows Update 上建议我可以看到 intellisense 上的一个新功能这意味着当我编写Function or Sub在 VB NET 中
Linux 上的 JDK 1.8 缺少 JNI 包含文件

我正在尝试编译以下项目 https github com entropia libsocket can java 我总是收到此错误消息有谁知道如何修复它这可能是 Linux x64 Debian Wheezy 上 JDK 1 8 0 1
自定义类型.NamedTuple

我在用着NamedTuples来保存数据我想添加一个可以被多个继承的方法NamedTuple基础课程但是当我尝试使用多重继承或子类化时NamedTuple基于类它不起作用具体来说我试图自动为所有数据类提供一个方法该方法可以查看类
同一服务器实例和同一作业存储上的多个 Quartz 实例

我们有 2 个使用quartz 进行调度的应用程序我们应用程序的quartz properties如下 org quartz scheduler instanceName sr22QuartzScheduler org quartz sc
HighCharts：在一个系列中绘制多个段？

我问自己是否可以做多条重叠的线在一个系列中我找不到任何例子我不想要这个 Highcharts Highstock 阶梯线没有垂直过渡线 https stackoverflow com questions 23242857 high
私有子方法的原型

我的代码如下所示 var baseClass function CODE var subClass function MORE CODE 向baseClass添加方法就可以了我只是使用 baseClass prototype newMet
如何从 XML 文档读取值来构建 ComboBox？

我正在尝试阅读xml questions tagged xml我想为我妈妈制作的文件所以基本上这就是我想做的 A ComboBox这将显示 XML 中的所有蔬菜名称选择一种蔬菜后第二个ComboBox将在 XML 中显示可以使用第一个
如何使用用户环境在 NodeJS 中执行？

我正在尝试在 Node 中执行命令 cd www foo path to git bin git exe config list global 基本上我想执行一个返回全局配置针对当前用户的 Git 命令当我直接在 cli 上执行命令
如何在Spritekit中创建计时器？

我已经弄清楚如何在单视图应用程序中制作计时器但没有弄清楚 Spritekit 当我使用以下代码时出现 2 个错误如下所示谁能帮我解决这个问题吗谢谢杰克计时器 if scorelabel scorelabel SKLabelNo
Session_End 上的 asp.net 会话变量

我需要访问 global asax cs 中 Session End 事件上的会话变量但 HttpContext Current 为空因此所有会话变量都不可访问 a 我可以以不同的方式访问用户会话或者 b 在 Session End
为什么以 utf-8 保存的文本文件比其他文件大？

什么是 UTF 8 编码为什么以 utf 8 格式保存的文本文件比其他格式的文件大例如我在记事本中输入 A 并将其保存为 UTF 8 格式之后文件大小变为 4字节 Why 几乎可以肯定因为您用来保存文件的任何内容也包括字节顺序标
ISO15693 (NfcV) / Tag-it HF-I 命令引发标签丢失异常

当我尝试收发 NFC V Tag it HF I Plus Inlay 标签的命令时大多数命令都会出现 TagLostException 从我经历过的链接来看这个异常可能是由不正确的命令引起的如何为 Nfc V Tag it HF I
如何在不使用“~”的情况下从 sass 加载器中的 node_modules 导入样式表

我正在设置 Storybook 实例以从 Rails 应用程序加载样式但它无法在我的应用程序中加载导入main scss文件两者都是样式表node modules import react table react table css i
Hibernate JPA 序列（非 Id）

是否可以对某些列使用数据库序列不是标识符不是复合标识符的一部分我使用 hibernate 作为 jpa 提供程序并且我有一个表其中有一些生成值的列使用序列尽管它们不是标识符的一部分我想要的是使用序列为实体创建新值其中序列的列
合并 JSON 数组

所以我的目标是合并 json 文件以获得以下格式 title NamesBook list name Ajay name Al 我的文件看起来像这样的格式等等 json title NamesBook list name Ajay blu
如何使用QtCopyDialog？

我包括这个库 include
如何在Python中检测两个文件是否相同[重复]

这个问题在这里已经有答案了在这种情况下对 md5sum file1 和 md5sum file2 进行系统调用并比较两个返回值是否足够如果您想做的不仅仅是检测它们是否不同或者不信任哈希解决方案标准库中有一些名为difflib ht
我可以将 pandas.dataframe.isin() 与数字容差参数一起使用吗？

我事先查看了以下帖子有没有办法将 DataFrame isin 与近似因子或容差值一起使用或者还有其他方法可以吗如果列中的值位于一组值列表中则过滤数据框行 https stackoverflow com questions 1206

我可以将 pandas.dataframe.isin() 与数字容差参数一起使用吗？

我可以将 pandas.dataframe.isin() 与数字容差参数一起使用吗？ 的相关文章

随机推荐

热门标签

我可以将 pandas.dataframe.isin() 与数字容差参数一起使用吗？的相关文章