熊猫 corr() 与 corrwith()

2024-03-12

Pandas 提供两种不同的相关函数的原因是什么？

DataFrame.corrwith(其他，轴=0，drop=False): 两个DataFrame对象的行或列之间的相关性成对计算

vs.

DataFrame.corr(method='pearson', min_periods=1)：两两计算列的相关性，不包括 NA/null 值

（来自 pandas 0.20.3 文档）

基本答案：

这是一个可能更清楚的例子：

np.random.seed(123)
df1=pd.DataFrame( np.random.randn(3,2), columns=list('ab') )
df2=pd.DataFrame( np.random.randn(3,2), columns=list('ac') )

正如 @ffeast 所指出的，使用corr比较同一数据框中的数字列。非数字列将自动被跳过。

df1.corr()

          a         b
a  1.000000 -0.840475
b -0.840475  1.000000

您可以比较 df1 和 df2 的列corrwith。请注意，只有带有相同的名字进行比较：

df1.corrwith(df2)

a    0.993085
b         NaN
c         NaN

其他选项：

如果您希望 pandas 忽略列名称并仅将 df1 的第一行与 df2 的第一行进行比较，那么您可以重命名 df2 的列以匹配 df1 的列，如下所示：

df1.corrwith(df2.set_axis( df1.columns, axis='columns', inplace=False))

a    0.993085
b    0.969220

请注意，在这种情况下，df1 和 df2 需要具有相同的列数。

最后，厨房水槽方法：您也可以简单地水平连接两个数据集，然后使用corr()。优点是，无论列数及其命名方式如何，这基本上都可以工作，但缺点是您可能会得到比您想要或需要的更多的输出：

pd.concat([df1,df2],axis=1).corr()

          a         b         a         c
a  1.000000 -0.840475  0.993085 -0.681203
b -0.840475  1.000000 -0.771050  0.969220
a  0.993085 -0.771050  1.000000 -0.590545
c -0.681203  0.969220 -0.590545  1.000000

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

熊猫 corr() 与 corrwith() 的相关文章

在推送到容器注册表之前如何对构建的映像运行测试？

从 gitlab 文档中可以看出如何使用 kaniko 创建 docker 镜像 build stage build image name gcr io kaniko project executor debug entrypoint sc
Python设置1和True的解释

在 IPython 3 交互式 shell 中 In 53 set2 1 2 True hello In 54 len set2 Out 54 3 In 55 set2 Out 55 hello True 2 是因为 1 和 True 得到
如何检索分配给 Django 中的组的所有权限

我正在执行一项任务来检索分配给 Django 中的组的一组权限我可以使用以下代码获取创建的组但无法使用它来获取分配给它们的权限 from django contrib auth models import Group Permissio
Python 中 time.sleep 和多线程的问题

我对 python 中的 time sleep 函数有疑问我正在运行一个脚本需要等待另一个程序生成 txt 文件虽然这是一台非常旧的机器所以当我休眠 python 脚本时我遇到了其他程序不生成文件的问题除了使用 time sl
如何将 numpy rearray 的子集转换为连续数组？

我有一个recarray来自读取 csv 文件我有兴趣将列的子集转换为连续浮点数组我想避免将它们转换为列表或将它们一一堆叠我尝试了中的建议https stackoverflow com a 11792956 https stackov
如何在 numpy 数组中查找并保存重复的行？

我有一个数组例如 Array 1 1 1 2 2 2 3 3 3 4 4 4 5 5 5 1 1 1 2 2 2 我想要输出以下内容的东西 Repeated 1 1 1 2 2 2 保留重复行的数量也可以例如 Repeated 1 1
获取 int() 参数必须是字符串或数字，而不是“Column”- Apache Spark

如果我使用以下代码我会收到此异常 int argument must be a string or a number not Column df df withColumn FY F when df ID substr 5 2 isin
dask apply：AttributeError：“DataFrame”对象没有属性“name”

我有一个参数数据框并对每一行应用一个函数该函数本质上是几个 sql queries 和对结果的简单计算我正在尝试利用 Dask 的多处理同时保持结构和界面下面的例子有效并且确实有显着的提升 def get metrics row
打印一份拥有多个家庭的人员名单，每个家庭都有多个电话号码

我有一类 Person 它可以有多个 Home 每个 Home 都有一个或多个电话号码我已经定义了类但现在我正在尝试创建一个视图其中列出每个人的所有家庭以及每个家庭地址的所有电话号码类似于 john smith 123 fake s
python中将对象数据类型转换为字符串问题

如何将对象数据类型结构转换为字符串数据类型下面的方法不起作用该列仍然存在object转换为字符串后 astype import pandas as pd df pd DataFrame country A B C D E df dtyp
如何处理 Tkinter 中的窗口关闭事件？

如何在 Python Tkinter 程序中处理窗口关闭事件用户单击 X 按钮 Tkinter 支持一种称为协议处理程序 http web archive org web 20201111215134 http effbot org tk
操作错误：尝试在 ubuntu 服务器中写入只读数据库

我正在使用 FlaskApp 运行mod wsgi and apache2在 Ubuntu 服务器上我尝试运行烧瓶应用程序localhost成功然后部署到ubuntu服务器上但是当我尝试更新数据库时出现错误 Failed to up
更改用作函数全局作用域的字典

我想做一个 purePython 的装饰器其中一部分是能够有选择地禁止访问函数的全局范围有没有一种方法可以以编程方式更改哪个字典事物充当函数的全局外部作用域因此例如在下面我希望能够拦截对f in h并抛出错误但我想允许访问g因为
异步异常处理程序：在事件循环线程停止之前不会被调用

我正在我的异步事件循环上设置异常处理程序但是在事件循环线程停止之前它似乎不会被调用例如考虑以下代码 def exception handler loop context print Exception handler called
重定向 python 交互式帮助()

我正在为使用 Qt 的应用程序开发交互式 python shell 但是我似乎无法获得重定向的交互式帮助我的 python 代码中有这个 class OutputCatcher def init self self data def wr
使用 Sphinx 时，如何记录没有文档字符串的成员？

我正在为我发布的包编写文档我发现您的文档越全面人们就越容易找到您的包来使用废话实际上我在充满爱心地编写代码的所有功能和细节方面获得了很多乐趣然而我对如何为类级变量编写与 Sphinx 兼容的文档感到完全困惑特别是我有一些e
在 anaconda 环境下运行 qsub

我有一个程序通常在 Linux 的 conda 环境中运行因为我用它来管理我的库指令如下 source activate my environment python hello world py 我怎样才能跑你好世界 py在与 PBS
使用 Numpy 进行多维批量图像卷积

在图像处理和分类网络中一个常见的任务是输入图像与一些固定滤波器的卷积或互相关例如在卷积神经网络 CNN 中这是一种极其常见的操作我已将通用版本任务减少为 Given 一批 N 个图像 N H W D 和一组 K 个滤镜 K H W
python 日志记录替代方案 [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案蟒蛇记录模块 http docs python org library logging html使用起来
当训练和测试的特征数量不同时，如何处理生产环境中的One-Hot Encoding？

在做某些实验时我们通常在 70 上进行训练在 33 上进行测试但是当您的模型投入生产时会发生什么可能会发生以下情况训练集 Ser Type Of Car 1 Hatchback 2 Sedan 3 Coupe 4 SUV 经过

随机推荐

根据父 ID 值将数组从一维转换为多维

我有一个代表多维数据的一维对象数组 array array id gt 45 parent id gt null array id gt 200 parent id gt 45 array id gt 345 parent id gt 45
密码强度检查库[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案任何人都可以推荐一个 Java 库其中包含适合在 Web 应用程序中执行服务器端密码强度检查的方法理想情况下检查器应该是可配置允
如何在Python中子类化str

我正在尝试对 str 对象进行子类化并向其添加几个方法我的主要目的是学习如何去做我陷入困境的是我是否应该在元类中对 string 进行子类化并使用该元创建我的类或者直接对 str 进行子类化而且我想我需要实施 new 不知何
使用 NHibernate 和动态匿名对象在 GroupBy 查询中进行选择

我的主要目标是创建一个动态组并在 NHibernate 中使用它考虑这个非动态的例子works repository Collection
使 React 组件作为 Widget 可用

我有一个复杂的 React 应用程序包括渲染某些组件的身份验证等并且有一个特定的组件一个日期选择器我希望其他用户将其作为 Google 地图的小部件嵌入到他们的网站上我已经成功地将其作为 iFrame 进行共享但我想了解如何将其
使用贪婪正则表达式忽略可选后缀

我正在 NET 中对如下所示的字符串执行正则表达式匹配 1 Lists General Discussion Waffles Win 2 Lists General Discussion Waffles Win 2 000 3 Lists
使用 php 脚本中的 rsync 同步本地和远程文件夹，无需输入密码

如何在 php 脚本中使用 rsync 同步本地和远程文件夹而不提示输入密码我已经设置了一个公钥来自动为我的用户登录远程服务器所以从 cli 上运行没有任何问题 rsync r a v e ssh l user delete local
获取解析后的PHP文件

我试图在解析 PHP 文件后获取其内容然后将其存储在变量中除了这个例子之外我无法通过谷歌获得任何有用的信息 ob start include file content ob get clean 但这会以纯文本形式返回内容即标签仍然
点击“后退”按钮时将数据保存在编辑文本中

因此在活动 1 中我单击一个按钮进入活动 2 在活动 2 中我将一些数据输入到 EditText 中当我点击手机上的后退按钮时它会将我带到活动 1 这是正确的但如果我再次点击活动 1 按钮我在 EditText 中输入的任何文
Android Handler.post，到底发生了什么

几天以来我试图弄清楚如果我执行代码到底会发生什么 void function somePreExecutionCode new Handler post new Runnable Override public void run some
如何使用 Numpy 对字符串数组进行一次性编码？

我知道那里有次优的解决方案但我正在尝试优化我的代码到目前为止我发现的最短方法是 import numpy as np from sklearn preprocessing import OrdinalEncoder target np
使用 re.match 或 re.search 返回多个匹配项

我正在将一些代码转换为微型蟒蛇 http micropython org我陷入了一个特定的正则表达式在Python中我的代码是 import re line 0 1 24 2 1 180108205500W 00001 290 m3 be
UITableView 中的 UISearchBar

我试图模仿类似于 iPod 应用程序的艺术家表视图的行为它是一个分段表视图右侧有一个部分索引顶部有一个搜索栏但在显示视图时最初是隐藏的我使用的是sdk 3 1 2和IB 所以简单地拖了一个UISearchDisplayContro
为什么 Visual Studio 2019 不支持 Openmp 的 for-reduction 中的关键字“max”？

当我像这样使用 openmp 时 pragma omp parallel for reduction max dumax IDE 将在 Openmp 中引发错误 max reduction 无效 pragma omp parallel fo
托管 c++/cli .net 将固定字节数组转换为字符串^

如何在托管 c cli 中将固定字节数组转换为字符串例如我有以下字节数组 Byte byte data 5 byte data 0 a byte data 1 b byte data 2 c byte data 3 d byte data
如何在 Kendo Grid 的每一行中添加自定义按钮

我正在尝试将自定义按钮添加到 Kendo 网格的每一行但我没有得到所需的输出所以我的要求是向每一行添加动态按钮然后单击这些按钮我需要处理一些我需要的东西要传递给该按钮单击的几个列值我试过类似的东西 Html Kendo Grid
跟踪 IP 地址和国家/地区名称 (asp.net)？

昨天我看到一个网站其中列出了IP地址和国家名称说最近访问过的成员带有国家名称城市名称的IP地址列表我可以知道如何跟踪该信息任何参考或任何代码吗谢谢请检查这些问题检测估计 ASP NET 中 http 请求的国家地区 h
用于列出用户的 S3 存储桶内的特定文件夹的 IAM 策略

我在桶下面有下面的钥匙客户演示 demo for customers customer1 demo for customers customer2 现在我有 2 个客户客户1 and 客户2 这就是我要的仅授予他们访问权限客户演示 buc
给定一个数的质因数分解，生成该数的所有因数

如果您已经对一个数字进行质因数分解那么获得该数字的所有因数的集合的最简单方法是什么我知道我可以从 2 循环到 sqrt n 并找到所有可整除的数字但这似乎效率很低因为我们已经有了质因数分解我想它基本上是组合选择函数的修改版本但
熊猫 corr() 与 corrwith()

Pandas 提供两种不同的相关函数的原因是什么 DataFrame corrwith 其他轴 0 drop False 两个DataFrame对象的行或列之间的相关性成对计算 vs DataFrame corr method pears

熊猫 corr() 与 corrwith()

熊猫 corr() 与 corrwith() 的相关文章

随机推荐

热门标签