两个独立数据帧的距离矩阵

2024-01-08

我想创建一个矩阵，其中包含一个数据帧的行与另一个数据帧的行的欧几里德距离。例如，假设我有以下数据框：

a <- c(1,2,3,4,5)
b <- c(5,4,3,2,1)
c <- c(5,4,1,2,3)
df1 <- data.frame(a,b,c)

a2 <- c(2,7,1,2,3)
b2 <- c(7,6,5,4,3)
c2 <- c(1,2,3,4,5)
df2 <- data.frame(a2,b2,c2)

我想创建一个矩阵，其中包含 df1 中每行与 df2 中行的距离。

所以matrix[2,1]应该是df1[2,]和df2[1,]之间的欧氏距离。 matrix[3,2] df[3,] 和 df2[2,] 之间的距离等。

有谁知道如何实现这一点？

也许你可以使用fields包：函数rdist可能会做你想做的事：

rdist ：欧几里德距离矩阵
描述：给定两组位置，计算所有配对之间的欧几里德距离矩阵。

> rdist(df1, df2)
     [,1]     [,2]     [,3]     [,4]     [,5]
[1,] 4.582576 6.782330 2.000000 1.732051 2.828427
[2,] 4.242641 5.744563 1.732051 0.000000 1.732051
[3,] 4.123106 5.099020 3.464102 3.316625 4.000000
[4,] 5.477226 5.000000 4.358899 3.464102 3.316625
[5,] 7.000000 5.477226 5.656854 4.358899 3.464102

类似的情况是pdist package

pdist：分区矩阵的观测值之间的距离
描述：计算矩阵 X 的行与另一个矩阵 Y 的行之间的欧氏距离。

> pdist(df1, df2)
An object of class "pdist"
Slot "dist":
[1] 4.582576 6.782330 2.000000 1.732051 2.828427 4.242640 5.744563 1.732051
[9] 0.000000 1.732051 4.123106 5.099020 3.464102 3.316625 4.000000 5.477226
[17] 5.000000 4.358899 3.464102 3.316625 7.000000 5.477226 5.656854 4.358899
[25] 3.464102
attr(,"Csingle")
[1] TRUE

Slot "n":
[1] 5

Slot "p":
[1] 5

Slot ".S3Class":
[1] "pdist"

注意：如果您正在寻找行之间的欧几里得范数，您可能需要尝试：

a <- c(1,2,3,4,5)
b <- c(5,4,3,2,1)
c <- c(5,4,1,2,3)
df1 <- rbind(a, b, c)

a2 <- c(2,7,1,2,3)
b2 <- c(7,6,5,4,3)
c2 <- c(1,2,3,4,5)
df2 <- rbind(a2,b2,c2)

rdist(df1, df2)

这给出：

> rdist(df1, df2)
         [,1]     [,2]     [,3]
[1,] 6.164414 7.745967 0.000000
[2,] 5.099020 4.472136 6.324555
[3,] 4.242641 5.291503 5.656854

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

matrix

DataFrame

euclideandistance

两个独立数据帧的距离矩阵的相关文章

按工作日对 pandas 数据框进行排序

如何按工作日名称对 DataFrame 进行排序我无法使用 pd to datetime 方法因为我的日期不是数字 Date Transactions 0 Friday 140 652174 1 Monday 114 000000 2
如何检查向量是否是单个 NA 值，没有长度警告且没有抑制

我有一个功能NA作为默认值但如果没有NA应该是一个不限于大小 1 的字符向量我有一个检查来验证这些但是is na当向量是字符向量时产生标准警告length大于1 so function lt function x NA if is n
如何扩展 ggplot y 轴限制以包含最大值

通常在图中 Y 轴值标签会在绘制的最大值下方被截断 For example library tidyverse mtcars gt ggplot aes x mpg y hp geom point 我知道scale y continous
确定列的累积最大值

我正在尝试以下代码 df pd DataFrame 23 52 36 49 52 61 75 82 97 12 columns A B df C np where df A gt df C shift df A df C shift pri
if(interactive()) 是否相当于 Python 中的“if __name__ == ”__main__“: main()”？

我希望 R 脚本有一个 main 函数可以在交互模式下执行但在获取文件时不应执行 main 函数已经有一个关于这个的问题了 https stackoverflow com questions 2968220 is there an r
将 SAS sas7bdat 数据读入 R

R 有哪些选项可以读取本机 SAS 格式的文件 sas7bdat 进入R The NCES 共同核心 https nces ed gov ccd pubschuniv asp例如包含以此格式保存的大量数据文件存储库为了具体起见让我们集
在两个向量之间交换元素（交叉）

假设我有 chromosome 1 lt c 0010000001010000 chromosome 2 lt c 0100000001001010 我该如何实施step 3 5 Evaluate NC1 否中 1 个chromosome
将日期（系列）列从一个 DataFrame 添加到其他 Pandas，Python

我正在尝试将日期列从 df1 广播到 df2 在 df1 中我有所有用户的姓名及其基本信息在 df2 中我有一个用户购买的列表 df1 和 df2 代码 https i stack imgur com sN0uJ png 假设我有一
R：交换两个变量而不使用第三个变量

我有两个变量即 a lt 1 b lt 2 我想交换他们的价值观是否有任何内置的 R 函数能够执行该操作或者是否有其他优雅的方式而不使用第三个临时变量 Note 如果可能的话适用于字符串或其他数据类型有一个通用的解决方案或技
如何通过在R闪亮循环中读取.csv文件来动态生成dataTableOutput？

我有一个函数可以生成 n 个数据帧并将其作为 csv 文件保存在某个位置并且该函数返回已保存 CSV 的文件名我希望获取这些 csv 文件使用以下命令读取它read csv 然后使用 renderUI 和 renderDataTabl
GitHub 操作 setup-r-dependency 失败，说明没有名为“digest”的包

我一直在尝试设置一些 GitHub 操作来自动检查我的 R 包并运行测试覆盖率我目前正在使用 setup r dependency v2 操作来安装依赖项但无法安装包 digest 返回以下错误 Error Error
将多个函数应用于一个向量

我正在寻找一种将多个函数应用于一个向量的选项我认为这对于逆应用函数来说是一种仁慈其中一个函数应用于许多向量或列有没有办法指定两个或多个函数例如 min 和 max 并将其应用于向量与 CathG的评论类似但没有get v lt
‘!’ 对于 R 中的因子没有意义

我需要从数据框中排除变量 PABI 所以我按如下方式进行子集化 MyData4 lt subset MyData PROV PABI newdata lt MyData MyData4 但我得到了这个错误 Error in FUN lef
挑战：优化取消列出[简单]

因为 SO 最近有点慢所以我发布了一个简单的问题如果大鱼们能在这场比赛中留在替补席上并给新秀们一个回应的机会我将不胜感激有时我们的对象具有大量的大列表元素向量您如何将这个对象取消列出到单个向量中证明你的方法比unlist
与heroku配合使用的统计引擎

我有一个 Heroku Rails 应用程序需要处理一些重要的数字并且我需要使用像 R 这样的统计库更糟糕的是 MatLab 我正在寻找以下任何问题的答案是否有不需要二进制文件的功能齐全的统计包 GEM 是否可以将 R 二进制文件作
如何修改反应链以便最后修改的对象控制其他链接的对象？

新注释 1 最终解决的代码发布在最底部反映了 ismirsehregal 于 2021 年 12 月 3 日的解决方案以及一些标记为 ADDED 和 MODIFIED 的小调整 ADD 是为了解决我在矩阵 2 添加值后从矩阵 1 中删除
如何使用 Rrank() 函数创建新的ties.method？ [复制]

这个问题在这里已经有答案了我试图按人口和日期排序这个数据框所以我使用order and rank 功能 gt df lt data frame idgeoville c 5 8 4 3 4 5 8 8 date c rep 1950 4
有没有一种明智的方法可以在 R 中执行诸如文档字符串之类的操作？

这不仅仅是一个编码风格问题如果您了解 python 我认为 Ruby 也有类似的东西您可以在函数中拥有文档字符串这样您就可以通过发出 help 命令轻松获取该字符串例如 def something t None Do somethi
rpy2 无法加载外部库

希望有人能帮忙解决这个问题 R版本 2 14 1rpy2版本 2 2 5蟒蛇版本 2 7 3 一直在尝试在 python 脚本中使用 rpy2 加载 R venneuler 包该包以 rJava 作为依赖项 venneuler 和 rJa
将 r 中的一列从出生日期更改为年龄

我是第一次使用 data table 我的表中有大约 400 000 个年龄的列我需要将它们从出生日期转换为年龄做这个的最好方式是什么我一直在思考这个问题到目前为止对这两个答案都不满意我喜欢用lubridate 就像 KFB 所做

随机推荐

从 Python 访问 COM 方法

我有一个旧的 Windows DLL 没有源代码它实现了实用函数表几年前计划将其转换为 COM 对象以便实现 IUnknown 接口为了使用这个 DLL 有一个头文件简化的 interface IFunctions public
在编写 C 代码时如何优雅地利用 REV 和 RBIT 等 ARM 指令？

我正在编写可以为 Arm Cortex M3 微控制器编译的 C 代码该微控制器支持多种有用的指令可有效操作寄存器中的位包括 REV RBIT SXT 在编写C代码时如果我需要那些特定的功能如何利用这些指令例如我怎样才能完成这
Django：标记为已读“通知”

我正在做一个学校项目现在任何用户都可以提出问题为了在任何用户提出问题时通知所有用户我创建了一个新应用程序并在提出问题时通过简单的视图通知他们但这还只是普通的通知用户打开通知选项卡后如何将它们标记为已读就像在社交网络上
如何从浏览器读取客户端的机器/计算机名称？

如何从浏览器读取客户端的机器计算机名称是否可以使用 JavaScript 和或 ASP NET 您有时可以使用 IE 来完成此操作因为我已经在只有 IE 的 Intranet 上的内部应用程序中完成了此操作请尝试以下操作 fu
按字符串选择列时，Dplyr 的 tbl_df 会出现意外行为

通常当以编程方式使用 dplyr 时我希望通过名称选择列其中列名称作为字符串存储在某个变量中我注意到尝试使用 dplyr 执行此操作通常会导致意外结果这似乎是由于 tbl df 的处理方式造成的以下是一些示例 regular d
如何将一个函数作为参数传递给另一个函数

我想将一个函数作为参数传递给另一个函数例如 void myFunction boolean coondition void function if condition function 在 Java 8 中这可能吗不你不能传递方法但
从c# 连接到oracle

我正在尝试从 C 连接 Oracle 11g 我已关注此链接定义了连接别名如下所示 moviess DESCRIPTION ADDRESS PROTOCOL TCP HOST localhost PORT 1521 CONNECT D
Entity Framework 4.1 Fluent API 中具有联接表和可选关系的一对多

再次使用无法更改的旧数据库并使用 Entity Framework 4 1 和 Fluent API 仅读取数据 public class Client Key public int ClientID get set public str
如何 Dockerize Windows 应用程序

我有一个 Windows 应用程序我想将其容器化它是一个 Windows 桌面应用程序不是 Web 应用程序我做了一些搜索发现关于容器化桌面应用程序的信息很少我想要容器化的应用程序在 WindowsServerCore 上运行良
Angular4 更改 md 按钮的波纹颜色

我使用 Material for Angular4 在网页中创建了一个 md 按钮有没有办法改变波纹效果的颜色并使其变为白色我还可以更改其他波纹属性例如波纹效果的持续时间吗事实证明为了更改波纹属性应该在 mat ripple t
BehaviourSubject 初始值不适用于 share()

share 运算符应用于BehaviorSubject BehaviourSubject 有初始值目标是创建单个共享订阅但是当BehaviorSubject有初始值时这种共享订阅似乎不起作用得到意想不到的结果代码如下所示 let
使用我自己的实体而不是 POCO 实体

我正在使用实体框架我可以使用自己的实体来代替 POCO 实体吗我可以使用任何实体或者实体名称和成员有任何限制吗如果实体的成员与字段的名称不同如何在 db 字段与实体的成员本身之间映射 UPDATE我已经拥有数据库广告一个大型项目
将函数放入对象中与对其进行原型设计之间有什么区别？

向对象添加函数和将函数原型化到对象上有什么区别原型设计允许对象模型调用自身吗函数对象通常用于对一组函数进行命名空间以便一个容器对象具有许多方法而不是许多全局函数这样做的好处是保持代码组件按对象可能还有对象层次结构进行分类或
三个值的中值

我正在尝试编写一个 C 程序它接受 3 个值作为函数参数并返回中位数该程序运行得很好直到我意识到它不能使用相同的值两次或更多次例如如果输入是 1 2 3 我得到 2 正确的中位数但如果输入是 1 2 1 或 1 1 1 循环从头
如何将列表转换为以索引作为值的字典？

我正在尝试转换以下列表 l A B C 对于像这样的字典 d A 0 B 1 C 2 我尝试过其他帖子的答案但没有一个对我有用我现在有以下代码 d l i i for i in range len l 这给了我这个错误 unhashab
检查类型是否可为 Null 的正确方法[重复]

这个问题在这里已经有答案了为了检查是否Type propertyType 可以为空我正在使用 bool isNullable Nullable 1 Equals propertyType Name 有什么方法可以避免使用魔术字符串吗绝
当我的 JAR 位于类路径中时，为什么 Ant 会说“NoClassDefFound”？

我正在使用 Java 1 6 Eclipse 和 Ant 以下是我创建 jar 文件并运行它的目标
使用 scrapy 与 javascript __doPostBack 方法时出现问题

尝试自动从公共搜索中抓取搜索结果但遇到了一些麻烦 URL 的形式为 http www website com search aspx keyword page 1 sort Sorting 当我点击页面时访问此页面后它会略有变化 ht
角度4，如何传递提供者实例

我有一个 Mqtt 服务我可以从中获取一些实时数据几何和温度 Mqtt 服务 import Injectable from angular core import Paho from Own paho sript geomqttws31
两个独立数据帧的距离矩阵

我想创建一个矩阵其中包含一个数据帧的行与另一个数据帧的行的欧几里德距离例如假设我有以下数据框 a lt c 1 2 3 4 5 b lt c 5 4 3 2 1 c lt c 5 4 1 2 3 df1 lt data frame a

两个独立数据帧的距离矩阵

两个独立数据帧的距离矩阵 的相关文章

随机推荐

热门标签

两个独立数据帧的距离矩阵的相关文章