Matlab中 pdist 函数详解(各种距离的生成)

2023-10-26

一、pdist

Pairwise distance between pairs of objects

Syntax

D = pdist(X)
D = pdist(X,distance)

Description

D = pdist(X)    计算 X 中各对行向量的相互距离(X是一个m-by-n的矩阵). 这里 D 要特别注意,D 是一个长为m(m–1)/2的行向量.可以这样理解 D 的生成:首先生成一个 X 的距离方阵,由于该方阵是对称的,令对角线上的元素为0,所以取此方阵的下三角元素,按照Matlab中矩阵的按列存储原则,此下三角各元素的索引排列即为(2,1), (3,1), ..., (m,1), (3,2), ..., (m,2), ..., (m,m–1).可以用命令 squareform(D) 将此行向量转换为原距离方阵.(squareform函数是专门干这事的,其逆变换是也是squareform。)

D = pdist(X,distance)     使用指定的距离.distance可以取下面圆括号中的值,用红色标出!

Metrics

Given an m-by-n data matrix X, which is treated as m (1-by-n) row vectors x1, x2, ..., xm, the various distances between the vector xs and xt are defined as follows:

  • 欧几里德距离Euclidean distance('euclidean')

    d2s,t=(xs−xt)⋅(xs−xt)′ds,t2=(xs−xt)⋅(xs−xt)′


    Notice that the Euclidean distance is a special case of the Minkowski metric, where p = 2.
    欧氏距离虽然很有用,但也有明显的缺点。
       一:它将样品的不同属性(即各指标或各变量)之间的差别等同看待,这一点有时不能满足实际要求。
       二:它没有考虑各变量的数量级(量纲),容易犯大数吃小数的毛病。所以,可以先对原始数据进行规范化处理再进行距离计算。
     

  • 标准欧几里德距离Standardized Euclidean distance('seuclidean')

    d2s,t=(xs−xt)V−1(xs−xt)′ds,t2=(xs−xt)V−1(xs−xt)′


    where V is the n-by-n diagonal matrix whose jth diagonal element is S(j)2, where S is the vector of standard deviations.
       相比单纯的欧氏距离,标准欧氏距离能够有效的解决上述缺点。注意,这里的V在许多Matlab函数中是可以自己设定的,不一定非得取标准差,可以依据各变量的重要程度设置不同的值,如knnsearch函数中的Scale属性。
     
  • 马哈拉诺比斯距离Mahalanobis distance('mahalanobis')

     

    d2s,t=(xs−xt)C−1(xs−xt)′ds,t2=(xs−xt)C−1(xs−xt)′


    where C is the covariance matrix.
       马氏距离是由印度统计学家马哈拉诺比斯(P. C. Mahalanobis)提出的,表示数据的协方差距离。它是一种有效的计算两个未知样本集的相似度的方法。与欧式距离不同的是它考虑到各种特性之间的联系(例如:一条关于身高的信息会带来一条关于体重的信息,因为两者是有关联的)并且是尺度无关的(scale-invariant),即独立于测量尺度。
    如果协方差矩阵为单位矩阵,那么马氏距离就简化为欧式距离,如果协方差矩阵为对角阵,则其也可称为正规化的欧氏距离.
    马氏优缺点:

      1)马氏距离的计算是建立在总体样本的基础上的,因为C是由总样本计算而来,所以马氏距离的计算是不稳定的;

      2)在计算马氏距离过程中,要求总体样本数大于样本的维数。

      3)协方差矩阵的逆矩阵可能不存在。  
     

  • 曼哈顿距离(城市区块距离)City block metric('cityblock')

     

    ds,t=∑j=1n∣∣xsj−xtj∣∣ds,t=∑j=1n|xsj−xtj|


    Notice that the city block distance is a special case of the Minkowski metric, where p=1.
     

  • 闵可夫斯基距离Minkowski metric('minkowski')

     

    ds,t=∑j=1n∣∣xsj−xtj∣∣p−−−−−−−−−−−⎷pds,t=∑j=1n|xsj−xtj|pp


    Notice that for the special case of p = 1, the Minkowski metric gives the city block metric, for the special case of p = 2, the Minkowski metric gives the Euclidean distance, and for the special case of p = ∞, the Minkowski metric gives the Chebychev distance.
       闵可夫斯基距离由于是欧氏距离的推广,所以其缺点与欧氏距离大致相同。
     

  • 切比雪夫距离Chebychev distance('chebychev')

    ds,t=maxj∣∣xsj−xtj∣∣ds,t=maxj|xsj−xtj|


    Notice that the Chebychev distance is a special case of the Minkowski metric, where p = ∞.
     
  • 夹角余弦距离Cosine distance('cosine')

    ds,t=1−xsxt′∥xs∥2⋅∥xt∥2ds,t=1−xsxt′‖xs‖2⋅‖xt‖2


       与Jaccard距离相比,Cosine距离不仅忽略0-0匹配,而且能够处理非二元向量,即考虑到变量值的大小。
     
  • 相关距离Correlation distance('correlation')

    ds,t=1−xsxt′(xs−xs¯¯¯¯¯)⋅(xs−xs¯¯¯¯¯)′−−−−−−−−−−−−−−−−√⋅(xt−xt¯¯¯¯¯)⋅(xt−xt¯¯¯¯¯)′−−−−−−−−−−−−−−−−√ds,t=1−xsxt′(xs−xs¯)⋅(xs−xs¯)′⋅(xt−xt¯)⋅(xt−xt¯)′


       Correlation距离主要用来度量两个向量的线性相关程度。
  • 汉明距离Hamming distance('hamming')

    ds,t=(#(xsj≠xtj)n)ds,t=(#(xsj≠xtj)n)


       两个向量之间的汉明距离的定义为两个向量不同的变量个数所占变量总数的百分比。
     
  • 杰卡德距离Jaccard distance('jaccard')

    ds,t=(#[(xsj≠xtj)∩((xsj≠0)∪(xtj≠0))]#[(xsj≠0)∪(xtj≠0)])ds,t=(#[(xsj≠xtj)∩((xsj≠0)∪(xtj≠0))]#[(xsj≠0)∪(xtj≠0)])


       Jaccard距离常用来处理仅包含非对称的二元(0-1)属性的对象。很显然,Jaccard距离不关心0-0匹配,而Hamming距离关心0-0匹配。
     
  • Spearman distance('spearman')

    ds,t=1−(rs−rs¯¯¯¯)(rt−rt¯¯¯¯)′(rs−rs¯¯¯¯)(rs−rs¯¯¯¯)′−−−−−−−−−−−−−−−√(rt−rt¯¯¯¯)(rt−rt¯¯¯¯)′−−−−−−−−−−−−−−√ds,t=1−(rs−rs¯)(rt−rt¯)′(rs−rs¯)(rs−rs¯)′(rt−rt¯)(rt−rt¯)′


    where
    • rsj is the rank of xsj taken over x1jx2j, ...xmj, as computed by tiedrank

    • rs and rt are the coordinate-wise rank vectors of xs and xt, i.e., rs = (rs1rs2, ... rsn)

    • rs¯¯¯¯=1n∑jrsj=n+12rs¯=1n∑jrsj=n+12

    • rt¯¯¯¯=1n∑jrtj=n+12rt¯=1n∑jrtj=n+12

二、pdist2

Pairwise distance between two sets of observations

Syntax

D = pdist2(X,Y)
D = pdist2(X,Y,distance)
D = pdist2(X,Y,'minkowski',P)
D = pdist2(X,Y,'mahalanobis',C)
D = pdist2(X,Y,distance,'Smallest',K)
D = pdist2(X,Y,distance,'Largest',K)
[D,I] = pdist2(X,Y,distance,'Smallest',K)
[D,I] = pdist2(X,Y,distance,'Largest',K)

Description

这里 X 是 mx-by-n 维矩阵,Y 是 my-by-n 维矩阵,生成 mx-by-my 维距离矩阵 D。

[D,I] = pdist2(X,Y,distance,'Smallest',K)    生成 K-by-my 维矩阵 D 和同维矩阵 I,其中D的每列是原距离矩阵中最小的元素,按从小到大排列,I 中对应的列即为其索引号。注意,这里每列各自独立地取 K 个最小值。

   例如,令原mx-by-my 维距离矩阵为A,则 K-by-my 维矩阵 D 满足 D(:,j)=A(I(:,j),j).

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Matlab中 pdist 函数详解(各种距离的生成) 的相关文章

  • 分割车牌字符

    我在从车牌图像中分割字符时遇到问题 我应用了以下方法来提取车牌字符 车牌图像的自适应阈值 选择具有特定纵横比的轮廓 如果车牌图像中有任何阴影 如附件中所示 由于二值化不正确 我无法正确分割字符 图像中的阴影合并图像中的相邻字符 我已经对具有
  • MATLAB - 函数的多个返回值?

    我正在 matlab 中编写 2 个函数 一个初始化函数和一个将项目插入数组的函数 将其视为双向链表 但是 我的初始化函数仅返回 ans 和初始化的数组 我怎样才能让它也设置其他变量的值 这是我的代码 function array list
  • 隐藏图中某些图形对象的 MATLAB 图例条目

    MATLAB 图例列出了绘图中的所有内容 包括您在绘图上放置的指南 绕过这个问题的软糖就是要做的 Plot Add legend Add guidelines 然而 MATLAB 将最新的行放在前面 这意味着指南将位于显示的数据之上 丑陋且
  • 在python中访问包含matlab类的.mat文件

    我有一个从 matlab 2012b 生成的 mat 文件 它包含一个带有用户定义的 matlab 类的变量 在 python 3 3 中使用 scipy io loadmat 加载文件时 我得到以下信息 mat scipy io load
  • ND 输入的 im2col 算法

    我正在尝试为输入维度 gt 2D 编写自己的 im2col 算法 目前我正在研究 Matlab im2col 的实现 但是 我找不到任何有关二维以上输入的情况的文档 如果我将 3D 张量输入到函数中 我确实会得到输出 不过我不太明白你是如何
  • 如何在不使用 MATLAB 的情况下打开 .mat 文件?

    我在Matlab中做了一个项目 现在我已经卸载了Matlab 现在 我需要一些我的项目的参考 我留下了所有 mat 文件 我正在尝试在记事本中打开它们 并且我在那里得到了 unicode 字符 我的问题很简单 如何在记事本或某些文字处理器中
  • DYMOLA:opc 服务器如何使用 MATLAB 使用 dsin.txt 或 mat 文件进行初始化

    我在 DYMOLA 中创建了一个 OPC 服务器 现在我在 DYMOSIM 中有这个可以单击并初始化 使用 dsin txt 的 MAT 文件 现在我在 MATLAB 中创建了一个 GUI 文件 并获取变量的输入并创建了一个 mat 文件
  • SPMD 与 Parfor

    我对 matlab 中的并行计算很陌生 我有一个创建分类器 SVM 的函数 我想用几个数据集来测试它 我有一个 2 核工作站 所以我想并行运行测试 有人可以向我解释一下以下之间的区别 dataset array dataset1 datas
  • R和matlab中的qr函数

    我有一个关于将 matlab 函数转换为 R 的问题 我希望有人能提供帮助 matlab 和 R 中使用的标准 QR 分解称为 qr 据我了解 用两种语言执行 qr 分解的标准方法是 Matlab Q R qr A 满足QR A R z l
  • 如何从矩阵的每一行中减去一个向量? [复制]

    这个问题在这里已经有答案了 可能的重复 如何将矩阵的每一行除以固定行 https stackoverflow com questions 4723824 how can i divide each row of a matrix by a
  • 如何绘制 NxN 圆数组?

    我想绘制一个 NxN 的圆数组 为了形象化 我附上了我想要实现的目标的图像 我是 MatlLab 的新手 所以我尝试先绘制一个圆 下面是示例代码 n 2 10 size of mask M zeros n I 1 n x I n 2 mas
  • 在Matlab中使用中心切片定理实现滤波反投影算法

    我正在研究一种使用中心切片定理的滤波反投影算法作为家庭作业 虽然我理解纸上的理论 但在 Matlab 中实现它时遇到了问题 我得到了一个可以遵循的框架 但我认为我可能误解了一个步骤 这是我所拥有的 function img sampleFB
  • 如何在 R 中导入 matlab 表

    我有一个matlab mat文件与表数据类型我想将其导入 R 中 我为此使用 readMat R 正在将其作为列表读取 之后有没有办法将列表转换为 R 中的数据帧或表格格式 当我使用as dataframe我收到以下错误 Error in
  • 朴素分类器 matlab

    在 matlab 中测试朴素分类器时 即使我在相同的样本数据上进行训练和测试 我也会得到不同的结果 我想知道我的代码是否正确 是否有人可以帮助解释这是为什么 dimensionality reduction columns 6 U S V
  • 有没有办法在 Visual Studio 或 MATLAB 中“映射”程序执行顺序?

    我所说的 地图 是指我有一个 主 函数 它调用内部的许多其他程序 我希望能够看到哪个文件首先运行 第二个 第三个等等 基本上 我希望能够请参阅这个大型 OOP 设计程序 创建者没有为其制作 UML 类图 中的依赖项列表和顺序 以帮助破译代码
  • 如何在 MATLAB 中创建带有分级标记颜色的散点图?

    我想在 MATLAB 中绘制一个简单的散点图 标记颜色从光谱的一端到另一端各不相同 例如红色 橙色 黄色 蓝色 紫色 我的数据比较了一段时间内河流的水量和水质 3 个简单的列 时间 水量 质量 我想绘制数量与质量的 x y 散点图 但颜色随
  • 如何打开 matlab p 代码文件

    有谁知道如何查看 matlab p 代码文件的代码 p 代码文件专门存在 以便您可以共享代码 以便其他人无法查看它 换句话说 您看不到 Matlab p 代码文件的代码
  • MATLAB 中元胞数组的左连接

    I ve 2 cellMATLAB 中的数组 例如 A jim 4 paul 5 sean 5 rose 1 第二个 B jim paul george bill sean rose 我想做一个 SQL 左连接 这样我就可以得到 B 中的所
  • 如何在Matlab脚本中将泰勒级数系数存储到数组中

    这个问题是在 m 脚本的上下文中 我知道如何获取函数的泰勒级数 但我没有看到任何命令允许将级数的系数存储到数组中 sym2poly似乎不起作用 如何将系数存储到数组中 例如这个函数 syms x f 1 x 2 4 x 9 我们怎样才能得到
  • 是否有一个函数可以将两个元胞数组“压缩”在一起? [复制]

    这个问题在这里已经有答案了 假设我有一个元胞数组A and B as so A A B C D B 1 2 3 4 我想创建元胞数组C通过将 A 和 B 压缩 在一起 如下所示 C zip A B C A 1 B 2 C 3 D 4 这样的

随机推荐

  • Oracle环境变量配置

    情况描述 最近在配置plsql环境后 plsql总是连接不上 由于对自己的记忆力过度自信 导致这个简单的问题不能得到解决 现在记录下来作为以后的参考 一 客户端安装 官网下载orcle对应版本的客户端 然后执行安装 二 环境变量 需要配置以
  • Futter 屏幕适配框架flutter_ScreenUtil 用法

    参考 前言 各位同学大家好 大家在做app开发的时候都会遇到屏幕适配的问题 安卓里面有dp iOS里面有pt 单位给我们用来处理屏幕适配 除此之外安卓还有 autosize等框架给我们使用 iOS也对应屏幕适配方案给我们使用 那么在flut
  • 基于Python的接口自动化unittest测试框架和ddt数据驱动详解

    这篇文章主要介绍了基于Python的接口自动化unittest测试框架和ddt数据驱动详解 本文给大家介绍的非常详细 对大家的学习或工作具有一定的参考借鉴价值 需要的朋友可以参考下 目录 引言 一 unittest测试框架 二 ddt数据驱
  • 用QML实现简单音视频播放器的实践

    用QML的MediaPlayer控件配合VideoOutput对可以对音频文件和视频文件进行播放 代码如下 VideoOutput id video out anchors fill parent source mediaPlayer Me
  • 给定一个无序整数数组,找出两个数字满足他们的和等于目标数字

    给定一个整数数组numbers 从数组中找出两个数满足相加之和等于目标数target 假设每个输入只对应唯一的答案 而且不可以使用重复的元素 返回两数下标值 以数组的形式返回 原始暴力算法 这个好想 建立两个嵌套的for循环 从头到尾遍历数
  • 【JDK新特性】一篇搞懂Lambda表达式 & 函数式接口

    必看 原创声明 转载请注明作者 文章来源 给伙伴们聊一下刷题事项 Lambda表达式 概述 Lambda是JDK8的语法糖 它可以对某些匿名内部类的写法进行简化 它是函数式编程的一个重要体现 让我们不用关注什么是对象 重点关注我们对数据做了
  • 夯实基础-JavaScript异步编程

    异步编程 JavaScript中异步编程问题可以说是基础中的重点 也是比较难理解的地方 首先要弄懂的是什么叫异步 我们的代码在执行的时候是从上到下按顺序执行 一段代码执行了之后才会执行下一段代码 这种方式叫同步 synchronous 执行
  • redis 配置

    root localhost hufh cd usr local src root localhost src ls redis 4 0 10 tar gz root localhost src tar zxvf redis 4 0 10
  • Vue 模拟通讯录列表用 js-pinyin 获取汉字首字母,形成字母索引

    效果图 流程 获取数据 提取首个字的拼音的首个字母 排序并分组 此功能用到Vant组件的 IndexBar 索引栏 1 安装 js pinyin npm地址 npm install js pinyin save 2 引入及使用
  • WindowsAPI 程序

    include
  • GZIP .gz 文件解压与压缩工具类

    package com ucf gatewaycheck utils import java util zip GZIPInputStream import java io FileOutputStream import java io F
  • 怎么提取图片里的颜色?图像颜色特征提取

    图像的颜色一直是研究和关注的热点 也是特征工程不可或缺的feature 今天就简单介绍一种非常基础的颜色的rgb特征 目的 我们希望图片的rgb特征转化成一个可衡量的指标 例如人的身高 体重 这样的指标173cm 60kg 用于后续工作 那
  • 在中断程序中,需要清中断标志,作用是什么?

    清中断标志的作用 响应中断条件是 中断使能和中断标志同时成立 一般来讲 响应中断后 有硬件清标志和软件清标志两种 如果硬件不能清标志 说明书会说明 单片机要靠查询中断标志来判断是否要进入中断 如果你不清除中断标志 本次中断退出 单片机又会检
  • ChatGPT 再遭禁用

    近日 三星电子宣布禁止员工使用流行的生成式AI工具 原因在于4月初三星内部发生的三起涉及 ChatGPT 误用造成的数据泄露事件 报道称 三星半导体设备测量资料 产品良率等内容或已被存入ChatGPT学习资料库中 去年11月上线以来 Cha
  • GoFrame系列:6、Swagger使用总结

    GoFrame系列 6 Swagger使用总结 文章目录 GoFrame系列 6 Swagger使用总结 1 swagger简述 2 GF框架使用swagger流程 3 示例 3 1 GET示例 3 2 POST示例 3 3 其它 4 最后
  • 各算法/协议知识理论笔记(fpga)

    一 利用fifo对3行数据求和 需要2个fifo保存第0行和第1行的数据 如下图 比如有20行数据 则将一行一行的输给fifo2 fifo2出来的数据再给fifo1 当fifo和fifo1有数据时 在准备给 fifo2输入新的一行数据时 同
  • python数据分析案例2

    load datasets import pandas as pd df 08 pd read csv all alpha 08 csv df 18 pd read csv all alpha 18 csv view 2008 datase
  • HTTP数据包

    HTTP协议和WEB应用 Web应用通常是指基于http的应用程序 HTTP协议简介 HTTP协议是HyperTextTransferProtocol 超文本传输协议 的缩写是用于 从万维网服务器传输超文本到本地浏览器的传 送协议 HTTP
  • 《Unix/Linux网络日志分析与流量监控》获2015年度最受读者喜爱的IT图书奖

    Unix Linux网络日志分析与流量监控 获2015年度最受读者喜爱的IT图书奖 刊登在 中华读书报 2015年01月28日 19 版 我的2015年新作刊登在 中华读书报 2015年01月28日 19 版 原文下载 http epape
  • Matlab中 pdist 函数详解(各种距离的生成)

    一 pdist Pairwise distance between pairs of objects Syntax D pdist X D pdist X distance Description D pdist X 计算 X 中各对行向量