计算两个点阵列之间的成对角度矩阵

2024-01-12

我有两个点向量，x and y，成形(n, p) and (m, p)分别。举个例子：

x = np.array([[ 0.     , -0.16341,  0.98656],
              [-0.05937, -0.25205,  0.96589],
              [ 0.05937, -0.25205,  0.96589],
              [-0.11608, -0.33488,  0.93508],
              [ 0.     , -0.33416,  0.94252]])
y = np.array([[ 0.     , -0.36836,  0.92968],
              [-0.12103, -0.54558,  0.82928],
              [ 0.12103, -0.54558,  0.82928]])

我想计算一个(n, m)- 大小的矩阵，包含两点之间的角度，a lathis https://stackoverflow.com/questions/2827393/angles-between-two-n-dimensional-vectors-in-python问题。即，矢量化版本：

theta = np.array(
            [ np.arccos(np.dot(i, j) / (la.norm(i) * la.norm(j)))
                 for i in x for j in y ]
        ).reshape((n, m))

Note: n and m每个的数量级可以约为 10000。

有多种方法可以做到这一点：

import numpy.linalg as la
from scipy.spatial import distance as dist

# Manually
def method0(x, y):
    dotprod_mat = np.dot(x,  y.T)
    costheta = dotprod_mat / la.norm(x, axis=1)[:, np.newaxis]
    costheta /= la.norm(y, axis=1)
    return np.arccos(costheta)

# Using einsum
def method1(x, y):
    dotprod_mat = np.einsum('ij,kj->ik', x, y)
    costheta = dotprod_mat / la.norm(x, axis=1)[:, np.newaxis]
    costheta /= la.norm(y, axis=1)
    return np.arccos(costheta)

# Using scipy.spatial.cdist (one-liner)
def method2(x, y):
    costheta = 1 - dist.cdist(x, y, 'cosine')
    return np.arccos(costheta)

# Realize that your arrays `x` and `y` are already normalized, meaning you can
# optimize method1 even more
def method3(x, y):
    costheta = np.einsum('ij,kj->ik', x, y) # Directly gives costheta, since
                                            # ||x|| = ||y|| = 1
    return np.arccos(costheta)

(n, m) = (1212, 252) 的计时结果：

>>> %timeit theta = method0(x, y)
100 loops, best of 3: 11.1 ms per loop
>>> %timeit theta = method1(x, y)
100 loops, best of 3: 10.8 ms per loop
>>> %timeit theta = method2(x, y)
100 loops, best of 3: 12.3 ms per loop
>>> %timeit theta = method3(x, y)
100 loops, best of 3: 9.42 ms per loop

时间差异随着元素数量的增加而减小。对于 (n, m) = (6252, 1212)：

>>> %timeit -n10 theta = method0(x, y)
10 loops, best of 3: 365 ms per loop
>>> %timeit -n10 theta = method1(x, y)
10 loops, best of 3: 358 ms per loop
>>> %timeit -n10 theta = method2(x, y)
10 loops, best of 3: 384 ms per loop
>>> %timeit -n10 theta = method3(x, y)
10 loops, best of 3: 314 ms per loop

但是，如果您省略np.arccos步骤，即假设您可以通过costheta，并且没有need theta本身，那么：

>>> %timeit costheta = np.einsum('ij,kj->ik', x, y)
10 loops, best of 3: 61.3 ms per loop
>>> %timeit costheta = 1 - dist.cdist(x, y, 'cosine')
10 loops, best of 3: 124 ms per loop
>>> %timeit costheta = dist.cdist(x, y, 'cosine')
10 loops, best of 3: 112 ms per loop

这是针对(6252, 1212)的情况。所以实际上np.arccos占用了80%的时间。在这种情况下我发现np.einsum is much比...快dist.cdist。所以你肯定想使用einsum.

Summary:结果theta大部分相似，但是np.einsum对我来说最快，特别是当你没有额外计算规范时。尽量避免计算theta并与刚刚合作costheta.

Note:我没有提到的重要一点是浮点精度的有限性可能会导致np.arccos给予nan价值观。method[0:3]为以下价值观而努力x and y当然，这还没有得到适当的标准化。但method3给了一些nans。我通过预归一化解决了这个问题，这自然会破坏使用中的任何收益method3，除非您需要对一小组预归一化矩阵进行多次计算（无论出于何种原因）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

计算两个点阵列之间的成对角度矩阵的相关文章

按 ListProperty (NDB) 对查询进行排序

如何按 ListProperty 对查询进行排序该模型 class Chapter ndb Model title ndb StringProperty required True version ndb IntegerProperty
使用 GeoDjango 在坐标系之间进行转换

我正在尝试将坐标信息添加到我的数据库中添加django contrib gis支持我的应用程序我正在写一个south数据迁移从数据库中获取地址并向 Google 询问坐标到目前为止我认为我最好的选择是使用geopy为了这接下来
如何编写高效的配对算法？

我需要一种算法的帮助该算法可以有效地将人们分组并确保以前的配对不会重复例如假设我们有 10 位候选人 candidates 0 1 2 3 4 5 6 7 8 9 并假设我们有一个先前匹配的字典这样每个键值对即candidate
Python 中的二进制相移键控

我目前正在编写一些代码以使用音频转换通过激光传输消息文件和其他数据我当前的代码使用 python 中 binascii 模块中的 hexlify 函数将数据转换为二进制然后为 1 发出一个音调为 0 发出不同的音调这在理论上是
代理阻止网络套接字？如何绕行

我有一个用 Python 编写的正在运行的 websocket 服务器来自https github com opiate SimpleWebSocketServer https github com opiate SimpleWebSoc
打印一个 Jupyter 单元中定义的所有变量

有没有一种更简单的方法来以漂亮的方式显示单个单元格中定义的所有变量的名称和值我现在做的方式是这样的但是当有30个或更多变量时我浪费了很多时间您可以使用whos http ipython readthedocs io en stable
python 语言环境奇怪的错误。这究竟是怎么回事？

所以今天我升级到了 bazaar 2 0 2 我开始收到这条消息顺便说一句我在雪豹上 bzr warning unknown locale UTF 8 Could not determine what text encoding to
PHP随机输出数组元素

我如何从大约 20 个元素的数组中随机回显 5 个元素 Thanks 这有效吗 values array rand input 5 或者作为更灵活的功能 function randomValues input num 5 return a
如何在Python中获取绝对文件路径

给定一条路径例如 mydir myfile txt 如何在Python中找到文件的绝对路径例如在 Windows 上我最终可能会得到 C example cwd mydir myfile txt gt gt gt import os
如何在Python中正确声明ctype结构+联合？

我正在制作一个二进制数据解析器虽然我可以依靠 C 但我想看看是否可以使用 Python 来完成该任务我对如何实现这一点有一些了解我当前的实现如下所示 from ctypes import class sHeader Structure
如何创建指向指针数组的 Python ctypes 指针

我需要学习如何处理char 在下面的 C 方法中通过 Python ctypes 我通过使用调用其他只需要单个指针的方法做得很好create string buffer 但此方法需要一个指向指针数组的指针 ladybugConvertToM
Scrapy - 不会爬行

我正在尝试运行递归爬行由于我编写的爬行不能正常工作因此我从网络上提取了一个示例并进行了尝试我真的不知道问题出在哪里但是爬行没有显示任何错误谁能帮我这个另外是否有任何逐步调试工具可以帮助理解蜘蛛的爬行流程非常感谢任何与此相关的
pandas apply：函数名是否带引号的区别

简单数据框定义示例 df pd DataFrame A 2 4 1 B 8 4 1 C 6 2 7 df A B C 0 2 8 6 1 4 4 2 2 1 1 7 尝试理解以下块中函数参数调用的差异 df apply sum df app
写入 UDP 套接字会被阻塞吗？

如果是的话在什么条件下或者换句话说在twisted 中运行此代码是否安全 class StatsdClient AbstractStatsdClient def init self host port super StatsdCli
如何使用 python-gnupg 加密大型数据集而不占用所有内存？

我的磁盘上有一个非常大的文本文件假设它是 1 GB 或更多还假设该文件中的数据有 n每 120 个字符一个字符我在用python gnupg https pythonhosted org python gnupg 对此文件进行加密由
通过套接字发送字符串（python）

我有两个脚本 Server py 和 Client py 我心中有两个目标能够从客户端一次又一次地向服务器发送数据能够将数据从服务器发送到客户端这是我的 Server py import socket serversocket soc
Synapse Notebook 参考 - 使用参数从另一个笔记本调用 Synapse Notebook

我有一个带有参数的突触笔记本我试图从另一个笔记本调用该笔记本我正在使用 run 命令我应该如何将参数从基本笔记本传递到正在调用的笔记本另外对我来说上述答案不起作用作为对此问题的单独解决方案下面是一个答案打开笔记本并转到最右
升级后 pip 损坏

我做了 pip install U easyinstall 然后 pip install U pip 来升级我的 pip 但是当我尝试使用 pip 时我现在收到此错误 root d8fb98fc3a66 which pip usr lo
Elastic Beanstalk 上的 Django + MySQL - 查询 MySQL 时出错

当我在 Elastic beanstalk 上托管的 Django 应用程序上查询 MySQL 时出现错误错误说 admin login 处出现操作错误 1045 用户 adminDB 172 30 23 5 的访问被拒绝使用密码 Y
提供节点名或服务名，或未知

我收到这个 Python 错误 File Library Frameworks Python framework Versions 2 7 lib python2 7 urllib2 py line 1184 in do open rais

随机推荐

逗号运算符什么时候有用？

I read this https stackoverflow com questions 3561043 javascript syntax what comma means关于表达式中逗号运算符的问题和MDN docs https
使用 lodash 在另一个数组内的数组中查找值

我有一个数组例如 var db words word1a word1b word1c answer answer1 words word2a words2b answer answer2 我在 node js 上使用 lodash 来检查
在谷歌云存储上上传图像时文件大小为零字节---nodejs？

这是我的代码 const fs require fs const uuidv4 require uuid v4 const Storage require google cloud storage const CLOUD BUCKET pr
SQL繁琐添加数组作为参数

我正在运行这个 SQL 查询tedious js使用参数 var query select from table name where id in ids request new sql Request query function err
Laravel Pluck 但结合名字+姓氏进行选择

在 Laravel Vue 项目中使用 select2 并需要返回以下格式的 JSON id 0 text enhancement id 1 text bug 在 Laravel 中我知道我可以使用 pluck 来创建列表数据例如对于客
Google 地图信息窗口关闭按钮被隐藏

我在我的网站中使用了带有多个标记和多个信息窗口的 Google 地图不知何故关闭按钮小x 隐藏在信息窗口内但如果在应显示的位置单击则可以使用如何解决这个问题修复了它显然 bootstrap css 与图像冲突必须使用这几行额
如何区分 Google Fit Api 中手动添加的步数和传感器记录的步数

我在我的项目中使用 Google Fit Api 来获取用户的每日步数但问题是用户可以通过添加活动来手动输入步骤当我检索每日步数时 Google Fit Api 还会返回手动添加的步数有什么方法可以区分手动添加的步骤和传感器记录的步
适用于 Linux 的 C++ 对象序列化

我正在编写一个需要通过网络发送和接收数据的程序我从来没有处理过对象序列化我读到了一些关于 Boost 和 Google Protocol Buffers 的建议在 Linux 中使用哪个最好如果您知道其他人我将感谢您的帮助 Tha
Redis、StackExchange、与 MGET 配合使用，一次获取多个密钥

有没有办法将 MGET 与 StackExchange Redis C 一起使用我需要一种方法可以在一次通话中重奏多个按键可以使用下一个方法 Task
是什么让Python中的东西变得可迭代

是什么让 Python 中的东西变得可迭代 IE 可以循环它for 我可以用Python创建一个可迭代的类吗如果是这样怎么办要使类可迭代请编写 iter 返回迭代器的方法 class MyList object def init s
CUDA - 如果我选择太多块怎么办？

我仍然对这些未知大小的矩阵感到生气每个维度可能在 10 20 000 之间变化我正在查看 CUDA sdk 并想知道如果我选择的块数量太高怎么办就像 X 和 Y 维度上 9999 x 9999 块的网格一样如果我的硬件具有无法容纳
git checkout my_branch 与 git checkout origin/my_branch

我当时在branch1当我结帐时branch2像这样两个分支都存在 git checkout origin branch2 然后我得到了一个分离头错误 You are in detached HEAD state You can look
根据给定的 OpenApi/Swagger 规范验证请求负载和响应

我们有一个 HTTP API 它是用Python 的拥抱框架 http www hug rest 但这并不是一成不变的将来可能会被其他东西取代在它旁边我们手动写了一个OpenApi Swagger 2 0 规范文件 https git
如何设置log4j属性文件？

我有一个使用 log4j 的 Eclipse Java 项目我无法将log4j配置文件设置为通过文件路径访问我必须在 jar 中导出并运行该项目这是我的尝试 public class Wita static Logger logger
ROR-使用回形针逐步生成多个图像

我已经使用了教程 here http sleekd com rails adding multiple images to a rails model with paperclip 但由于某种原因它不起作用任何人都可以给我一个使用其他表
如何每天自动从 git 存储库更新我的服务器文件

我是这些服务器相关工作的菜鸟我正在本地系统中编写一些 PHP 代码并定期更新 github 中的存储库每次我想测试我的应用程序时我都会通过 FTP 将本地系统中的所有文件复制到我的服务器上然后进行测试现在我想知道是否有一种方法可
服务和组件属性之间的 Angular2 数据绑定

我需要对服务和组件属性之间的绑定以及 Angular2 中的数据绑定进行一些澄清假设我有一个服务单例和一个组件 export class Service name Luke object id 1 getName return thi
使用python提取一个句子

如果该句子中存在特定单词我想提取确切的句子谁能告诉我如何用 python 做到这一点我使用了 concordance 但它只打印单词匹配的行快速提醒一下断句实际上是一件非常复杂的事情句号规则也有例外例如先生或博士还有各
AttributeError：“KMeans”对象没有属性“inertia_”

from sklearn cluster import KMeans import numpy import pandas as pd from pandas import read csv boston read csv desktop
计算两个点阵列之间的成对角度矩阵

我有两个点向量 x and y 成形 n p and m p 分别举个例子 x np array 0 0 16341 0 98656 0 05937 0 25205 0 96589 0 05937 0 25205 0 96589 0 11

计算两个点阵列之间的成对角度矩阵

计算两个点阵列之间的成对角度矩阵 的相关文章

随机推荐

热门标签

计算两个点阵列之间的成对角度矩阵的相关文章