性能：Matlab 与 Python

2024-06-23

我最近从Matlab to Python。在转换我的一个冗长代码时，我惊讶地发现Python非常慢。我分析并追踪了一个函数占用时间的问题。该函数是从我的代码中的各个位置调用的（作为递归调用的其他函数的一部分）。探查器建议300两个地方都调用了这个函数Matlab and Python.

简而言之，以下代码总结了当前的问题：

MATLAB

包含函数的类：

classdef ExampleKernel1 < handle  
methods (Static)
    function [kernel] = kernel_2D(M,x,N,y) 
        kernel  = zeros(M,N);
        for i= 1 : M
            for j= 1 : N
                % Define the custom kernel function here
                kernel(i , j) = sqrt((x(i , 1) - y(j , 1)) .^ 2 + ...
                                (x(i , 2) - y(j , 2)) .^2 );             
            end
        end
    end
end
end

以及调用 test.m 的脚本：

xVec=[   
49.7030   78.9590
42.6730   11.1390
23.2790   89.6720
75.6050   25.5890
81.5820   53.2920
44.9680    2.7770
38.7890   78.9050
39.1570   33.6790
33.2640   54.7200
4.8060   44.3660
49.7030   78.9590
42.6730   11.1390
23.2790   89.6720
75.6050   25.5890
81.5820   53.2920
44.9680    2.7770
38.7890   78.9050
39.1570   33.6790
33.2640   54.7200
4.8060   44.3660
];
N=size(xVec,1);
kex1=ExampleKernel1;
tic
for i=1:300
    K=kex1.kernel_2D(N,xVec,N,xVec);
end
toc

给出输出

clear all
>> test
Elapsed time is 0.022426 seconds.
>> test
Elapsed time is 0.009852 seconds.

PYTHON 3.4

包含函数 CustomKernels.py 的类：

from numpy import zeros
from math import sqrt
class CustomKernels:
"""Class for defining the custom kernel functions"""
    @staticmethod
    def exampleKernelA(M, x, N, y):
        """Example kernel function A"""
        kernel = zeros([M, N])
        for i in range(0, M):
            for j in range(0, N):
                # Define the custom kernel function here
                kernel[i, j] = sqrt((x[i, 0] - y[j, 0]) ** 2 + (x[i, 1] - y[j, 1]) ** 2)
        return kernel

以及调用 test.py 的脚本：

import numpy as np
from CustomKernels import CustomKernels
from time import perf_counter

xVec = np.array([
    [49.7030,  78.9590],
    [42.6730,  11.1390],
    [23.2790,  89.6720],
    [75.6050,  25.5890],
    [81.5820,  53.2920],
    [44.9680,   2.7770],
    [38.7890,  78.9050],
    [39.1570,  33.6790],
    [33.2640,  54.7200],
    [4.8060 ,  44.3660],
    [49.7030,  78.9590],
    [42.6730,  11.1390],
    [23.2790,  89.6720],
    [75.6050,  25.5890],
    [81.5820,  53.2920],
    [44.9680,   2.7770],
    [38.7890,  78.9050],
    [39.1570,  33.6790],
    [33.2640,  54.7200],
    [4.8060 ,  44.3660]
    ])
N = xVec.shape[0]
kex1 = CustomKernels.exampleKernelA
start=perf_counter()
for i in range(0,300):
    K = kex1(N, xVec, N, xVec)
print(' %f secs' %(perf_counter()-start))

给出输出

%run test.py
 0.940515 secs
%run test.py
 0.884418 secs
%run test.py
 0.940239 secs

RESULTS

比较结果似乎Matlab在“”之后大约快 42 倍clear all" 被调用，如果脚本多次运行而不调用 "，那么速度会快 100 倍clear all“。这至少是一个数量级，如果不是快两个数量级的话。这对我来说是一个非常令人惊讶的结果。我原以为结果会是相反的。

有人可以解释一下吗？

有人可以建议一种更快的方法来执行此操作吗？

边注

我也尝试过使用numpy.sqrt这使得性能更差，因此我正在使用math.sqrt in Python.

EDIT

The for调用函数的循环纯粹是虚构的。他们只是为了“simulate" 300调用该函数。正如我之前所描述的，内核函数（kernel_2D in Matlab and kex1 in Python）是从程序中的各个不同位置调用的。为了让问题变得更短，我“simulate" the 300调用使用for环形。这for由于核矩阵的结构，核函数内部的循环是必要且不可避免的。

EDIT 2

这是更大的问题：https://github.com/drfahdsiddiqui/bbfmm2d-python https://github.com/drfahdsiddiqui/bbfmm2d-python

你想摆脱那些for循环。尝试这个：

def exampleKernelA(M, x, N, y):
    """Example kernel function A"""
    i, j = np.indices((N, M))
    # Define the custom kernel function here
    kernel[i, j] = np.sqrt((x[i, 0] - y[j, 0]) ** 2 + (x[i, 1] - y[j, 1]) ** 2)
    return kernel

您还可以通过广播来完成此操作，这可能会更快，但不太直观MATLAB.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

性能：Matlab 与 Python 的相关文章

Ruby 相当于 Python 的多处理模块是什么？

为了在 Ruby 或 Python 中获得真正的并发性我需要创建新的进程 Python 使用以下命令使这变得非常简单multiprocessing模块它抽象了所有 fork wait 的好处让我专注于我的代码 Ruby 有类似的东西吗
在 PyCharm 中启用终端模拟

很多人告诉过我和PyCharm 2 7 的 PyCharm 发行说明 https www jetbrains com pycharm whatsnew whatsnew 27 html吹捧那个PyCharm包括完整的终端仿真我认为这是关于
从 java 代码运行 Python 脚本

这是我第一次在java中尝试python 我正在尝试从我的代码执行 python 脚本如下所示 Process process Runtime getRuntime exec python C Users username Desktop
获取父类名？ [复制]

这个问题在这里已经有答案了 class A object def get class self return self class class B A def init self A init self b B print b get cl
遍历后加快数组查找速度？

我有一个123MB大的int数组它基本上是这样使用的 private static int data new int 32487834 static int eval int c int p data c 0 p data p c 1 p
“内存泄漏”剖析

从 NET 角度来看什么是内存泄漏 https en wikipedia org wiki Memory leak 如何确定您的应用程序是否存在泄漏有什么影响如何防止内存泄漏如果您的应用程序存在内存泄漏当进程退出或被终止时它会消失
映射 2 个数据帧并替换目标数据帧中匹配值的标头

我有一个数据框 df1 SAP Name SAP Class SAP Sec Avi 5 C Rison 6 A Slesh 7 B San 8 C Sud 7 B df2 Name Fi Class Avi 5 Rison 6 Slesh
如何在 dash/plotly 中使用 iframe？（Python/HTML）

我正在创建一个仪表板我想使用这个交互式地图网站链接 https www ons gov uk peoplepopulationandcommunity healthandsocialcare causesofdeath articles
使用 pytherejs 嵌入小部件：错误的视角和相机观察

我在用pythreejs可视化一些 3D 模型在 Jupyter 笔记本上可视化模型时一切都按预期进行但是当尝试将小部件嵌入 HTML 文档时我面临两个问题看起来相机在加载时正在查看 0 0 0 而不是预期的那样一旦您与小部件交
os.walk 无需深入研究下面的目录

我该如何限制os walk只返回我提供的目录中的文件 def dir list self dir name whitelist outputList for root dirs files in os walk dir name for f
如何向 Jupyter (ipython) 笔记本自动添加扩展？

我已经安装了扩展 calico document tools 我可以使用以下命令从 Jupyter 笔记本中加载它 javascript IPython load extensions calico document tools 如何为每个
折叠 numpy 数组除前两个维度之外的所有维度

我有一个可变维度的 numpy 数组例如它可以具有以下形状 64 64 64 64 2 5 64 64 40 64 64 10 20 4 我想要做的是如果维数大于 3 我想将其他所有内容折叠堆叠到第三维中同时保留顺序因此在我上面
Python - 从一定范围内随机采样，同时避免某些值

我一直在阅读有关random sample 函数在random模块但没有看到任何可以解决我的问题的东西我知道使用random sample range 1 100 5 会给我来自人群的 5 个独特样本我想得到一个随机数range
从Python列表中挑选出具有特定索引的项目

我确信在 Python 中有一种很好的方法可以做到这一点但我对这门语言还很陌生所以如果这是一个简单的方法请原谅我我有一个列表我想从该列表中挑选某些值我想要挑选的值是列表中索引在另一个列表中指定的值例如 indexes 2 4
Spacy-nightly (spacy 2.0) 问题“thinc.extra.MaxViolation 大小错误”

显然成功安装了 spacy nightly spacy nightly 2 0 0a14 和英语模型 en core web sm 后我在尝试运行它时仍然收到错误消息 import spacy nlp spacy load en core
matplotlib 后端 - 我关心吗？

gt gt gt import matplotlib gt gt gt print matplotlib rcsetup all backends u GTK u GTKAgg u GTKCairo u MacOSX u Qt4Agg u
tkinter 库 treectrl 转换为 exe 安装程序时出现 cx_freeze 错误

我使用的是 python 版本 3 7 我使用了这个名为 treectrl 的外部库当我运行 py 文件时它工作得很好但是当我使用 cx freeze 转换为 exe 文件时它给了我错误 NomodulleFound 名为 tkint
Scala 不可变 Map 速度慢

当我创建地图时我有一段代码 val map gtfLineArr 8 split map split collect case Array k v gt k v toMap 然后我使用这张地图来创建我的对象 case class MyOb
Python - 将列表作为参数传递给 SQL，以及更多变量

我试图在 python 3 6 中将未知数量的参数传递给 SQL Server 这是我使用 pypyodbc 的代码 cursor cnxn cursor theargs 1033286869 1053474957 1063654630 1
合并共享属性的节点

EDITED 我真的需要 Networkx graph 专家的帮助假设我有以下数据框我想将这些数据框转换为图表然后我想根据描述和优先级属性将两个图映射到相应的节点 df1 From description To priority 10

随机推荐

Angularjs-ui bootstrap.tabs - 添加下一个选项卡按钮

我正在使用模式来显示一系列选项卡 div class modal fade hide modal creator div class modal header h3 Create New Gallery h3 div div class m
返回“IList”与“ICollection”与“Collection”

我对应该从公共 API 方法和属性返回哪种集合类型感到困惑我想到的收藏是IList ICollection and Collection 返回这些类型中的一种总是优于其他类型还是取决于具体情况 ICollection
Travis-CI：docker 镜像作为构建环境

In 特拉维斯西尔是否可以从 docker 容器内部运行构建过程 In 亚搏体育appGitLab持续集成 http docs gitlab com ce ci docker using docker images html这是默认设置
将更改存储在通过 getClass().getResourceAsStream 读取的 .properties 文件中

我正在编写一个从 properties 文件读取属性的 java Web 应用程序由于我不知道 properties 文件的绝对路径因为它取决于应用程序将来运行的环境所以我必须使用 getClass getResourceAsStre
Java 签名的小程序证书仅在 mac OSX10.7 (Lion) 上被吊销

我有一个签名的小程序可以在 Windows Mac security Loading certificates from Deployment session certificate store security Loaded certi
Jasmine/PhantomJs 规格运行程序

我无法使用 phantomJs 运行测试吞咽任务 var jasminePhantomJs require gulp jasmine2 phantomjs gulp task test function return gulp src S
从流中获取文本阅读器？

我正在尝试读取嵌入的文本文件System Reflection Assembly GetExecutingAssembly GetManifestResourceStream resource 但它给了我一个Stream 嵌入的资源是一个文
如何在 Bash 脚本中回答“是”

有一个快速的问题想象一下我有这样的代码 mkdir p INSTALLDIR sudo apt get install y git clojure leiningen git clone git github com maltoe sto
指令级并行性探索

我只是想知道是否有任何有用的工具可以让我在某些算法中利用指令级并行性更具体地说我有一个子集来自多媒体领域的算法我想知道利用 ILP 的最佳方法是什么在这个算法中所有这些算法都是用 C 语言实现的所以理想情况下我将这些算法作为
Scala 将字符串转换为映射

转换这个最快的方法是什么 a ab b cd c cd d de e ef f fg 进入 scala 中的可变映射我从 500MB 文件中读取了这个输入字符串这就是我关心速度的原因如果您的 JSON 像您的示例一样简单即一系列键
将参数传递给 Scala 对象

是否可以从外部对象初始化 Scala 对象我尝试初始化的 Scala 对象没有任何 Companion 类这是一个例子 object ObjectA val mongoDBConnectionURI This is the Val th
python 视频捕获循环

我编写了一个简单的脚本来连续从网络摄像头捕获快照我唯一的问题是视频捕获模块并不总是捕获图像这反过来又导致程序崩溃我认为我可以通过使用无限循环来解决这个问题但我不确定如何解决这是脚本 from VideoCapture import
文件转换任务无法转换压缩包上的 XML 配置

我正在开发发布管道它将对应用程序服务工作线程配置执行转换然后发布工作线程 Web 应用程序我的输入包是由 MsBuild 发布来自 ASP NET 构建管道生成的 zip 包 PackageTmp app data jobs tr
Rails - 查找或创建 - 有查找或构建吗？

我目前正在使用 XXX find or create by uuid XXXX 有没有办法进行查找或构建 Try XXX find or initialize by uuid XXXX
TypeScript 中的无渲染 Vue 组件

我有一个 JavaScript 中的无渲染组件我正在尝试将其转换为 TypeScript 我在声明时遇到错误render函数在一个Vue extend ed 组件 method ComponentOptions
在 Python 中删除 root 权限

我想让一个Python程序开始侦听端口80 但之后执行时无需root权限有没有办法放弃 root 或在没有 root 的情况下获取端口 80 如果没有 root 权限您将无法在端口 80 上打开服务器这是对操作系统级别的限制因此唯
如何在 C++ 中强制包含静态库中的静态对象 (MSVC 11)

我试图在 C 文件中初始化一个静态对象该文件试图在其构造函数中将类自动注册到工厂就像任何标准自动注册问题一样问题是它被编译为静态库并且在链接到可执行文件时被优化掉应该有一个非常简单的解决方案但令人惊讶的是看起来并不那么简单
如何在 Echo Alexa 卡片中显示超链接

如何在 Echo Alexa 卡中显示超链接即与 Echo 通话后在 Alexa 应用程序中显示的卡我知道它包含在 lambda 函数返回的响应中但找不到除https developer amazon com public solut
如何重置 table.DefaultView.RowFilter？

下面的代码工作正常并正确过滤行但是我如何将表恢复到原始状态 DataTable table this dataGridView1 DataSource as DataTable table DefaultView RowFilter co
性能：Matlab 与 Python

我最近从Matlab to Python 在转换我的一个冗长代码时我惊讶地发现Python非常慢我分析并追踪了一个函数占用时间的问题该函数是从我的代码中的各个位置调用的作为递归调用的其他函数的一部分探查器建议300两个地方都调用了

性能：Matlab 与 Python

性能：Matlab 与 Python 的相关文章

随机推荐

热门标签