使用 python 求解 7000x7000 线性系统时的最佳性能方法

2023-12-21

我需要一种有效的方法来反转 python 中的 7000x7000 空气动力学影响系数（密集）矩阵。在使用 FORTRAN 例程之前，我已经开始使用 LAPACK 中的 LU 分解例程来处理问题，我已经看到它在其他相关应用程序中的使用非常有效。不过，我读到，NumPy 和 SciPy 线性系统求解器大多基于直接调用 C 中相同的 LAPACK/BLAS 函数，并且想知道切换到 FORTRAN 是否真的会将计算时间减少到足以证明放弃的水平一种更简单、更高级的语言。

如果有 Python 求解器可以保证该大小（1000 到 10000，平方）的矩阵具有相似的性能，那么它们是哪些？

我确实需要矩阵逆，所以切换到迭代 Ax=b 解决方案不是一个选择。

事实上，Numpy 和 Scipy 有效地调用 LAPACK 例程来执行numpy.linalg.inv https://docs.scipy.org/doc/numpy/reference/generated/numpy.linalg.inv.html and scipy.linalg.inv https://docs.scipy.org/doc/scipy/reference/generated/scipy.linalg.inv.html.

要逆一般矩阵，numpy.linalg.inv https://docs.scipy.org/doc/numpy/reference/generated/numpy.linalg.inv.html solves A.x=np.eye((n,n))。功能inv() https://github.com/numpy/numpy/blob/v1.17.0/numpy/linalg/linalg.py#L486-L552 calls ainv = _umath_linalg.inv(a, signature=signature, extobj=extobj), which calls https://github.com/numpy/numpy/blob/master/numpy/linalg/umath_linalg.c.src#L1693 call_@lapack_func@(&params); where params.B是单位矩阵并且@lapack_func@是其中之一sgesv, dgesv, cgesv, zgesv，它们是一般矩阵的线性求解器。

另一方面，scipy.linalg.inv calls https://github.com/scipy/scipy/blob/v1.4.1/scipy/linalg/basic.py#L911-L983 getri，定义为get_lapack_funcs(('getri'),(a1,))。它对应于DGETRI() http://www.netlib.org/lapack/explore-html/df/da4/dgetri_8f_source.htmllapack 函数，旨在使用 LU 分解计算矩阵的逆，计算公式为DGETRF(). 因此，如果您正在使用DGETRI()在 Fortran 中，利用scipy.linalg.inv()在 python 中可能会实现类似的性能和结果。

大多数 Lapack 函数可以使用以下方式调用scipy.linalg.lapack https://docs.scipy.org/doc/scipy/reference/linalg.lapack.html#module-scipy.linalg.lapack。这是一个使用的示例scipy.linalg.cython_lapack.dgetri()在 cython 模块中：如何为Python编译C扩展，其中C函数使用LAPACK库？ https://stackoverflow.com/questions/52106978/how-to-compile-c-extension-for-python-where-c-function-uses-lapack-library/52132359#52132359下面是一个示例代码，在 1000x1000 矩阵上比较 scipy.linalg.cython_lapack.dgetrf()+scipy.linalg.cython_lapack.dgetri() 、 numpy 和 scipy.linalg.inv() ：

import numpy as np
from scipy import linalg
import time

import myinverse
n=1000
A=np.random.rand(n,n)

start= time.time()
Am,info,string=myinverse.invert(A.copy())
end= time.time()
print 'DGETRF+DGETRI, ', end-start, ' seconds'
if info==0:
    print 'residual ',np.linalg.norm(A.dot(Am)-np.identity(n), np.inf)
else :
    print "inversion failed, info=",info, string

start= time.time()
Am=np.linalg.inv(A.copy())
end= time.time()
print 'np.linalg.inv ', end-start, ' seconds'
print 'residual ', np.linalg.norm(A.dot(Am)-np.identity(n), np.inf)

start= time.time()
Am=linalg.inv(A.copy())
end= time.time()
print 'scipy.linalg.inv ', end-start, ' seconds'
print 'residual ',np.linalg.norm(A.dot(Am)-np.identity(n), np.inf)

输出是：

DGETRF+DGETRI,  0.22541308403  seconds
residual  4.2155882951089296e-11
np.linalg.inv  0.29932808876  seconds
residual  4.371813154546711e-11
scipy.linalg.inv  0.298856973648  seconds
residual  9.110997546690758e-11

对于 2000x2000 矩阵：

DGETRF+DGETRI,  1.64830899239  seconds
residual  8.541625644634121e-10
np.linalg.inv  2.02795410156  seconds
residual  7.448244269611659e-10
scipy.linalg.inv  1.61937093735  seconds
residual  1.6453560233026243e-09

中提供了链接 DGETRF()+DGETRI() 的 Fortran 代码LAPACK 反演例程奇怪地混合了所有变量 https://stackoverflow.com/questions/26475987/lapack-inversion-routine-strangely-mixes-up-all-variables进行一些更改后，运行：

PROGRAM solvelinear
implicit none
REAL(8), dimension(1000,1000)     :: A,Ainv,M,LU
REAL(8),allocatable              :: work(:)
REAL(8)                          :: wwork
INTEGER                        :: info,lwork
INTEGER,dimension(1000)        :: ipiv
INTEGER                        :: i,j
real :: start, finish

        ! put code to test here


info=0
!work=0
ipiv=0

call RANDOM_NUMBER(A)

call cpu_time(start)
!-- LU factorisation
LU = A
CALL DGETRF(1000,1000,LU,1000,ipiv,info)

!-- Inversion of matrix A using the LU
Ainv=LU
lwork=-1
CALL DGETRI(1000,Ainv,1000,Ipiv,wwork,lwork,info)
lwork =INT( wwork+0.1)
allocate(work(lwork))
CALL DGETRI(1000,Ainv,1000,Ipiv,work,lwork,info)
deallocate(work)

call cpu_time(finish)
print '("Time = ",f6.3," seconds.")',finish-start

!-- computation of A^-1 * A to check the inverse
M = matmul(Ainv,A)

print*,"M = "
do i=1,3
  do j=1,3
    print*,M(i,j)
  enddo
end do

END PROGRAM solvelinear

一旦使用编译gfortran main2.f90 -o main2 -llapack -lblas -lm -Wall，1000x1000矩阵需要0.42s，2000x2000矩阵需要3s。

最后，如果 Fortran 代码和 python 代码不链接到相同的 Blas/Lapack 库，则可能会出现不同的性能。要调查此问题，请键入如下命令np.__config__.show()如图所示将 ATLAS/MKL 链接到已安装的 Numpy https://stackoverflow.com/questions/21671040/link-atlas-mkl-to-an-installed-numpy或报告中的命令如何在 NumPy 和 SciPy 中检查 BLAS/LAPACK 链接？ https://stackoverflow.com/questions/9000164/how-to-check-blas-lapack-linkage-in-numpy-and-scipy .

为了进一步利用分布式计算，petsc https://www.mcs.anl.gov/petsc/documentation/faq.html#invertmatrix不鼓励对完整矩阵求逆，因为很少需要这样做。书中还写道MatMatSolve(A,B,X), where B and X可以使用稠密矩阵来做到这一点。此外，这个函数是在python接口中提供的petsc4py https://www.mcs.anl.gov/petsc/petsc4py-current/docs/apiref/index.html作为方法matSolve(self, Mat B, Mat X)对于对象petsc4py.PETSc.Mat。不再维护的元素库 https://github.com/elemental/Elemental被列为实现密集矩阵的直接求解器。虽然 Elemental 库支持 python 接口，但它的分支 Hydrogen 不再支持它。尽管如此，Elemental 页面还是列出了一些与分布式密集线性代数相关的开源项目。ScaLapack 提供了例程PDGETRI()/PZGETRI() http://www.netlib.org/scalapack/explore-html/d3/df3/pdgetri_8f_source.html使用 LU 分解来反转分布式稠密矩阵。这可能会为更快的反转留下一些空间。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用 python 求解 7000x7000 线性系统时的最佳性能方法的相关文章

Python Popen 与 psexec 挂起 - 不良结果

我对 subprocess Popen 和我认为是管道的问题有疑问我有以下代码块从 cli 运行时 100 都不会出现问题 p subprocess Popen psexec serverName get cmd c ver echo
pydev 调试器：严重警告：此版本的 python 似乎编译不正确（内部生成的文件名不是绝对的）[重复]

这个问题在这里已经有答案了通过运行 from sklearn datasets import fetch california housing import pandas as pd pd set option precision 4 m
在 Tensorflow tf.nn.nce_loss 中出现 TypeError：'Mul' Op 的输入 'y' 的类型为 float32，与参数 'x' 的 int32 类型不匹配

我正在研究 Tensor Flow 中的 Bag of Words 实现并得到了类型错误 Mul Op 的输入 y 的类型为 float32 与参数 x 的 int32 类型不匹配在 tf nn nce loss 中我尝试查看 tf
Python逻辑运算符优先级[重复]

这个问题在这里已经有答案了哪个运算符优先4 gt 5 or 3 lt 4 and 9 gt 8 这会被评估为真还是假我知道该声明3 gt 4 or 2 lt 3 and 9 gt 10 显然应该评估为 false 但我不太确定 pyth
如何使用 Plotly 中的直方图将所有离群值分入一个分箱？

所以问题是我可以在 Plotly 中绘制直方图其中所有大于某个阈值的值都将被分组到一个箱中吗所需的输出但使用标准情节Histogram类我只能得到这个输出 import pandas as pd from plotly import
如何使用 imaplib 获取“消息 ID”

我尝试获取一个在操作期间不会更改的唯一 ID 我觉得UID不好所以我认为 Message ID 是正确的但我不知道如何获取它我只知道 imap fetch uid XXXX 有人有解决方案吗来自 IMAP 文档本身 IMAP4消息号
在 Python distutils 中从 setup.py 查找脚本目录的正确方法？

我正在分发一个具有以下结构的包 mymodule mymodule init py mymodule code py scripts script1 py scripts script2 py The mymodule的子目录mymodul
Django 模型在模板中不可迭代

我试图迭代模型以获取列表中的第一个图像但它给了我错误即模型不可迭代以下是我的模型和模板的代码我只需要获取与单个产品相关的列表中的第一个图像模型 py class Product models Model title models
从零开始的 numpy 形状意味着什么

好的我发现数组的形状中可以包含 0 对于将 0 作为唯一维度的情况这对我来说是有意义的它是一个空数组 np zeros 0 但如果你有这样的情况 np zeros 0 100 让我很困惑为什么这么定义呢据我所知这只是表达空数组的
更改 `base_compiledir` 以将编译后的文件保存在另一个目录中

theano base compiledir指编译后的文件存放的目录有没有办法可以永久设置theano base compiledir到不同的位置也许通过修改一些内部 Theano 文件的内容 http deeplearning net
对图像块进行多重处理

我有一个函数必须循环遍历图像的各个像素并计算一些几何形状此函数需要很长时间才能运行在 24 兆像素图像上大约需要 5 小时但似乎应该很容易在多个内核上并行运行然而我一生都找不到一个有据可查解释充分的例子来使用 Multiproc
Numpy 过滤器平滑零区域

我有一个 0 及更大整数的 2D numpy 数组其中值代表区域标签例如 array 9 9 9 0 0 0 0 1 1 1 9 9 9 9 0 7 1 1 1 1 9 9 9 9 0 2 2 1 1 1 9 9 9 8 0 2 2 1
奇怪的 MySQL Python mod_wsgi 无法连接到 'localhost' (49) 上的 MySQL 服务器问题

StackOverflow上也有类似的问题但我还没有发现完全相同的情况这是在使用 MySQL 的 OS X Leopard 机器上一些起始信息 MySQL Server version 5 1 30 Apache 2 2 13 Uni
按元组分隔符拆分列表

我有清单 print L I WW am XX newbie YY ZZ You WW are XX cool YY ZZ 我想用分隔符将列表拆分为子列表 ZZ print new L I WW am XX newbie YY ZZ You
将 matplotlib 颜色图集中在特定值上

我正在使用 matplotlib 颜色图 seismic 绘制绘图并且希望白色以 0 为中心当我在不进行任何更改的情况下运行脚本时白色从 0 下降到 10 我尝试设置 vmin 50 vmax 50 但在这种情况下我完全失去了白色关
将 2D NumPy 数组按元素相乘并求和

我想知道是否有一种更快的方法专用 NumPy 函数来执行 2D NumPy 数组的元素乘法然后对所有元素求和我目前使用np sum np multiply A B 其中 A B 是相同维度的 NumPy 数组m x n 您可以使用np
如何在 python 中没有 csv.reader 迭代器的情况下解析单行 csv 字符串？

我有一个 CSV 文件需要重新排列和重新编码我想跑 line line decode windows 1250 encode utf 8 在由 CSV 读取器解析和分割之前的每一行或者我想自己迭代行运行重新编码并仅使用单行解析表单
mac osx 10.8 上的初学者 python

我正在学习编程并且一直在使用 Ruby 和 ROR 但我觉得我更喜欢 Python 语言来学习编程虽然我看到了 Ruby 和 Rails 的优点但我觉得我需要一种更容易学习编程概念的语言因此是 Python 但是我似乎找不到适用于
默认情况下，Keras 自定义层参数是不可训练的吗？

我在 Keras 中构建了一个简单的自定义层并惊讶地发现参数默认情况下未设置为可训练我可以通过显式设置可训练属性来使其工作我无法通过查看文档或代码来解释为什么会这样这是应该的样子还是我做错了什么导致默认情况下参数不可训练代码 im
如何为每个屏幕添加自己的 .py 和 .kv 文件？

我想为每个屏幕都有一个单独的 py 和 kv 文件应通过 main py main kv 中的 ScreenManager 选择屏幕设计应从文件 screen X kv 加载类等应从文件 screen X py 加载 Screens

随机推荐

Excel Range 奇怪行为的 SpecialCells 方法

我编写了一个宏使用 Excel 范围对象的 SpecialCells 方法从某个范围中查找空白单元格当我尝试执行以下代码时出现未找到单元格的异常 Sub test Debug Print Sheet1 Range A1 D4 Sp
无法找到组合@Published - Xcode11 Beta 5(11M382q)

我正在尝试使用以下内容运行一个简单的项目 Published var currentPlacemark CLPlacemark nil XCode 11 Beta 5 11M382q iOS13 17A5556d 出现以下错误 dyld S
azure辅助角色中的异步/等待导致角色回收

我正在我的 WorkerRole RoleEntryPoint 中使用任务异步和等待我有一些无法解释的回收现在我发现如果等待调用中的某些内容运行时间过长则角色会回收要重现它只需在 Run 方法中执行 await Task De
Jquery UI 可调整大小 - 调整放置在 iframe 上的 div 的大小

如果你查看这个 jsbin http jsbin com efosed 5 edit http jsbin com efosed 5 edit然后你按 Run with JS 就会出现一个可以用 jquery ui 调整大小的 div 一切
Azure Functions 部署时无法运行

我是新来的如果帖子不完整抱歉我正在尝试在 azure 上部署一个与 blob 交互的 python 脚本该脚本在本地运行良好我可以与我的存储帐户交互上传和下载 blob 但是当我在 azure 上部署我的函数时它不会运行日志
bash 使用序列号批量重命名文件夹和子文件夹中的文件

我需要一个 bash 脚本来执行以下操作对于文件夹及其子文件夹中存在的特定类型的每个文件它都会在前面添加一个序列号 4 位数字后跟一个分隔符例如我有 Queen 1986 A Kind of Magic 01 One vision
流程图 - 动态更改 y 轴

我是飞行新手但很快就设置了我的时间图这是我基于时间的情节 plot placeholder d xaxis mode time minTickSize 1 month min new Date 2008 05 20 getTime ma
为什么我需要将“get”包装在 J“lapply”调用中的虚拟函数中？

我希望通过类或常见模式匹配等标准来处理列grep 我的第一次尝试没有成功 require data table test table lt data table a 1 10 ab 1 10 b 101 110 this does not
在 Netbeans 内运行时停止 Tomcat

我使用 NetBeans 运行 Apache Tomcat 6 当我的代码出现故障例如 NullPointerException 时 tomcat 会失败并且不会运行任何其他请求我的问题是我无法让 tomcat 停止我必须重新启动整个
查找 Java 应用程序中的连接泄漏

我有一个应用程序在一段时间后开始出现内部服务器错误我询问的一些人告诉我这可能是因为我的应用程序中的连接泄漏我开始搜索并发现这个查询来模拟连接泄漏 select LAST CALL ET SQL TEXT username machin
堆积条形图未正确更新 d3js

In this https plnkr co edit X7JYRLCKgBnasP86FRgQ p preview堆积条形图我添加了一个平分线和一个自定义x invert函数以便您可以读取每个月的值问题是当我添加此自定义函数时团队
OpenXML SDK 2.0 与 Aspose 在 .NET 中生成服务器端 Word 2007 文档

我将在 Net 中启动一个服务器端办公自动化项目以下是计划的主要活动创建一个word文档使用现有的包含封面页眉页脚目录的 Word 文档模板保存存档嵌入文件并调整大小 HTML 图像 Word Excel TOC 生成和格式
我无法从数据库 PostgreSQL 生成 Hibernate 映射文件和 POJO？

已经在数据库 PostgreSQL 中创建了表和关系但是当我想生成 Hibernate 映射文件和 POJO 时它们没有生成我应用了所有适当的步骤hibernate cfg xml一代和hibernate reveng xml 我认为
如何在没有数据库的情况下配置 Ruby on Rails？

对于当前不需要数据库的小型网站项目来说使用 Ruby on Rails 会很方便我知道我可以在 MySQL 中创建一个空数据库并从那里开始但是有人知道在没有数据库的情况下运行 Rails 的更好方法吗 Thanks For Rails
对于矩阵向量乘法，行优先排序是否更有效？

If M是一个 n x m 矩阵并且v and u是向量那么就索引而言矩阵向量乘法看起来像u i sum M i j v j 1 lt j lt m Since v是一个向量对于面向数值计算的语言其元素可能存储在连续的内存位置中如
python 在pdf文件中搜索

这是pdf结构的一部分 5 0 obj lt lt Length 56 gt gt stream BT F1 12 Tf 100 700 Td 15 TL JavaScript example Tj ET endstream endobj
matplotlib中如何限制y轴高度？

如何限制matplotlib图中y轴的高度我正在尝试显示 x 轴并降低该一维图的图形高度我尝试过设置刻度图形大小 tight layout 边距等但没有成功另外无论我选择什么限制更改 ylimit 都会跨越整个图形高度 im
Maven 故障安全插件不运行并行测试

我有一个 Maven POM 文件当我提供并行执行选项时我在日志中没有看到任何并行执行的迹象 XML 调试让我抓狂有什么想法这里出了什么问题吗
查找两条曲线之间的重叠面积

我一直在努力寻找解决方案来找到两条曲线之间的重叠区域我处理的不是具有已知参数的概率密度函数而是通过平滑经验数据点获得的曲线我发现的唯一提示是计算不重叠的区域如这段代码来自here https www researchgate ne
使用 python 求解 7000x7000 线性系统时的最佳性能方法

我需要一种有效的方法来反转 python 中的 7000x7000 空气动力学影响系数密集矩阵在使用 FORTRAN 例程之前我已经开始使用 LAPACK 中的 LU 分解例程来处理问题我已经看到它在其他相关应用程序中的使用非常有

使用 python 求解 7000x7000 线性系统时的最佳性能方法

使用 python 求解 7000x7000 线性系统时的最佳性能方法 的相关文章

随机推荐

热门标签

使用 python 求解 7000x7000 线性系统时的最佳性能方法的相关文章