为什么 Python 和 CUDA 不支持半精度复杂浮点运算？

2024-02-12

NumPY 有复杂64 https://docs.scipy.org/doc/numpy/user/basics.types.html对应于两个float32。

但它也有 float16，但没有 complex32。

怎么会？我有涉及 FFT 的信号处理计算，我认为我可以使用complex32，但我不知道如何到达那里。我特别希望 NVidia GPU 能够加速cupy https://cupy.chainer.org/.

然而 float16 似乎是slower https://devtalk.nvidia.com/default/topic/974803/gpu-accelerated-libraries/half-precision-cufft-transforms/在 GPU 上而不是更快。

为什么半精度不受支持和/或被忽视？

同样相关的是为什么我们没有复整数 https://stackoverflow.com/questions/13863523/is-it-possible-to-create-a-numpy-ndarray-that-holds-complex-integers，因为这也可能会出现加速的机会 https://pdfs.semanticscholar.org/8347/9a33b8f1e1c86eb0e3731a1757cd20dd1381.pdf.

这个问题已经在 CuPy 存储库中提出了一段时间：

https://github.com/cupy/cupy/issues/3370 https://github.com/cupy/cupy/issues/3370

但目前还没有具体的工作计划；大多数事情仍然是探索性的。

锻炼起来并不简单的原因之一是没有numpy.complex32我们可以直接导入的数据类型（请注意，所有 CuPy 的数据类型只是 NumPy 的别名），因此当请求设备-主机传输时会出现问题。另一件事是，没有在 CPU 或 GPU 上编写的原生数学函数complex32，所以我们需要自己编写它们来进行转换、ufunc 等等。在链接的问题中，有一个 NumPy 讨论的链接，我的印象是目前尚未考虑它......

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

为什么 Python 和 CUDA 不支持半精度复杂浮点运算？的相关文章

由于“环境错误：[错误 13]：权限被拒绝：'usr/local/bin/f2py'”而无法安装软件包

我正在尝试在 macOS X 上安装 numpy 但执行命令后pip install numpy我收到错误环境错误错误13 权限被拒绝 usr local bin f2py 我如何解决它这对我有用 pip3 install user
有效地生成所有排列

我需要尽快生成所有排列 https en wikipedia org wiki Permutation整数的0 1 2 n 1并得到结果作为NumPy https numpy org 形状数组 factorial n n 或者迭代此类数组的
使用 numpy.argsort 的输出就地排序

我有两个数组 A 和 B 我想根据 A 对 A 和 B 进行排序所以我这样做 sort order numpy argsort A A A sort order B B sort order 问题是 A 和 B 都非常非常大因此上述情况
NumPy 和 SciPy - .todense() 和 .toarray() 之间的区别

我想知道使用是否有什么区别优点缺点 toarray vs todense 在稀疏 NumPy 数组上例如 import scipy as sp import numpy as np sparse m sp sparse bsr mat
在 HDF5 (PyTables) 中存储 numpy 稀疏矩阵

我在使用 PyTables 存储 numpy csr matrix 时遇到问题我收到此错误 TypeError objects of type csr matrix are not supported in this context so
ValueError：使用火炬张量时需要解压的值太多

对于神经网络项目我使用 Pytorch 并使用 EMNIST 数据集已经给出的代码加载到数据集中 train dataset dsets MNIST root data train True transform transforms T
3D 网格之间的豪斯多夫距离

我有多个网格 numpy 数组 Nk Ny Nx 并且想使用 Hausdorff 距离作为这些网格相似性的度量 scipy 中有几个模块 scipy spatial distance cdist scipy spatial distance
numpy：如何连接数组？（获得多个范围的并集）

我使用Pythonnumpy 我有一个 numpy 索引数组a gt gt gt a array 5 7 12 18 20 29 gt gt gt type a
numpy polyfit 中使用的权重值是多少以及拟合误差是多少

我正在尝试对 numpy 中的某些数据进行线性拟合 Ex 其中 w 是该值的样本数即对于点 x 0 y 0 我只有 1 个测量值该测量值是2 2 但对于这一点 1 1 我有 2 个测量值值为3 5 x np array 0 1 2 3
Numpy uint8_t 数组到 vtkImageData

我正在尝试拍摄一个或三个通道的 2D 图像并使用 VTK 中显示它们vtkImageActor 据我了解要显示的当前帧可以通过调用来更新SetImageData on vtkImageActor并提供一个实例vtkImageData 我已
Pandas hub_table 更快的替代品

我正在使用熊猫pivot table在大型数据集 1000 万行 6 列上运行由于执行时间至关重要因此我尝试加快流程目前处理整个数据集大约需要 8 秒这太慢了我希望找到替代方案来提高速度性能我当前的 Pandas 数据透视
来自 io.BytesIO 流的 numpy.load

我将 numpy 数组保存在 Azure Blob 存储中并将它们加载到如下所示的流中 stream io BytesIO store get blob to stream container cat npy stream 我知道从str
将二维数组放入 Pandas 系列中

我有一个 2D Numpy 数组我想将其放入 pandas 系列而不是 DataFrame 中 gt gt gt import pandas as pd gt gt gt import numpy as np gt gt gt a np
将 numpy 代码点数组与字符串相互转换

我有一个很长的 unicode 字符串 alphabet range 0x0FFF mystr join chr random choice alphabet for in range 100 mystr re sub W mystr 我想
计算互相关函数？

In R 我在用ccf or acf计算成对互相关函数以便我可以找出哪个移位给我带来最大值从它的外观来看 R给我一个标准化的值序列 Python 的 scipy 中是否有类似的东西或者我应该使用fft模块目前我正在这样做 xcor
独立滚动矩阵的行

我有一个矩阵准确地说是 2d numpy ndarray A np array 4 0 0 1 2 3 0 0 5 我想滚动每一行A根据另一个数组中的滚动值独立地 r np array 2 0 1 也就是说我想这样做 print np
从 NumPy ndarray 中选择行

我只想从 a 中选择某些行NumPy http en wikipedia org wiki NumPy基于第二列中的值的数组例如此测试数组的第二列包含从 1 到 10 的整数 gt gt gt test numpy array nump
格式化多维数组 Python

如何编写代码来更改多维数组中每个单独数组的值a出现负值后立即归零所以里面的第二个数组a有负值 12 34 5 6 88 10 30 75 10 会将其所有值及其后的值转为零将数组变成 12 34 5 6 88 0 0 0 我怎样才能获得
通过 cuFFT 进行逆 FFT 缩放

每当我使用 cuFFT 绘制程序获得的值并将结果与 Matlab 的结果进行比较时我都会得到相同形状的图形并且最大值和最小值位于相同的点然而 cuFFT 得到的值比 Matlab 得到的值大得多 Matlab代码是 fs 1000 s
使用 numpy 估计周期性的自相关

我有一大组时间序列 gt 500 我想只选择周期性的时间序列我做了一些文献研究发现我应该寻找自相关使用numpy我将自相关计算为 def autocorr x norm x np mean x result np correlate

随机推荐

绘制自定义组件

这是两个问题 1 是最重要的paint的成员Component使用代号为 1 的简单 2D 图形游戏的最佳方法是什么或者我什至不应该尝试它 2 为什么下面的代码会画出我的Component只是立即删除它我像这样初始化我的组件 prote
实体框架 ORA-00932：不一致的数据类型：“'预期 CLOB 为 CHAR”

Oracle ManagedDataAccess EntityFramework 6 122 1 0 库用于从 MVC ASP Net 应用程序访问 Oracle 数据库这是截至 2017 年 11 月 14 日来自 NuGet 的最新库
在C程序中，是否可以将所有全局变量重置为默认值？

我有一个旧版 C Linux 应用程序需要重用该应用程序使用了很多全局变量我想重用该应用程序的主要方法并在循环中调用它我发现当我在循环中调用 main 方法重命名为 callableMain 时应用程序行为不一致因为先前迭代中设
从 HTML 创建自动化、严格设计的多页 PDF 报告 [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案有哪些基于 Python 的优秀选项可以从 HTML 创建严格设计的 PDF 报告我附上了 PDF
将base64图像发布到android中的php服务器

我正在开发一个模块用户可以在其中将图像上传到服务器为此我必须将所选图像更改为 Base64 转换后我必须使用 Json POST 方法上传图像但每次应用程序崩溃并且 Logcat 都会出现此错误 Error converting
如何设置 ReSharper 默认公司和版权？

我刚刚安装了 Stylecop 4 5RC 和 ReSharper 当我创建一个新类时我发现我现在是合规的耶但我希望该公司是我的公司而不是 Microsoft 我还有太多事情要做不必担心更新版权文本默认情况下如何填写这些
Gradle 扩展：对于具有简单值的属性，可以使用普通 Kotlin 类型代替 Property 吗？

The Gradle 文档用于惰性配置 https docs gradle org current userguide lazy configuration html指出在扩展 DSL 类中诸如var someProperty defau
无法在android中连接websocket和wss

我正在尝试使用 org java websocket client WebSocketClient API 在 android 中连接安全 websocket 连接 wss 但无法与 https 连接然而它与 ws 这是我的代码 priv
如何旋转 pyplot.table 中的列标题？

我正在 matplotlib 中创建一个表但表头是长字符串表值是只有几位数字的数字这给我留下了两个不好的选择要么我的表格比必要的宽得多要么我的标题重叠为了解决这个问题我想旋转表格标题可能最多 90 度换句话说我想做thi
使用存储过程作为业务逻辑层

我工作的公司目前正在使用存储过程在 MsSQL 服务器后端作为其业务逻辑层实际的业务逻辑 DLL 仅调用 sProcs 并基本上管理 UI 事件数据绑定等我认为设置有问题尽管我不确定如何向同事解释顺便说一句该系统有效我工作
Laravel 8 错误类“App\User”未找到

我的 auth php 文件 providers gt users gt driver gt eloquent model gt App Models User class 用户控制器文件
使用 python 带有自签名证书的 ssl

我正在尝试使用我的自签名证书在 python 中构建一个简单的服务器我使用 makecert 创建了 cer pfx pvk 文件 context ssl create default context ssl Purpose CLIENT
C++ 中的彩色输出

有没有办法使用打印彩色输出iostream和Xcode 例如我希望能够打印Hello World with Hello red World蓝色和黄色的我怎样才能做到这一点您需要终端颜色代码对于 Linux 如下您的系统可能有所不
使用 iTextSharp 阅读 PDF 时出现奇怪的字符

我正在使用 iTextSharp 来阅读 PDF 文件我尝试使用以下简单的代码阅读第一页中的全文 var pdfReader new PdfReader
如何实现递归依赖于自身的反应式香蕉行为？

我有一个行为我想根据事件的发生和行为的当前值来更改其值在下面的示例中我有两个计数器它们根据布尔行为是 True 还是 False 进行更新事实上这段代码崩溃了 lt
什么是非法反射访问？

Java 9 中存在很多关于非法反射访问的问题我发现了很多关于解决错误消息的讨论但我很想知道非法反射访问实际上是什么所以我的问题是什么定义了非法反射访问以及什么情况会触发警告我认为它与 Java 9 中引入的封装原则有关但我找不
GCM PhoneGap 插件消息错误

我正在使用phonegap在android上实现GCM 在我向设备发送消息之前该过程运行良好当我的设备收到该消息时它会关闭并显示我的应用程序出现内部错误的消息该错误消息来自 dalvik VM 我仍在使用插件附带的演示应用程序进行
使用 Python 删除文件中的括号和文本

我有一个文本文件其中包含如下内容 Cl1 Cl 0 21988 6 0 2500 0 15016 5 0 01587 14 Uani 1 2 d S T P O1 O 1 05820 17 0 2500 0 48327 16 0 0206
C# [匿名\通用] 对象到 byte[] 没有 BinaryFormatter [在 .NET 4.5 中]？

BinaryFormatter效果很好但不存在于 NET 4 5 的可移植类库中我读到它是在 NET 4 6 Portable 中我还没有证实这一点因为当我在项目设置中更改为 4 6 时我收到警告消息 4 5 将自动成为目标除
为什么 Python 和 CUDA 不支持半精度复杂浮点运算？

NumPY 有复杂64 https docs scipy org doc numpy user basics types html对应于两个float32 但它也有 float16 但没有 complex32 怎么会我有涉及 FFT 的信

为什么 Python 和 CUDA 不支持半精度复杂浮点运算？

为什么 Python 和 CUDA 不支持半精度复杂浮点运算？ 的相关文章

随机推荐

热门标签

为什么 Python 和 CUDA 不支持半精度复杂浮点运算？的相关文章