numpy 中 Float16 比 Float32 和 Float64 慢得多[重复]

2024-04-27

我试图运行一个代码片段，看起来像，

import numpy as np
import time

def estimate_mutual_info(X, neurons, bins = 5):
    xy = np.histogram2d(X, neurons, bins)[0]
    x = np.histogram(X, bins)[0]
    y = np.histogram(neurons, bins)[0]
    ent_x = -1 * np.sum( x / np.sum(x) * np.log( x / np.sum(x)))
    ent_y = -1 * np.sum( y / np.sum(y) * np.log( y / np.sum(y)))
    ent_xy = -1 * np.sum( xy / np.sum(xy) * np.log( xy / np.sum(xy)))
    return (ent_x + ent_y - ent_xy)

tic = time.time()
X = np.random.rand(12000, 1200)
Y = np.random.rand(12000, 10)
for j in Y.T:
    mi = 0
    for i in range(X.shape[1]):
        mi += estimate_mutual_info(X.T[i], j, bins = 2)
    print(mi)
toc = time.time()
print(str(toc - tic)+" seconds")

为了提高速度，我使用了float16，希望看到一些改进，但是float16比float32 and float64.

X = np.random.rand(12000, 1200).astype('float16')
Y = np.random.rand(12000, 10).astype('float16')

将它们更改为float16结果执行时间为84.57 seconds，然而float64 and float32被执行为36.27 seconds and 33.25 seconds分别。我不确定是什么导致了这种糟糕的表现flaot16。我的处理器是64 bit, using python3.7 and numpy-1.16.2。我认为 64 位处理器不会对所有 16 位、32 位和 64 位处理器无动于衷。非常感谢任何纠正和见解。

最可能的解释是您的处理器本身不支持 FP16 算法，因此这一切都是通过软件完成的，当然速度要慢得多。

一般来说，消费类英特尔处理器不支持 FP16 操作。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

performance

NumPy

numpy 中 Float16 比 Float32 和 Float64 慢得多[重复] 的相关文章

绝对导入不起作用，但相对导入起作用

这是我的应用程序结构 foodo setup py foodo init py foodo py models py foodo foodo foodo py从导入类models py module from foodo models im
如何使用 python、openCV 计算图像中的行数

我想数纸张所以我正在考虑使用线条检测我尝试过一些方法例如Canny HoughLines and FLD 但我只得到处理过的照片我不知道如何计算有一些小线段就是我们想要的线我用过len lines or len contours
计算熊猫数据帧几个月的总和

我有一个 pandas 数据框如下所示 ID Year R1 R1 f KAR1 20201001 1 5 KAR1 20201101 2 6 KAR1 20201201 3 7 KAR1 20210101 4 8 KAR1 202102
Python函数组成

我尝试使用良好的语法来实现函数组合这就是我所得到的 from functools import partial class compfunc partial def lshift self y f lambda args kwargs s
Python 中 time.sleep 和多线程的问题

我对 python 中的 time sleep 函数有疑问我正在运行一个脚本需要等待另一个程序生成 txt 文件虽然这是一台非常旧的机器所以当我休眠 python 脚本时我遇到了其他程序不生成文件的问题除了使用 time sl
带有闭包的 JavaScript 性能

var name function n var digits one two three four return digits n var namenew function digits one two three four return
如何在 numpy 数组中查找并保存重复的行？

我有一个数组例如 Array 1 1 1 2 2 2 3 3 3 4 4 4 5 5 5 1 1 1 2 2 2 我想要输出以下内容的东西 Repeated 1 1 1 2 2 2 保留重复行的数量也可以例如 Repeated 1 1
Python sys.modules 包含尚未导入的模块

我试图了解加载的模块与导入的模块之间的区别如果有的话我正在使用 Python 2 7 3 并且只是从命令行运行 Python 如果我执行 import sys sys modules 我得到一个列表其中包括os 例如文档说sys m
获取 int() 参数必须是字符串或数字，而不是“Column”- Apache Spark

如果我使用以下代码我会收到此异常 int argument must be a string or a number not Column df df withColumn FY F when df ID substr 5 2 isin
Karasuba算法递归过多

我正在尝试用 c 实现 Karasuba 乘法算法但现在我只是想让它在 python 中工作这是我的代码 def mult x y b m if max x y lt b return x y bm pow b m x0 x bm x1
无法在我的程序中使用 matplotlib 函数

我正在 Windows 10 中运行 Anaconda 安装 conda 版本 4 3 8 这是我尝试在 python 命令行中运行的代码 import matplotlib pyplot as plt x 1 2 3 4 y 5 6 7
C# 中单个 & 符号的第二个含义是什么？

我在 C 中使用了单个与号来表示检查second条件语句即使第一个是false 但以下似乎是不同的意思 of 总而言之谁能解释一下如何i 1在下面的例子中有效吗 List
如何将 Pyspark Dataframe 标题设置到另一行？

我有一个如下所示的数据框 col1 col2 col3 id name val 1 a01 X 2 a02 Y 我需要从中创建一个新的数据框使用 row 1 作为新的列标题并忽略或删除 col1 col2 等行新表应如下所示 id na
如何在 Python 中跟踪日志文件？

我想在 Python 中提供 tail F 或类似内容的输出而无需阻塞或锁定我找到了一些非常旧的代码来做到这一点here http code activestate com recipes 436477 filetailpy 但我认为现
有没有办法拉伸整个显示图像以适应给定的分辨率？

我最近一直在使用pygame制作游戏遇到了一个小问题基本上我希望能够将屏幕上的整个图像我已经传输到它的所有内容拉伸到用户将窗口大小调整到的分辨率我在 pygame 和堆栈溢出的文档中搜索了很多但我似乎找不到答案这可能吗我的
避免“散点/点/蜂群”图中的数据点重叠

使用绘制点图时matplotlib 我想偏移重叠的数据点以使它们全部可见例如如果我有 CategoryA 0 0 3 0 5 CategoryB 5 10 5 5 10 我想要每一个CategoryA 0 数据点并排设置而不是彼此重叠
为什么我的 PyGame 应用程序根本不运行？

我有一个简单的 Pygame 程序 usr bin env python import pygame from pygame locals import pygame init win pygame display set mode 400
优化 CSS 交付 - Google 的建议

谷歌建议在 head 中使用非常重要的 CSS 内联并在内部使用其他 CSS
当训练和测试的特征数量不同时，如何处理生产环境中的One-Hot Encoding？

在做某些实验时我们通常在 70 上进行训练在 33 上进行测试但是当您的模型投入生产时会发生什么可能会发生以下情况训练集 Ser Type Of Car 1 Hatchback 2 Sedan 3 Coupe 4 SUV 经过
正则表达式 - 匹配不包含字符串的模式

我对正则表达式很陌生并且一直在寻找方法来做到这一点但没有成功给定一个字符串我想删除以 abc 开头以 abc 结尾且中间不包含 abc 的任何模式如果我做 abc abc abc 它将匹配以 b 开头以 abc 结尾并且中间包

随机推荐

以 null 为键的 HashMap

How HashMap内部区分null and 0作为关键按照这个post https stackoverflow com questions 17268212 hashcode for null key in hashmap的哈希码nu
是否可以从 io::stdin() 读取字符而不逐行缓存输入？

这个问题指的是稳定的Rust版本1 2 0 您可以通过使用单个字节数组并继续读取直到Result成为一个Err 然而这有一个问题因为如果您不以 ASCII 字符阅读就会出现这种情况如果您要遇到这个问题最好只分配一个String 并
为什么我无法导入“内置”pkg？

cat test go package main import builtin func main return go run test go can t find import builtin 我只是好奇因为该文件存在并且已正确打包但
加载 XCTest 时出错，未找到合适的图像。

我最近更新了 Xcode 并开始出现此错误 2014 11 03 15 03 54 222 App 13141 60b Error loading private var mobile Applications 677127BD 5230
如何在 VS 2008 Post-Build 事件中使用系统环境变量？

如何在项目构建后事件中使用系统环境变量而无需编写和执行外部批处理文件我认为这就像创建一个名为的新环境变量一样简单LHDLLDEPLOY并在我的构建后事件文本框中写入以下内容 copy TargetPath LHDLLDEPLOY Tar
如何在我的应用程序上为所有手机调用 Android 计算器

public static final String CALCULATOR PACKAGE com android calculator2 public static final String CALCULATOR CLASS com an
有没有办法使用 asp.net mvc 从 3 个图像 URL 中制作一张图像？

我想构建一个类似于 nametest 或 Meaww 的 facebook 应用程序并且几乎成功地让我的 API 调用 Facebook Graph API 并从 facebook 返回数据让我困惑的是上述 Web 应用程序的 UI 当
使用 Powershell 关闭 Excel 应用程序

我正在从 powershell 启动工作簿中的宏以自动化流程下面在 powershell 中打开 Excel 工作簿并运行宏而不可视化该过程问题是即使我没有看到宏运行从宏生成的新 excel 实例仍然打开 start Excel
如何求能被7整除的数字个数？

给定一个整数N 如何有效地找到范围内能被 7 整除的数字的个数其逆序也能被 7 整除 0 10 N 1 Example For N 2 回答 4 0 7 70 77 0到99之间所有能被7整除的数字它们的倒数也能被7整除我的方法简单
我可以在不安装 Python 的情况下为 RobotFramework 安装 Selenium2Library 吗？

如果我只有 Jython 我可以使用 Selenium2Library 吗也就是说我还没有安装Python 并且希望摆脱不需要它的麻烦我读过相互矛盾的信息但是 jybot 不能使用 selenium2library 我需要 pybo
在 jupyter 中找不到 Tensorboard 作为魔法函数

我想使用最新的tensorflow 2 0 0a0在jupyter中运行tensorboard 使用tensorboard版本1 13 1和python 3 6 using tensorboard logdir logs base dir
捕获 Exchange 命令行管理程序中的错误

我正在尝试编写一个创建 Exchange 邮箱的 powershell 脚本只要邮箱尚不存在这种方法就可以正常工作但是当我尝试捕获任何错误并将其报告回来时脚本就会运行就好像一切都很好一样我在现有用户上运行该脚本它显示了错误但
从 NetBeans 在 tomcat 上部署应用程序时出现 HTTP 错误 503？

我更新了NetBeans我的 MacBook 上从 7 3 升级到 7 4 更新之前一切正常但是安装之后NetBeans7 4 当我尝试在tomcat 它给了我以下错误 ant f Volumes DEVELOPMENT Projects
Clipboard.GetData() 在不应返回 null 时返回 null

我正在将 Excel 文档中的单元格复制到剪贴板以便它们可以作为图像插入到其他地方单元格可以很好地复制到剪贴板因为我可以在代码运行后手动粘贴图像但是我无法获取数据这是我的代码 tempWorkSheet Range tempWor
如何将“-ddump-minimal-imports”与堆栈一起使用

我是 stack 的忠实粉丝我已经从我的机器中完全删除了任何独立的 cabal 和 ghc 可执行文件让 stack 在它自己神秘的 stack 目录中安装它需要的任何东西但是看起来有些标志在堆栈下无法正常工作例如我想使用 dd
在 Pandas 中使用多重索引时显示所有索引值

我希望在查看我的 DataFrame 时我将看到 multiIndex 的所有值包括当后续行对于其中一个级别具有相同索引时这是一个例子 arrays 20 50 20 20 N A N A 10 30 tuples list zip
Excel VBA 中的 TypeName 返回什么？

我想检查一下数据类型 Cells 2 1 Value即这里有什么以下我尝试了名称整数长整型等但似乎不接受 If TypeName Cells r 1 Value WHAT GOES HERE Then MsgBox Yes El
多列条件计数 SQL

我正在尝试计算连续 4 个单独列中的不同条目然后对结果求和例如表头看起来类似于 ID Col1 Col2 Col3 Col4 每列保存 ID 可以有一个文本值 W X Y 或 Z 列可以有相同的值我想做的是找出一种方法来计算列中的
Java OS X Lion 关于菜单

我正在尝试覆盖 OS X Lion 上的 Java 应用程序或 Leopard 及以上版本中的任何内容中的关于菜单我怎么做到目前为止我读过的教程似乎不是最新的一些类不再在 Java Mac SDK 中其他类的事件也没有被触发
numpy 中 Float16 比 Float32 和 Float64 慢得多[重复]

这个问题在这里已经有答案了我试图运行一个代码片段看起来像 import numpy as np import time def estimate mutual info X neurons bins 5 xy np histogram2

numpy 中 Float16 比 Float32 和 Float64 慢得多[重复]

numpy 中 Float16 比 Float32 和 Float64 慢得多[重复] 的相关文章

随机推荐

热门标签