TensorFlow Lite 量化无法改善推理延迟

2024-04-20

TensorFlow 网站声称量化可将移动设备上的延迟降低多达 3 倍：https://www.tensorflow.org/lite/performance/post_training_quantization https://www.tensorflow.org/lite/performance/post_training_quantization

我试图验证这一说法，发现量化模型比 Float 模型慢 45%-75%，尽管其尺寸小了近 4 倍。不用说，这非常令人失望，并且与谷歌的说法相冲突。

我的测试使用Google官方的MnasNet模型：https://storage.googleapis.com/mnasnet/checkpoints/mnasnet-a1.tar.gz https://storage.googleapis.com/mnasnet/checkpoints/mnasnet-a1.tar.gz

以下是基于新重启手机上 100 次推理操作的平均延迟：

像素 2：浮动 = 81 毫秒，定量 = 118 毫秒
Moto E：浮动=337ms，定量=590ms
LG宝：浮动=547ms，定量=917ms

我的测试应用程序仅测量一种方法（tfLite.runForMultipleInputsOutputs）的时间。结果非常一致（多次执行的误差在 1% 以内）。

我希望看到 Tensorflow 团队或任何可以分享其指标的人的一些评论。上述数字基于图像分类器模型。我还测试了 SSD MobileNetV2 对象检测器，结果类似（量化模型速度要慢得多）。

None

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

TensorFlowLite

quantization

TensorFlow Lite 量化无法改善推理延迟的相关文章

Tensorflow Inception 多 GPU 训练损失未求和？

我正在尝试检查多个 GPU 在一台机器上的 Tensorflow 初始代码我很困惑因为据我所知我们从不同的塔又名 GPU 中得到了多次损失但是loss评估的变量似乎只是最后一个塔的变量而不是所有塔的损失之和 for step
使用 Tensorflow 查找 2D 张量中的唯一值

tf unique 目前仅适用于一维张量如何在二维张量中找到唯一值 ip tf constant 1 2 1 3 4 1 5 6 1 1 2 1 op should be 1 2 1 3 4 1 5 6 1 2022年4月答复从 2 2
AMD plaidml 与 CPU Tensorflow - 意外结果

我目前正在运行一个简单的脚本来训练mnist数据集通过 Tensorflow 通过我的 CPU 运行训练给了我49us sample和使用以下代码的 3e 纪元 CPU import tensorflow as tf mnist tf k
tf.print 什么时候才能真正按预期工作（即打印张量和变量的值）？

首先我使用的是TensorFlow 2 0 我只关心这个版本或更高版本而且我已经太关心这样一个只会产生头痛的软件了 The TensorFlow 文档 https www tensorflow org api docs python t
如何将急切执行中的模型转换为静态图并保存在 .pb 文件中？

想象一下我有模型 tf keras Model class ContextExtractor tf keras Model def init self super init self model self get model def cal
如何在 Tensorflow 中计算 R^2

我正在尝试在 Tensorflow 中进行回归我不确定我计算 R 2 是否正确因为 Tensorflow 给出的答案与sklearn metrics r2 score有人可以看看我下面的代码让我知道我是否正确地实现了图中的方程谢谢
了解 Tensorflow 中的 while 循环

我正在使用用于 Tensorflow 的 Python API https www tensorflow org api docs python 我正在努力实施罗森布罗克函数 https www sfu ca ssurjano rosen
张量流中是否存在无操作（传递）操作？

正如标题所示我想利用这样的操作来重命名节点并更好地组织图表或者是否有其他推荐的做法来重命名图中的现有节点谢谢有tf no op https www tensorflow org api docs python tf no op它允许
您必须为 MNIST 数据集的占位符张量“Placeholder”提供一个值，dtype float 和 shape [?,784]

这是我在 MNIST 数据集上测试量化的示例我正在使用以下代码测试我的模型 import tensorflow as tf from tensorflow examples tutorials mnist import input dat
Windows 10 上的 Tensorflow 安装问题

我正在尝试在 Win 10 计算机上安装 Tensorflow 我成功安装了Python 3 7 然后尝试按照tensorflow org上的安装说明进行操作执行时 pip install tensorflow 我收到以下错误消息错误
Tensorflow lite 目标检测示例中相机的屏幕尺寸 [水平屏幕]

在tensorflow lite示例对象检测中相机不会拍摄整个屏幕而只会拍摄一部分我试图在 CameraActivity CameraConnectionFragment 和 Size 类中找到一些常量但没有结果所以我只是想要一种
是否有可能在每个训练步骤中获得目标函数值？

在通常的 TensorFlow 训练循环中例如 train op tf train AdamOptimizer minimize cross entropy with tf Session as sess for i in range n
TensorFlow 未编译为使用 SSE（等）指令，但这些指令是可用的

我第一次使用一些示例代码运行 TensorFlow 运行代码时我收到以下警告有谁知道为什么会发生这种情况以及如何解决它 2017 03 31 02 12 59 346109 W c tf jenkins home workspace re
从tensorflow 2.0 beta中的tf.data.Dataset检索下一个元素

在tensorflow 2 0 beta之前要从tf data Dataset中检索第一个元素我们可以使用迭代器如下所示 usr bin python import tensorflow as tf train dataset tf
使用基于 ConvLSTM2D 的 Keras 模型从较低分辨率图像估计高分辨率图像

我正在尝试使用以下内容ConvLSTM2D从低分辨率图像序列估计高分辨率图像序列的架构 import numpy as np scipy ndimage matplotlib pyplot as plt from keras models
Keras 中的 Tensorflow 自定义损失函数 - 张量循环

我正在尝试在 Keras 中编写自定义损失函数如下所示 Keras 中的自定义损失函数 https stackoverflow com questions 43818584 custom loss function in keras 我的
Tensorflow无法分配设备进行操作

我正在尝试跑步NVidia 脸部生成器演示 https github com tkarras progressive growing of gans在我的电脑上我使用的是 Windows 10 我已经下载了源代码并尝试按照页面下方的步骤
对图像使用 Pixellib 自定义训练时出现 input_image 元形状错误

我正在使用 Pixellib 来训练自定义图像实例分割我创建了一个数据集可以在下面的链接中看到数据集 https drive google com drive folders 1MjpDNZtzGRNxEtCDcTmrjUuB1ics
如何将one-hot向量转换为多标签？

我有一项多分类任务并且我得到了像这样的单热类型预测 0 1 1 0 1 0 1 0 1 我希望将这个单热向量转换为标签例如 1 2 1 0 2 我已经尝试过 tf argmax 但它不起作用那么我该如何处理呢使用列表理解 oheLi
LSTM 批次与时间步

我按照 TensorFlow RNN 教程创建了 LSTM 模型然而在这个过程中我对批次和时间步长之间的差异如果有的话感到困惑并且我希望得到帮助来澄清这个问题教程代码见下文本质上是根据指定数量的步骤创建批次 wi

随机推荐

将csv文件读取到“DataFrame”时如何指定索引的“dtype”？

在 python 3 4 3 和 Pandas 0 16 中如何指定dtype索引为str 以下代码是我尝试过的 In 1 from io import StringIO In 2 import pandas as pd In 3 imp
设置 ItemIsMovable 标志时，子项在 QGraphicsView 中不可移动

要调整项目中的项目QGraphicsView http qt project org doc qt 5 0 qtwidgets qgraphicsview html 我将表示顶点的子项放到要移动的项上使用构造函数中建立的父子关系就是下图
Ant JUnit ClassNotFoundException

我意识到有很多类似的问题this one https stackoverflow com questions 10658636 new to ant classnotfoundexception with junit 但是在阅读了其中的大多
键盘覆盖了 webapp 中的文本输入（iOS）

我正在开发一个网络应用程序屏幕下半部分有两个输入字段父视图绝对定位于屏幕通常人们会假设单击输入字段时焦点会强制输入进入键盘上方的视图但是键盘覆盖了输入字段如果我开始打字则该字段中不会输入任何内容为了在字段中输入内容我必
匿名子类化 TimerTask 的正确方法是在 run 方法中保留对“this”的引用

我子类化了TimerTask使用匿名具体类这样 public void setTimedTask Note this implements an interface called UpdateIndicatorsReceiver fi
localStorage，使用toggleClass保存类

我似乎对本地存储一无所知我想通过切换类来设置一种最喜欢一组 div 中的任何 div 的方式我可以让toggleClass在单个div上工作并保存但localStorage将所有div保存为收藏夹而不仅仅是设置了toggleClas
选择子子项中的最新记录

我有以下表格列 Parent ParentID Child ChildID ParentID SubChild SubChildID ChildID Date Parent与具有一对多关系Child Child与具有一对多关系SubC
在 ReactJS 环境中设置复选框样式

我正在尝试设计一个复选框的样式ReactJSIE11 的环境但似乎没有取得太大成功有人可以建议吗代码如下 CSS squared input type checkbox border radius 4px background ff0
当鼠标位于 Qt 窗口的自定义小部件上时，如何移动整个窗口？

假设我有一个自定义小部件并将其添加到 qt 的主窗口中如您所见红色区域是自定义小部件我想要做的是当鼠标在红色区域按下并移动时整个窗口也会移动我知道如何简单地实施mousePressEvent and mouseMoveEvent
python SMTP 未收到邮件

你好我正在尝试让 python 3 从 Ubuntu 发送一封简单的电子邮件我启动了一个简单的 smtp 服务器 python m smtpd n c 调试服务器本地主机 1025 以下是我的电子邮件服务器的代码 import smtp
我应该如何对长函数进行单元测试？

如果我有一个很长的代码方法它从 2 个或 3 个不同的源收集数据并返回结果我如何重构它以使其更易于单元测试该方法是一种网络服务我想从客户端代码进行一次调用来收集所有数据我可以将一些部分重构为更小的方法这将更易于测试但当前方法仍
ion-slide-box 更新问题
自定义分配器与承诺和打包任务

标准的分配器构造函数是promise packaged task应该仅将分配器用于状态对象本身或者应该保证这一点all 内部相关对象 futures promise 为共享状态分配内存 futures task members 分配存储
Rails - 如何在不使用accepts_nested_attributes_for的情况下管理嵌套属性？

我的问题是我遇到了accepts nested attributes for的限制所以我需要弄清楚如何自己复制该功能以获得更大的灵活性请参阅下文了解到底是什么让我困惑所以我的问题是如果我想模仿和增强accepts nested a
我应该使用 jquery 中的哪个或哪个插件来使用 xml 文件内容填充 html 表？

我需要显示来自服务器的 xml 文件的数据文件路径类似files client xml 到 html 表或 datagrid 中我应该使用哪个插件或者更确切地说我应该使用什么插件以便它具有可变分页过滤器和表 CSS 自定义任何
如何从 C# 中的字符串中删除所有空白字符？

亲爱的程序员朋友们我正在 C Visual Studio 2013 中编写一些代码我刚刚意识到我可能不需要使用Trim 当我做Replace string Empty 示例如下 SanitizedString RawString Rep
作为 Windows 服务运行时的 PCSC.InvalidContextException

我一直在使用 pcsc sharp 库开发一个小型智能卡扫描仪应用程序该应用程序作为控制台应用程序运行时工作正常代码如下 using System using System Collections Generic using Syste
Skype 笑脸 REGEXP 模式在哪里/如何获得？

我想了解他们用于笑脸的图案如果表情符号仅在被空格包围或大概在行字符串的开头结尾处被替换那么您可以使用一系列正则表达式使用此列表取自http www skype forum com ftopic13197 html http
在 Papyrus UML 模型中使用 MARTE GQAM 构造型

我正在尝试使用 MARTE GQAM 构造型来构造模型的某些元素但在为其某些属性赋值时遇到麻烦例如我将两条生命线之间的消息定型为我想为其 hostDemand 属性分配一个值该属性应为 NFP Duration 实例我看不到如何
TensorFlow Lite 量化无法改善推理延迟

TensorFlow 网站声称量化可将移动设备上的延迟降低多达 3 倍 https www tensorflow org lite performance post training quantization https www tenso

TensorFlow Lite 量化无法改善推理延迟

TensorFlow Lite 量化无法改善推理延迟 的相关文章

随机推荐

热门标签

TensorFlow Lite 量化无法改善推理延迟的相关文章