如果所有变量都是 float16 而不是 float32，如何运行定义 Tensorflow 图

2024-03-28

默认情况下，Tensorflow 变量采用 float32 格式。为了节省内存，我尝试以 float16 运行。在我的图表中，我在每个可以将数据类型定义为 float16 的地方都这样做了。但是，当我运行代码时出现错误

下面是我的代码。

import math
import numpy as np
import tensorflow as tf

vocabulary_size = 10
batch_size = 64 
embedding_size = 100 
num_inputs =4
num_sampled = 128 

graph = tf.Graph()

with graph.as_default(): #took out " , tf.device('/cpu:0')"


    train_dataset = tf.placeholder(tf.int32, shape=[batch_size, num_inputs ])
    train_labels = tf.placeholder(tf.int32, shape=[batch_size, 1])

    embeddings = tf.get_variable( 'embeddings', dtype=tf.float16,
        initializer= tf.random_uniform([vocabulary_size, embedding_size], -1.0, 1.0, dtype=tf.float16) )

    softmax_weights = tf.get_variable( 'softmax_weights', dtype=tf.float16,
        initializer= tf.truncated_normal([vocabulary_size, embedding_size],
                             stddev=1.0 / math.sqrt(embedding_size), dtype=tf.float16 ) )

    softmax_biases = tf.get_variable('softmax_biases', dtype=tf.float16,
        initializer= tf.zeros([vocabulary_size], dtype=tf.float16),  trainable=False )

    embed = tf.nn.embedding_lookup(embeddings, train_dataset) #train data set is

    embed_reshaped = tf.reshape( embed, [batch_size*num_inputs, embedding_size] )

    segments= np.arange(batch_size).repeat(num_inputs)

    averaged_embeds = tf.segment_mean(embed_reshaped, segments, name=None)

    sam_sof_los = tf.nn.sampled_softmax_loss(weights=softmax_weights, biases=softmax_biases, inputs=averaged_embeds,
                                   labels=train_labels, num_sampled=num_sampled, num_classes=vocabulary_size)

    loss = tf.reduce_mean( sam_sof_los )

    optimizer = tf.train.AdagradOptimizer(1.0).minimize(loss) 

    saver = tf.train.Saver()

这是错误消息

---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
/usr/local/lib/python3.6/dist-packages/tensorflow/python/framework/op_def_library.py in _apply_op_helper(self, op_type_name, name, **keywords)
    509                 as_ref=input_arg.is_ref,
--> 510                 preferred_dtype=default_dtype)
    511           except TypeError as err:

/usr/local/lib/python3.6/dist-packages/tensorflow/python/framework/ops.py in internal_convert_to_tensor(value, dtype, name, as_ref, preferred_dtype, ctx)
   1143     if ret is None:
-> 1144       ret = conversion_func(value, dtype=dtype, name=name, as_ref=as_ref)
   1145 

/usr/local/lib/python3.6/dist-packages/tensorflow/python/framework/ops.py in _TensorTensorConversionFunction(t, dtype, name, as_ref)
    980         "Tensor conversion requested dtype %s for Tensor with dtype %s: %r" %
--> 981         (dtype.name, t.dtype.name, str(t)))
    982   return t

ValueError: Tensor conversion requested dtype float16 for Tensor with dtype float32: 'Tensor("sampled_softmax_loss/Log:0", shape=(64, 1), dtype=float32)'

During handling of the above exception, another exception occurred:

TypeError                                 Traceback (most recent call last)
<ipython-input-2-12d508b9e5d7> in <module>()
     46 
     47     sam_sof_los = tf.nn.sampled_softmax_loss(weights=softmax_weights, biases=softmax_biases, inputs=averaged_embeds,
---> 48                                    labels=train_labels, num_sampled=num_sampled, num_classes=vocabulary_size)
     49 
     50     loss = tf.reduce_mean( sam_sof_los )

/usr/local/lib/python3.6/dist-packages/tensorflow/python/ops/nn_impl.py in sampled_softmax_loss(weights, biases, labels, inputs, num_sampled, num_classes, num_true, sampled_values, remove_accidental_hits, partition_strategy, name, seed)
   1347       partition_strategy=partition_strategy,
   1348       name=name,
-> 1349       seed=seed)
   1350   labels = array_ops.stop_gradient(labels, name="labels_stop_gradient")
   1351   sampled_losses = nn_ops.softmax_cross_entropy_with_logits_v2(

/usr/local/lib/python3.6/dist-packages/tensorflow/python/ops/nn_impl.py in _compute_sampled_logits(weights, biases, labels, inputs, num_sampled, num_classes, num_true, sampled_values, subtract_log_q, remove_accidental_hits, partition_strategy, name, seed)
   1126     if subtract_log_q:
   1127       # Subtract log of Q(l), prior probability that l appears in sampled.
-> 1128       true_logits -= math_ops.log(true_expected_count)
   1129       sampled_logits -= math_ops.log(sampled_expected_count)
   1130 

/usr/local/lib/python3.6/dist-packages/tensorflow/python/ops/math_ops.py in binary_op_wrapper(x, y)
    860     with ops.name_scope(None, op_name, [x, y]) as name:
    861       if isinstance(x, ops.Tensor) and isinstance(y, ops.Tensor):
--> 862         return func(x, y, name=name)
    863       elif not isinstance(y, sparse_tensor.SparseTensor):
    864         try:

/usr/local/lib/python3.6/dist-packages/tensorflow/python/ops/gen_math_ops.py in sub(x, y, name)
   8316   if _ctx is None or not _ctx._eager_context.is_eager:
   8317     _, _, _op = _op_def_lib._apply_op_helper(
-> 8318         "Sub", x=x, y=y, name=name)
   8319     _result = _op.outputs[:]
   8320     _inputs_flat = _op.inputs

/usr/local/lib/python3.6/dist-packages/tensorflow/python/framework/op_def_library.py in _apply_op_helper(self, op_type_name, name, **keywords)
    544                   "%s type %s of argument '%s'." %
    545                   (prefix, dtypes.as_dtype(attrs[input_arg.type_attr]).name,
--> 546                    inferred_from[input_arg.type_attr]))
    547 
    548           types = [values.dtype]

TypeError: Input 'y' of 'Sub' Op has type float32 that does not match type float16 of argument 'x'.

错误来自行tf.nn.sampled_softmax_loss.

起初，我认为 tf.segment_mean 可能会将输出转换为 float32，因此我尝试将 Averaged_embeds 转换为 float16，但仍然遇到相同的错误。

从文档来看，似乎没有办法在sampled_softmax_loss中定义任何数据类型

https://www.tensorflow.org/api_docs/python/tf/nn/sampled_softmax_loss https://www.tensorflow.org/api_docs/python/tf/nn/sampled_softmax_loss

据我所知，你只能使用 hack 来做到这一点。

问题来自于以下调用：

  if sampled_values is None:
      sampled_values = candidate_sampling_ops.log_uniform_candidate_sampler(
          true_classes=labels,
          num_true=num_true,
          num_sampled=num_sampled,
          unique=True,
          range_max=num_classes,
          seed=seed)

它输出这种类型的对象：

LogUniformCandidateSampler(
    sampled_candidates=<tf.Tensor 'LogUniformCandidateSampler:0' shape=(128,) dtype=int64>,
    true_expected_count=<tf.Tensor 'LogUniformCandidateSampler:1' shape=(64, 1) dtype=float32>,
    sampled_expected_count=<tf.Tensor 'LogUniformCandidateSampler:2' shape=(128,) dtype=float32>
)

黑客将是自己生成LogUniformCandidateSampler，将其结果转换为tf.float16并将其传递给tf.nn.sampled_softmax_loss.

# Redefine it as the tensorflow one is not exposed.
LogUniformCandidateSampler = namedtuple("namedtuple", ["sampled_candidates", "true_expected_count", "sampled_expected_count"]) 
sampled_values = tf.nn.log_uniform_candidate_sampler(
      true_classes=tf.cast(train_labels, tf.int64), num_sampled=num_sampled,
      num_true=1,
      unique=True,
      range_max=vocabulary_size,
      seed=None)

sampled_value_16 = LogUniformCandidateSampler(
    sampled_values.sampled_candidates,
    tf.cast(sampled_values.true_expected_count, tf.float16),
    tf.cast(sampled_values.sampled_expected_count, tf.float16))

sam_sof_los = tf.nn.sampled_softmax_loss(
    weights=softmax_weights,
    biases=softmax_biases,
    inputs=averaged_embeds,
    labels=train_labels, num_sampled=num_sampled, num_classes=vocabulary_size, 
    sampled_values=sampled_value_16)

但这确实是一次黑客攻击，可能会产生意想不到的后果（预期的结果是tf.cast运算不可微）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

tensorflow

如果所有变量都是 float16 而不是 float32，如何运行定义 Tensorflow 图的相关文章

如何从网站中抓取动态内容？

所以我使用 scrapy 从亚马逊图书部分抓取数据但不知何故我知道它有一些动态数据我想知道如何从网站中提取动态数据到目前为止我已经尝试过以下方法 import scrapy from items import AmazonsItem
env: python: 使用 Xcode 构建应用程序时没有这样的文件或目录

当我在 Xcode 在 MacOS 12 3 上中构建运行存档我的应用程序时遇到此错误 env python No such file or directory Command Ld failed with a nonzero e
如何获取右侧数据框中不在左侧数据框中的数据

我有两个数据帧我正在尝试输出其中一个数据帧中的数据而不是另一个数据帧中的数据我可以使用第一个数据帧中的数据但不能使用第二个数据帧中的数据 only new old merge new outer on Employee ID Ben
将嵌套循环计算转换为 Numpy 以加速

我的Python程序的一部分包含以下代码段其中一个新的网格是根据旧网格中找到的数据计算的网格是二维浮点数列表该代码使用了三个 for 循环 for t in xrange 0 t step for h in xrange 1 hei
按 A 列删除重复项，保留 B 列中具有最高值的行

我有一个数据框 A 列中有重复值我想删除重复项保留 B 列中具有最高值的行 So this A B 1 10 1 20 2 30 2 40 3 10 应该变成这样 A B 1 20 2 40 3 10 我猜想可能有一种简单的方法可以做到
Python3 类型错误：replace() 参数 1 必须是 str，而不是 int

我已经尝试了几天让这段代码在 MacOS 上运行但没有成功你能看一下我错过了什么吗运行 python 3 6 我已经上传了整个代码多谢 usr bin env python3 from future import print fun
将字段重新格式化为列，其他字段（与先前结构中成为列的字段配对）成为新列中的字段

我的任务是清理慈善机构设计的移动应用程序中的数据在一个部分中用户问答应用程序使用会话由一行表示该部分由重复的问题答案字段对组成其中一个字段代表所提出的问题然后它旁边的字段代表相应的答案每个问题字段和答案列对一起代表一个独特的问
如何创建毫秒粒度的 Python 时间戳？

我需要一个自纪元以来的毫秒 ms 时间戳这应该不难我确信我只是缺少一些方法datetime或类似的东西实际上微秒 s 粒度也很好我只需要亚 1 10 秒的计时例子我有一个每 750 毫秒发生一次的事件假设它检查灯是否打开或关闭
使用DockerOperator时如何同时使用xcom_push=True和auto_remove=True？

Problem 跑步时DockerOperator with xcom push True xcom all True and auto remove True 任务会引发错误就好像容器在读取其内容之前被删除一样STDOUT Exampl
从内存中发送图像

我正在尝试为 Discord 机器人实现一个系统该系统可以动态修改图像并将其发送给机器人用户为此我决定使用 Pillow PIL 库因为它对于我的目的来说似乎简单明了这是我的工作代码的示例它加载一个示例图像作为测试修改在其上
使用正则表达式检查整个字符串

我正在尝试检查字符串是否是数字因此正则表达式 d 似乎不错然而由于某种原因该正则表达式也适合 78 46 92 168 8000 这是我不想要的一些代码 class Foo rex re compile d def bar sel
导入 scipy.stats 时，出现“ImportError: DLL load failed: 找不到指定的过程”

我无法导入 scipy stats 并收到以下错误但不知何故 import scipy as sp 仍然可以正常工作其他库如numpy pandas都可以毫无问题地导入我尝试在 Anaconda 中重新安装 scipy 1 2 1 降
将 pandas 多索引数据帧转换为嵌套字典

我有一个 pandas 多索引数据框我试图将其输出为嵌套字典 create the dataset data clump thickness 0 0 274 0 0 1 19 0 1 0 67 0 1 1 12 0 2 0 83 0 2
在 grpc python 中处理异步流请求

我试图了解如何使用双向流处理 grpc api 使用 Python API 假设我有以下简单的服务器定义 syntax proto3 package simple service TestService rpc Translate stre
Django admin.py 未知命令：'collectstatic'

我已经从 django 1 2 7 升级到 django 1 5 1我正在使用 python 2 6 6当我尝试跑步时python manage py collectstatic i get 未知命令 collectstatic 从我的设置
django 南迁移，不设置默认值

我使用 South 来迁移我的 Django 模型然而南方有一个令人讨厌的错误它不会在 Postgres 数据库中设置默认值例子 created at models DateTimeField default datetime no
出于安全目的，您是否有理由不执行自己的算法来打乱 ID？

我计划实现我自己的非常简单的哈希公式为具有多个用户的应用程序添加一层安全性我目前的计划如下用户创建一个帐户此时后端会生成一个 ID ID 通过公式运行假设 ID 57 8926 36 7 或同样随机的东西然后我将新的用户
使用枚举名称而不是值对 Pydantic 字段进行编码

我有一个枚举类 class Group enum Enum user 0 manager 1 admin 2 我有一个 pydantic 模型 class User BaseModel id int username str group G
有没有比 Python 内置 == 运算符更快的方法来测试两个列表是否具有完全相同的元素？

如果我有两个列表每个列表有 800 个元素长并填充整数有没有比使用内置元件更快的方法来比较它们具有完全相同的元件如果没有则短路操作员 a 6 2 3 88 54 486 b 6 2 3 88 54 486 a b gt gt gt
Pandas：如何删除以 nan 作为列名的多个列？

根据标题这是一个可重现的示例 raw data x this that this that this np nan np nan np nan np nan np nan np nan y np nan np nan np nan np

随机推荐

Openfeign ErrorDecoder 导致 java.io.IOException：流已关闭

当我尝试实施时ErrorDecoder为了解码假装异常我在中找到了流response body 已关闭因此当我尝试读取流并将其转换为字符串时它会抛出java io IOException stream is closed 这真的很困惑
Jenkins Pipeline阶段跳过基于管道中定义的groovy变量

我正在尝试跳过stage基于常规变量该变量值将在另一个阶段计算在下面的例子中 Validate基于环境变量有条件地跳过阶段VALIDATION REQUIRED我将在构建触发作业时通过它这按预期工作鉴于Build即使舞台始终运行i
IE8 中的控制台未定义问题[重复]

这个问题在这里已经有答案了我知道IE只处理console如果调试窗口打开则作为对象如果调试窗口未打开则会将控制台视为未定义这就是为什么我决定添加一个if像这样检查 if console console log removing c
更改 Html5 Canvas 元素的颜色深度

我想知道是否有一种方法可以改变 HTML5 Canvas 元素中图像的颜色深度例如图像中每个像素的颜色将四舍五入到较小颜色位深度中最接近的等效值谢谢是的这是可以做到的而且并不是太难在这里查看我的回答如何使用渐变贴图为 H
Java EE 中的 Facade 有什么意义？

我不太明白门面的意义 public abstract class AbstractFacade
评估数组是否有 ruby 中的任何项目

有更好的方法来声明这一点吗 if current user received replies unread count gt 0 我想做的是仅当至少有一个时才匹配条件unread目的 unless current user received
SQL Server 索引的工作原理

SQL Server 使用带有中间节点和叶节点的二叉树进行搜索但它是如何做到这一点的前任如果一个表employee有两个字段 Id bigint Name varchar 50 具有诸如 Id Name 1 Ashish 2 Amit
如何设置UIToolBar的标题？

如何设置 UIToolBar 的标题使其看起来与 UINavigationBar 中的标题相同我尝试使用普通样式的按钮看起来还可以但是当我点击它时它会突出显示有没有更好的方法在分割视图的详细视图中设置标题这就是我用来在工具栏上显
使用 Autofac 将 WebAPI UrlHelper 注入服务中

我的 WebAPI 项目中有一些控制器使用的服务该服务需要生成 URL 因此理想情况下它会得到UrlHelper通过构造函数参数 public class MyService public MyService UrlHelper urlH
在asp.net中按日期对directoryinfo中的文件进行排序

如何按日期从最旧到最近对目录信息文件进行排序而不是过滤我正在使用 asp net 和 Visual Studio 2008 与vb net中的 DaRKoN 相同 Module Module1 Sub Main Dim ordere
我们可以将 cassandra / couchdb / mongodb 与 Google App Engine 基础设施一起使用吗？

无论如何我们可以使用 Google App Engine 但不使用 google 的 bigtable 吗就像存储我的数据一样我更喜欢使用 cassandra 并且能够插入和拔出额外的数据库服务器如果我想使用 CouchDb Mon
玩法2 如何从MultipartFormData获取DataPart

如何从 MultipartFormData 获取 DataPart 我找不到任何 API 来实现这一点 Http MultipartFormData formData body asMultipartFormData simple form
grep 使用其他文件中的单词匹配行中的特定位置

我有2个文件 file1 12342015010198765hello 12342015010188765hello 12342015010178765hello 每行包含固定位置的字段例如position13 17 is for acc
正则表达式提取由空格分隔的键值对，值中包含空格

假设一个单行字符串具有多个连续的键值对用空格分隔但值内也允许有空格不在键中例如 key1 one two three key2 four key3 five six key4 seven eight nine ten 从上面正确提取
WTP HTTP 预览服务器 - 如何重新配置默认服务器端口？

在 Eclipse Ganymede 下如何重新配置 Eclipse WTP HTTP 预览服务器的默认服务器端口 8080 Leonel 我想你从来没有看到与这个问题相关的视图我问的是 HTTP预览服务器而不是端口所在的其他服务
WPF 绑定路径=/ 不起作用？

我已经设置了我的DataContext像这样
Flutter 将两个 Firestore 流合并为一个流

我只想执行 OR 运算并将两个查询的结果放入一个流中这是我的带有单个流的代码 StreamBuilder stream Firestore instance collection list where id isEqualTo false
Python：判断字符串是否包含数学？

给定这些字符串 1 2 apple pear 如何使用 Python 3 5 确定第一个字符串包含数学问题并且没有其他的而第二根弦没有这是一种方法 import ast UNARY OPS ast UAdd ast USub BINARY
Amazon S3 托管流媒体视频 [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案如果我公开提供 Amazon s3 MP4 资源然后在该资源的 URL 周围添加 Html5 视频标
如果所有变量都是 float16 而不是 float32，如何运行定义 Tensorflow 图

默认情况下 Tensorflow 变量采用 float32 格式为了节省内存我尝试以 float16 运行在我的图表中我在每个可以将数据类型定义为 float16 的地方都这样做了但是当我运行代码时出现错误下面是我的代码 im

如果所有变量都是 float16 而不是 float32，如何运行定义 Tensorflow 图

如果所有变量都是 float16 而不是 float32，如何运行定义 Tensorflow 图 的相关文章

随机推荐

热门标签

如果所有变量都是 float16 而不是 float32，如何运行定义 Tensorflow 图的相关文章