我正在使用 TensorFlow 数据集 API (https://www.tensorflow.org/guide/datasets https://www.tensorflow.org/guide/datasets),特别是,我将它与 TensorFlow Estimators API 一起使用(https://www.tensorflow.org/guide/datasets_for_estimators https://www.tensorflow.org/guide/datasets_for_estimators)建议使用生成器函数。
我在编写一个生成器函数时遇到了麻烦,该函数生成具有不同输出类型的特征(例如,int、float 和 string 的混合)。我已经弄清楚如何指定与生成器不同的特征+标签类型......但是仅当所有标签类型都相同时。
但是......假设您有多种要发出的特征类型(例如,在典型的导入85 TensorFlow演示的情况下,您将发出汽车制造商和型号作为字符串(稍后将其分类)下游)以及作为 float32 的 Highway-MPG 和作为 int 的门数。如何在数据集 from_generator 上指定调用各种特征类型?
数据集 = tf.data.Dataset。
from_generator(生成器=self._generator,
输出类型=(tf.float32,tf.int32),
output_shapes=(tf.TensorShape([无]),tf.TensorShape([1])))
我已经尝试过使用明显的方法
输出类型=((tf.float32,tf.float32,tf.string,tf.string),tf.int32)
没有运气。任何帮助,将不胜感激。
来自官方文档 https://www.tensorflow.org/guide/tensors#data_types:
tf.Tensor 不可能具有多种数据类型。然而,可以将任意数据结构序列化为字符串并将其存储在 tf.Tensors 中。
因此,您可能需要将它们存储为字符串,然后使用诸如解码原始数据 https://www.tensorflow.org/api_docs/python/tf/decode_raw例如。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)