“AttributeError：启用急切执行时，Tensor.name 毫无意义。”在 TPU 上进行“self.optimizer.apply_gradients”训练时

2024-01-11

我的代码在 GPU 上运行良好，但对于 TPU，我从以下位置开始出错：

self.optimizer.apply_gradients(zip(gradients, trainable_vars))

其中说AttributeError: Tensor.name is meaningless when eager execution is enabled.

我有一个自定义模型，它与 Keras 默认模型没有太大区别

class CustomModel(tf.keras.Model):
    def train_step(self, data):
        # Unpack the data. Its structure depends on your model and
        # on what you pass to `fit()`.
        x = data
        y = tf.Variable(tf.constant([1.0], dtype=tf.float32))

        with tf.GradientTape() as tape:
            y_pred = self(x, training=True)  # Forward pass
            # Compute the loss value
            # (the loss function is configured in `compile()`)
            loss = self.compiled_loss(y, y_pred, regularization_losses=self.losses)

        # Compute gradients
        trainable_vars = self.trainable_variables
        gradients = tape.gradient(loss, trainable_vars)
        # Update weights
        self.optimizer.apply_gradients(zip(gradients, trainable_vars))
        # Update metrics (includes the metric that tracks the loss)
        self.compiled_metrics.update_state(y, y_pred)
        # Return a dict mapping metric names to current value
        return {m.name: m.result() for m in self.metrics}

这是完整的错误消息

Epoch 1/3
---------------------------------------------------------------------------
AttributeError                            Traceback (most recent call last)
<ipython-input-19-00fb5a641066> in <module>()
      5         validation_steps=val_steps,
      6         validation_freq=1,
----> 7         callbacks=callbacks)

10 frames
/usr/local/lib/python3.6/dist-packages/tensorflow/python/keras/engine/training.py in _method_wrapper(self, *args, **kwargs)
     64   def _method_wrapper(self, *args, **kwargs):
     65     if not self._in_multi_worker_mode():  # pylint: disable=protected-access
---> 66       return method(self, *args, **kwargs)
     67 
     68     # Running inside `run_distribute_coordinator` already.

/usr/local/lib/python3.6/dist-packages/tensorflow/python/keras/engine/training.py in fit(self, x, y, batch_size, epochs, verbose, callbacks, validation_split, validation_data, shuffle, class_weight, sample_weight, initial_epoch, steps_per_epoch, validation_steps, validation_batch_size, validation_freq, max_queue_size, workers, use_multiprocessing)
    846                 batch_size=batch_size):
    847               callbacks.on_train_batch_begin(step)
--> 848               tmp_logs = train_function(iterator)
    849               # Catch OutOfRangeError for Datasets of unknown size.
    850               # This blocks until the batch has finished executing.

/usr/local/lib/python3.6/dist-packages/tensorflow/python/eager/def_function.py in __call__(self, *args, **kwds)
    578         xla_context.Exit()
    579     else:
--> 580       result = self._call(*args, **kwds)
    581 
    582     if tracing_count == self._get_tracing_count():

/usr/local/lib/python3.6/dist-packages/tensorflow/python/eager/def_function.py in _call(self, *args, **kwds)
    625       # This is the first call of __call__, so we have to initialize.
    626       initializers = []
--> 627       self._initialize(args, kwds, add_initializers_to=initializers)
    628     finally:
    629       # At this point we know that the initialization is complete (or less

/usr/local/lib/python3.6/dist-packages/tensorflow/python/eager/def_function.py in _initialize(self, args, kwds, add_initializers_to)
    504     self._concrete_stateful_fn = (
    505         self._stateful_fn._get_concrete_function_internal_garbage_collected(  # pylint: disable=protected-access
--> 506             *args, **kwds))
    507 
    508     def invalid_creator_scope(*unused_args, **unused_kwds):

/usr/local/lib/python3.6/dist-packages/tensorflow/python/eager/function.py in _get_concrete_function_internal_garbage_collected(self, *args, **kwargs)
   2444       args, kwargs = None, None
   2445     with self._lock:
-> 2446       graph_function, _, _ = self._maybe_define_function(args, kwargs)
   2447     return graph_function
   2448 

/usr/local/lib/python3.6/dist-packages/tensorflow/python/eager/function.py in _maybe_define_function(self, args, kwargs)
   2775 
   2776       self._function_cache.missed.add(call_context_key)
-> 2777       graph_function = self._create_graph_function(args, kwargs)
   2778       self._function_cache.primary[cache_key] = graph_function
   2779       return graph_function, args, kwargs

/usr/local/lib/python3.6/dist-packages/tensorflow/python/eager/function.py in _create_graph_function(self, args, kwargs, override_flat_arg_shapes)
   2665             arg_names=arg_names,
   2666             override_flat_arg_shapes=override_flat_arg_shapes,
-> 2667             capture_by_value=self._capture_by_value),
   2668         self._function_attributes,
   2669         # Tell the ConcreteFunction to clean up its graph once it goes out of

/usr/local/lib/python3.6/dist-packages/tensorflow/python/framework/func_graph.py in func_graph_from_py_func(name, python_func, args, kwargs, signature, func_graph, autograph, autograph_options, add_control_dependencies, arg_names, op_return_value, collections, capture_by_value, override_flat_arg_shapes)
    979         _, original_func = tf_decorator.unwrap(python_func)
    980 
--> 981       func_outputs = python_func(*func_args, **func_kwargs)
    982 
    983       # invariant: `func_outputs` contains only Tensors, CompositeTensors,

/usr/local/lib/python3.6/dist-packages/tensorflow/python/eager/def_function.py in wrapped_fn(*args, **kwds)
    439         # __wrapped__ allows AutoGraph to swap in a converted function. We give
    440         # the function a weak reference to itself to avoid a reference cycle.
--> 441         return weak_wrapped_fn().__wrapped__(*args, **kwds)
    442     weak_wrapped_fn = weakref.ref(wrapped_fn)
    443 

/usr/local/lib/python3.6/dist-packages/tensorflow/python/framework/func_graph.py in wrapper(*args, **kwargs)
    966           except Exception as e:  # pylint:disable=broad-except
    967             if hasattr(e, "ag_error_metadata"):
--> 968               raise e.ag_error_metadata.to_exception(e)
    969             else:
    970               raise

AttributeError: in user code:

    /usr/local/lib/python3.6/dist-packages/tensorflow/python/keras/engine/training.py:571 train_function  *
        outputs = self.distribute_strategy.run(
    <ipython-input-6-490916a676f3>:18 train_step  *
        self.optimizer.apply_gradients(zip(gradients, trainable_vars))
    /usr/local/lib/python3.6/dist-packages/tensorflow_addons/optimizers/weight_decay_optimizers.py:149 apply_gradients  *
        return super().apply_gradients(grads_and_vars, name=name)
    /usr/local/lib/python3.6/dist-packages/tensorflow/python/keras/optimizer_v2/optimizer_v2.py:472 apply_gradients  **
        grads_and_vars = _filter_grads(grads_and_vars)
    /usr/local/lib/python3.6/dist-packages/tensorflow/python/keras/optimizer_v2/optimizer_v2.py:1223 _filter_grads
        ([v.name for v in vars_with_empty_grads]))
    /usr/local/lib/python3.6/dist-packages/tensorflow/python/keras/optimizer_v2/optimizer_v2.py:1223 <listcomp>
        ([v.name for v in vars_with_empty_grads]))
    /usr/local/lib/python3.6/dist-packages/tensorflow/python/framework/ops.py:1123 name
        "Tensor.name is meaningless when eager execution is enabled.")

    AttributeError: Tensor.name is meaningless when eager execution is enabled.

完整的代码可以在这里

https://colab.research.google.com/drive/1PqAAa0-Dh9cZfLjLQGuqt5zPWBXqZTn6?usp=sharing https://colab.research.google.com/drive/1PqAAa0-Dh9cZfLjLQGuqt5zPWBXqZTn6?usp=sharing

我想知道我是否缺少 TPU 训练的某些方面，因为只有在通过 TPU 进行训练时我才会收到此错误。

以下是 Github 上一些可能相关的问题

https://github.com/tensorflow/tensorflow/issues/33045 https://github.com/tensorflow/tensorflow/issues/33045

https://github.com/tensorflow/tensorflow/issues/34635 https://github.com/tensorflow/tensorflow/issues/34635

EDIT:

我注意到 Tensorflow 改变了他们的定义方式train_step, https://github.com/tensorflow/tensorflow/blob/2434d2401399e3973d2f704f977bd6ad2d029ca7/tensorflow/python/keras/engine/training.py#L716 https://github.com/tensorflow/tensorflow/blob/2434d2401399e3973d2f704f977bd6ad2d029ca7/tensorflow/python/keras/engine/training.py#L716

所以我更新了我的自定义模型以匹配它。

from tensorflow.python.keras.mixed_precision.experimental import loss_scale_optimizer as lso
from tensorflow.python.distribute import parameter_server_strategy

def _minimize(strategy, tape, optimizer, loss, trainable_variables):
    with tape:
        if isinstance(optimizer, lso.LossScaleOptimizer):
            loss = optimizer.get_scaled_loss(loss)

    gradients = tape.gradient(loss, trainable_variables)
    gradients = [(ClipIfNotNone(grad)) for grad in gradients]
    gradients = [(ClipIfNotNone2(grad)) for grad in gradients]
    # Whether to aggregate gradients outside of optimizer. This requires support
    # of the optimizer and doesn't work with ParameterServerStrategy and
    # CentralStroageStrategy.
    aggregate_grads_outside_optimizer = (
        optimizer._HAS_AGGREGATE_GRAD and  # pylint: disable=protected-access
        not isinstance(strategy.extended,
                        parameter_server_strategy.ParameterServerStrategyExtended))

    if aggregate_grads_outside_optimizer:
        # We aggregate gradients before unscaling them, in case a subclass of
        # LossScaleOptimizer all-reduces in fp16. All-reducing in fp16 can only be
        # done on scaled gradients, not unscaled gradients, for numeric stability.
        gradients = optimizer._aggregate_gradients(zip(gradients,  # pylint: disable=protected-access
                                                    trainable_variables))
    if isinstance(optimizer, lso.LossScaleOptimizer):
        gradients = optimizer.get_unscaled_gradients(gradients)
    gradients = optimizer._clip_gradients(gradients)  # pylint: disable=protected-access
    if trainable_variables:
        if aggregate_grads_outside_optimizer:
            optimizer.apply_gradients(
                zip(gradients, trainable_variables),
                experimental_aggregate_gradients=False)
        else:
            optimizer.apply_gradients(zip(gradients, trainable_variables))

class CustomModel(tf.keras.Model):
    def train_step(self, data):
        # Unpack the data. Its structure depends on your model and
        # on what you pass to `fit()`.
        x = data
        y = tf.constant([1.0], dtype=tf.float32)
        sample_weight = None

        with tf.GradientTape() as tape:
            y_pred = self(x, training=True)  # Forward pass
            # Compute the loss value
            # (the loss function is configured in `compile()`)
            loss = self.compiled_loss(y, y_pred, regularization_losses=self.losses)
        
        _minimize(self.distribute_strategy, tape, self.optimizer, loss,
                self.trainable_variables)

        self.compiled_metrics.update_state(y, y_pred, sample_weight)
        return {m.name: m.result() for m in self.metrics}

然而，结果几乎是一样的

    /usr/local/lib/python3.6/dist-packages/tensorflow/python/keras/engine/training.py:571 train_function  *
        outputs = self.distribute_strategy.run(
    <ipython-input-8-823751185253>:53 train_step  *
        _minimize(self.distribute_strategy, tape, self.optimizer, loss,
    <ipython-input-8-823751185253>:24 _minimize  *
        gradients = optimizer._aggregate_gradients(zip(gradients,  # pylint: disable=protected-access
    /usr/local/lib/python3.6/dist-packages/tensorflow/python/keras/optimizer_v2/optimizer_v2.py:521 _aggregate_gradients  **
        filtered_grads_and_vars = _filter_grads(grads_and_vars)
    /usr/local/lib/python3.6/dist-packages/tensorflow/python/keras/optimizer_v2/optimizer_v2.py:1223 _filter_grads
        ([v.name for v in vars_with_empty_grads]))
    /usr/local/lib/python3.6/dist-packages/tensorflow/python/keras/optimizer_v2/optimizer_v2.py:1223 <listcomp>
        ([v.name for v in vars_with_empty_grads]))
    /usr/local/lib/python3.6/dist-packages/tensorflow/python/framework/ops.py:1123 name
        "Tensor.name is meaningless when eager execution is enabled.")

    AttributeError: Tensor.name is meaningless when eager execution is enabled.

Edit2:

我尝试不进行定制train_step完全一样，只需扩展 tf.keras.Model 类即可。仍然遇到同样的问题。

这就是我的定制模型的样子

class Dora_A(tf.keras.Model):
    def __init__(self):
        super(Dora_A, self).__init__()
        self.bioRoberta = TFRobertaModel.from_pretrained('allenai/biomed_roberta_base', from_pt=True)

        self.Q_Tlayer0 = deepcopy(self.bioRoberta.layers[0].encoder.layer[11])
        self.Q_Tlayer0._name = self.Q_Tlayer0._name + 'Query'
        self.P_Tlayer0 = deepcopy(self.bioRoberta.layers[0].encoder.layer[11])
        self.P_Tlayer0._name = self.P_Tlayer0._name + 'Passage'

        self.Q_Tlayer1 = deepcopy(self.bioRoberta.layers[0].encoder.layer[11])
        self.Q_Tlayer1._name = self.Q_Tlayer1._name + 'Query'
        self.P_Tlayer1 = deepcopy(self.bioRoberta.layers[0].encoder.layer[11])
        self.P_Tlayer1._name = self.P_Tlayer1._name + 'Passage'

        self.Q_Tlayer2 = deepcopy(self.bioRoberta.layers[0].encoder.layer[11])
        self.Q_Tlayer2._name = self.Q_Tlayer2._name + 'Query'
        self.P_Tlayer2 = deepcopy(self.bioRoberta.layers[0].encoder.layer[11])
        self.P_Tlayer2._name = self.P_Tlayer2._name + 'Passage'

        self.Q_Tlayer3 = deepcopy(self.bioRoberta.layers[0].encoder.layer[11])
        self.Q_Tlayer3._name = self.Q_Tlayer3._name + 'Query'
        self.P_Tlayer3 = deepcopy(self.bioRoberta.layers[0].encoder.layer[11])
        self.P_Tlayer3._name = self.P_Tlayer3._name + 'Passage'

        self.Q_Tlayer3.intermediate.intermediate_act_fn = tf.keras.activations.tanh
        self.P_Tlayer3.intermediate.intermediate_act_fn = tf.keras.activations.tanh

        # self.Q_Tlayer0.set_weights(self.Q_Tlayer3.get_weights())
        # self.P_Tlayer0.set_weights(self.P_Tlayer3.get_weights())

        # self.Q_Tlayer1.set_weights(self.Q_Tlayer3.get_weights())
        # self.P_Tlayer1.set_weights(self.P_Tlayer3.get_weights())

        # self.Q_Tlayer2.set_weights(self.Q_Tlayer3.get_weights())
        # self.P_Tlayer2.set_weights(self.P_Tlayer3.get_weights())

        self.Q_ff_1 = tf.keras.layers.Dense(768, activation='swish',  name='qffPost_n1')
        self.P_ff_1 = tf.keras.layers.Dense(768, activation='swish',  name='pffPost_n1')

        self.Q_ff_2 = tf.keras.layers.Dense(768, activation='tanh',  name='qffPost_n2')
        self.P_ff_2 = tf.keras.layers.Dense(768, activation='tanh',  name='pffPost_n2')

    def call(self, inputIds):
        queryInputs, passageInputs = inputIds

        Q_outputs = self.bioRoberta(queryInputs)[0]
        P_outputs = self.bioRoberta(passageInputs)[0]

        Q_outputs = self.Q_Tlayer0((Q_outputs, None, None))[0]
        P_outputs = self.P_Tlayer0((P_outputs, None, None))[0]

        Q_outputs = self.Q_Tlayer1((Q_outputs, None, None))[0]
        P_outputs = self.P_Tlayer1((P_outputs, None, None))[0]

        Q_outputs = self.Q_Tlayer2((Q_outputs, None, None))[0]
        P_outputs = self.P_Tlayer2((P_outputs, None, None))[0]

        Q_outputs = self.Q_Tlayer3((Q_outputs, None, None))[0]
        P_outputs = self.P_Tlayer3((P_outputs, None, None))[0]       

        Q_outputs = tf.concat([
                        Q_outputs[:, 0], #cls, NOT from ff layer after last hidden state since it seems to be untrained in roberta
                        tf.reduce_mean(Q_outputs[:, 1:-1], axis=1), # pooled except CLS and SEP
                        tf.math.reduce_max(Q_outputs[:, 1:-1], axis=1),
                        tf.math.reduce_min(Q_outputs[:, 1:-1], axis=1),
                        tf.math.reduce_variance(Q_outputs[:, 1:-1], axis=1),
                        tf.math.reduce_logsumexp(Q_outputs[:, 1:-1], axis=1),
                        Q_outputs[:, -1] # sep, get from hidden state 
                        ],axis=1) 
        
        P_outputs = tf.concat([
                        P_outputs[:, 0], #cls, NOT from ff layer after last hidden state since it seems to be untrained in roberta
                        tf.reduce_mean(P_outputs[:, 1:-1], axis=1), # pooled except CLS and SEP
                        tf.math.reduce_max(P_outputs[:, 1:-1], axis=1),
                        tf.math.reduce_min(P_outputs[:, 1:-1], axis=1),
                        tf.math.reduce_variance(P_outputs[:, 1:-1], axis=1),
                        tf.math.reduce_logsumexp(P_outputs[:, 1:-1], axis=1),
                        P_outputs[:, -1] # sep, get from hidden state 
                        ],axis=1)

        Q_outputs = Dropout(0.10)(Q_outputs)
        P_outputs = Dropout(0.10)(P_outputs)

        Q_outputs = self.Q_ff_1(Q_outputs) 
        P_outputs = self.P_ff_1(P_outputs) 

        Q_outputs = self.Q_ff_2(Q_outputs) 
        P_outputs = self.P_ff_2(P_outputs) 

        dotProductMatrix = tf.linalg.matmul(Q_outputs, P_outputs, transpose_b=True, name='mm')

        return dotProductMatrix

这是我训练时收到的错误消息

---------------------------------------------------------------------------
AttributeError                            Traceback (most recent call last)
<ipython-input-23-d78edec93dcb> in <module>()
      1 model.fit(train_datasetFinal,
      2         epochs=epochs,
----> 3         callbacks=callbacks)
      4 
      5 # else:

10 frames
/usr/local/lib/python3.6/dist-packages/tensorflow/python/keras/engine/training.py in _method_wrapper(self, *args, **kwargs)
     64   def _method_wrapper(self, *args, **kwargs):
     65     if not self._in_multi_worker_mode():  # pylint: disable=protected-access
---> 66       return method(self, *args, **kwargs)
     67 
     68     # Running inside `run_distribute_coordinator` already.

/usr/local/lib/python3.6/dist-packages/tensorflow/python/keras/engine/training.py in fit(self, x, y, batch_size, epochs, verbose, callbacks, validation_split, validation_data, shuffle, class_weight, sample_weight, initial_epoch, steps_per_epoch, validation_steps, validation_batch_size, validation_freq, max_queue_size, workers, use_multiprocessing)
    846                 batch_size=batch_size):
    847               callbacks.on_train_batch_begin(step)
--> 848               tmp_logs = train_function(iterator)
    849               # Catch OutOfRangeError for Datasets of unknown size.
    850               # This blocks until the batch has finished executing.

/usr/local/lib/python3.6/dist-packages/tensorflow/python/eager/def_function.py in __call__(self, *args, **kwds)
    578         xla_context.Exit()
    579     else:
--> 580       result = self._call(*args, **kwds)
    581 
    582     if tracing_count == self._get_tracing_count():

/usr/local/lib/python3.6/dist-packages/tensorflow/python/eager/def_function.py in _call(self, *args, **kwds)
    625       # This is the first call of __call__, so we have to initialize.
    626       initializers = []
--> 627       self._initialize(args, kwds, add_initializers_to=initializers)
    628     finally:
    629       # At this point we know that the initialization is complete (or less

/usr/local/lib/python3.6/dist-packages/tensorflow/python/eager/def_function.py in _initialize(self, args, kwds, add_initializers_to)
    504     self._concrete_stateful_fn = (
    505         self._stateful_fn._get_concrete_function_internal_garbage_collected(  # pylint: disable=protected-access
--> 506             *args, **kwds))
    507 
    508     def invalid_creator_scope(*unused_args, **unused_kwds):

/usr/local/lib/python3.6/dist-packages/tensorflow/python/eager/function.py in _get_concrete_function_internal_garbage_collected(self, *args, **kwargs)
   2444       args, kwargs = None, None
   2445     with self._lock:
-> 2446       graph_function, _, _ = self._maybe_define_function(args, kwargs)
   2447     return graph_function
   2448 

/usr/local/lib/python3.6/dist-packages/tensorflow/python/eager/function.py in _maybe_define_function(self, args, kwargs)
   2775 
   2776       self._function_cache.missed.add(call_context_key)
-> 2777       graph_function = self._create_graph_function(args, kwargs)
   2778       self._function_cache.primary[cache_key] = graph_function
   2779       return graph_function, args, kwargs

/usr/local/lib/python3.6/dist-packages/tensorflow/python/eager/function.py in _create_graph_function(self, args, kwargs, override_flat_arg_shapes)
   2665             arg_names=arg_names,
   2666             override_flat_arg_shapes=override_flat_arg_shapes,
-> 2667             capture_by_value=self._capture_by_value),
   2668         self._function_attributes,
   2669         # Tell the ConcreteFunction to clean up its graph once it goes out of

/usr/local/lib/python3.6/dist-packages/tensorflow/python/framework/func_graph.py in func_graph_from_py_func(name, python_func, args, kwargs, signature, func_graph, autograph, autograph_options, add_control_dependencies, arg_names, op_return_value, collections, capture_by_value, override_flat_arg_shapes)
    979         _, original_func = tf_decorator.unwrap(python_func)
    980 
--> 981       func_outputs = python_func(*func_args, **func_kwargs)
    982 
    983       # invariant: `func_outputs` contains only Tensors, CompositeTensors,

/usr/local/lib/python3.6/dist-packages/tensorflow/python/eager/def_function.py in wrapped_fn(*args, **kwds)
    439         # __wrapped__ allows AutoGraph to swap in a converted function. We give
    440         # the function a weak reference to itself to avoid a reference cycle.
--> 441         return weak_wrapped_fn().__wrapped__(*args, **kwds)
    442     weak_wrapped_fn = weakref.ref(wrapped_fn)
    443 

/usr/local/lib/python3.6/dist-packages/tensorflow/python/framework/func_graph.py in wrapper(*args, **kwargs)
    966           except Exception as e:  # pylint:disable=broad-except
    967             if hasattr(e, "ag_error_metadata"):
--> 968               raise e.ag_error_metadata.to_exception(e)
    969             else:
    970               raise

AttributeError: in user code:

    /usr/local/lib/python3.6/dist-packages/tensorflow/python/keras/engine/training.py:571 train_function  *
        outputs = self.distribute_strategy.run(
    /usr/local/lib/python3.6/dist-packages/tensorflow/python/distribute/tpu_strategy.py:174 run  **
        return self.extended.tpu_run(fn, args, kwargs, options)
    /usr/local/lib/python3.6/dist-packages/tensorflow/python/distribute/tpu_strategy.py:867 tpu_run
        return func(args, kwargs)
    /usr/local/lib/python3.6/dist-packages/tensorflow/python/distribute/tpu_strategy.py:934 tpu_function
        padding_spec=padding_spec)
    /usr/local/lib/python3.6/dist-packages/tensorflow/python/tpu/tpu.py:893 replicate
        padding_spec=padding_spec)[1]
    /usr/local/lib/python3.6/dist-packages/tensorflow/python/tpu/tpu.py:1280 split_compile_and_replicate
        outputs = computation(*computation_inputs)
    /usr/local/lib/python3.6/dist-packages/tensorflow/python/distribute/tpu_strategy.py:896 replicated_fn
        result[0] = fn(*replica_args, **replica_kwargs)
    /usr/local/lib/python3.6/dist-packages/tensorflow/python/keras/engine/training.py:541 train_step  **
        self.trainable_variables)
    /usr/local/lib/python3.6/dist-packages/tensorflow/python/keras/engine/training.py:1804 _minimize
        trainable_variables))
    /usr/local/lib/python3.6/dist-packages/tensorflow/python/keras/optimizer_v2/optimizer_v2.py:521 _aggregate_gradients
        filtered_grads_and_vars = _filter_grads(grads_and_vars)
    /usr/local/lib/python3.6/dist-packages/tensorflow/python/keras/optimizer_v2/optimizer_v2.py:1223 _filter_grads
        ([v.name for v in vars_with_empty_grads]))
    /usr/local/lib/python3.6/dist-packages/tensorflow/python/keras/optimizer_v2/optimizer_v2.py:1223 <listcomp>
        ([v.name for v in vars_with_empty_grads]))
    /usr/local/lib/python3.6/dist-packages/tensorflow/python/framework/ops.py:1123 name
        "Tensor.name is meaningless when eager execution is enabled.")

    AttributeError: Tensor.name is meaningless when eager execution is enabled.

None

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

“AttributeError：启用急切执行时，Tensor.name 毫无意义。”在 TPU 上进行“self.optimizer.apply_gradients”训练时的相关文章

PIL.Image.open和tf.image.decode_jpeg返回值的区别

我使用 PIL Image open 和 tf image decode jpeg 将图像文件解析为数组但发现PIL Image open 中的像素值与tf image decode jpeg不一样为什么会出现这种情况 Thanks 代
Tensorflow中通过字符串选择不同的模式

我正在尝试构建一个 VAE 网络我希望模型在不同的模式下做不同的事情我有三种模式训练相同和不同以及一个名为 interpolation mode 的函数它根据模式执行不同的操作我的代码如下所示 import tensorf
带有 CUDA 的 Tensorflow：导入错误

我已经按照 NVIDIA 教程中的说明一步步安装了 TensorFlow Ubuntu 16 04 桌面版 GTX 970 http www nvidia com object gpu accelerated applications te
无法加载动态库“libcudart.so.11.0”；

我尝试将 Tensorflow 2 7 0 与 GPU 结合使用但我不断遇到同样的问题 2022 02 03 08 32 31 822484 W tensorflow stream executor platform default ds
阻止 TensorFlow 访问 GPU？ [复制]

这个问题在这里已经有答案了有没有一种方法可以纯粹在CPU上运行TensorFlow 我机器上的所有内存都被运行 TensorFlow 的单独进程占用我尝试将 per process memory fraction 设置为 0 但未成功
Tensorflow 中的自定义资源

由于某些原因我需要为 Tensorflow 实现自定义资源我试图从查找表实现中获得灵感如果我理解得好的话我需要实现3个TF操作创建我的资源资源的初始化例如在查找表的情况下填充哈希表执行查找查找查询步骤为了促进实施我
GradientTape 根据损失函数是否被 tf.function 修饰给出不同的梯度

我发现计算的梯度取决于 tf function 装饰器的相互作用如下所示首先我为二元分类创建一些合成数据 tf random set seed 42 np random seed 42 x tf random normal 2 1 y
如何将张量流模型部署到azure ml工作台

我在用Azure ML Workbench执行二元分类到目前为止一切正常我有很好的准确性我想将模型部署为用于推理的 Web 服务我真的不知道从哪里开始 azure 提供了这个doc https learn microsoft co
如何将神经网络的输出限制在特定范围内？

我正在使用 Keras 进行回归任务并希望将输出限制在一个范围内例如 1 到 10 之间有没有办法保证这一点像这样编写自定义激活函数 a simple custom activation from keras import back
如何使用 Tensorflow-GPU 和 Keras 修复低易失性 GPU-Util？

我有一台 4 GPU 机器在上面运行带有 Keras 的 Tensorflow GPU 我的一些分类问题需要几个小时才能完成 nvidia smi returns Volatile GPU Util which never exceeds
如何使用一个模型中间层的输出作为另一个模型的输入？

我训练一个模型A并尝试使用中间层的输出name layer x 作为模型的附加输入B 我尝试像 Keras 文档一样使用中间层的输出https keras io getting started faq how can i obtain th
默认情况下，Keras 自定义层参数是不可训练的吗？

我在 Keras 中构建了一个简单的自定义层并惊讶地发现参数默认情况下未设置为可训练我可以通过显式设置可训练属性来使其工作我无法通过查看文档或代码来解释为什么会这样这是应该的样子还是我做错了什么导致默认情况下参数不可训练代码 im
TensorFlow HVX 加速支持

我成功构建并运行了测试应用程序https github com tensorflow tensorflow tree master tensorflow contrib hvx https github com tensorflow ten
Keras：如何保存模型或权重？

如果这个问题看起来很简单我很抱歉但是阅读 Keras 保存和恢复帮助页面 https www tensorflow org beta tutorials keras save and restore models https www t
LSTM - 一段时间后预测相同的常数值

我有一个变量我想预测未来 30 年的情况不幸的是我没有很多样品 df pd DataFrame FISCAL YEAR 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 199
在 Tensorflow 中每行选择一个元素的优雅方法

Given 一个矩阵A形状的 m n 张量I形状的 m 我想要一份清单J的元素来自A where J i A i I i 那是 I保存要从每行中选择的元素的索引A 背景我已经有了argmax A 1 现在我也想要max 我知道我可以使用r
将 tf.contrib.layers.xavier_initializer() 更改为 2.0.0

我该如何改变 tf contrib layers xavier initializer tf 版本 gt 2 0 0 所有代码 W1 tf get variable W1 shape self input size h size initi
如何从 Pandas DataFrame 转换为 Tensorflow BatchDataset 以进行 NLP？

老实说我想弄清楚如何转换数据集格式 pandasDataFrame或 numpy 数组转换为简单文本分类张量流模型可以训练用于情感分析的形式我使用的数据集类似于 IMDB 包含文本和标签正面或负面我看过的每个教程要么以不同的方式
大于 2GB 的 Tensorflow 图

我正在尝试优化一个大型张量流保存模型其中包含 10MB saving model pb 和 16GB 变量我尝试冻结我的图表并进行一些进一步的转换我已按照步骤操作https medium com google cloud optimi
移动设备上的 TensorFlow（Android、iOS、Windows Phone）

我目前正在寻找不同的深度学习框架特别是用于训练和部署卷积神经网络要求是它可以在带有 GPU 的普通 PC 上进行训练但训练后的模型必须部署在三个主要的移动操作系统上即 Android iOS 和 Windows Phone Ten

随机推荐

PHP - For循环仅返回数组中的最后一个变量

我有一个奇怪的问题 PHP 中的 for 循环仅返回数组中的最后一项该数组是使用 SimpleXML 从 XML 文件创建的代码应该返回这个
异步导致调试器跳转

我有这个代码 private async Task
如何从旋转角度计算 OpenCV 的透视变换？

我想从旋转角度和到对象的距离开始计算透视变换 warpPerspective 函数的矩阵怎么做我在 OE 上找到了代码示例程序如下 include
是否可以匹配来自 c# winforms 中两个不同数据集的图表中的两个系列数据

我正在开发一个应用程序根据工单编号绘制已检查的电路板和有缺陷的电路板在查看图表并比较实际数据后我意识到该系列与工单编号不匹配我不知道如何将两个系列与工单编号相匹配以获得正确的图表这是我首先提取的数据拉取 Boards Inspec
Magento 在我的 URL 中放入 -1 我可以通过编程方式删除吗？

我必须在我的 Magento 安装中创建许多新商店这样做的一件事是迫使我必须对整个网站进行大量的重新索引对于大多数人来说这根本不是问题但我的 URL 索引似乎总是存在问题由于某种原因当我重新索引我的 URL 时它希望在所有 U
@EntityListener 也可以与 @MappedSuperclass 一起使用吗？

Folks 如果我定义一个实体类并用它注释 MappedSuperclass and an EntityListener 监听器是否也会被子类中的生命周期事件调用 Example MappedSuperclass EntityListene
Scapy转发包

我刚刚用 scapy 学习 python 我阅读并使用了 Network Hacks Intensivkurs Angriff und Verteidigung mit Python 德语一书我想尝试使用 arp 欺骗进行中间人攻击我
写入文件的字符串不保留换行符

我正在尝试写一个String 冗长但包裹来自JTextArea 当字符串打印到控制台时格式与原来的格式相同Text Area 但是当我使用 BufferedWriter 将它们写入文件时它正在写入String在单行中以下片段可以重现
Google Closure 反编译器？

我正在寻找一种反编译由 Google Closure 编译的 JavaScript 的方法我确实找到了一个反编译器类 https code google com p closure compiler source browse lib r
为什么在c中初始化n维数组时必须显式指定n-1维

我知道我可以显式初始化一维数组如下所示 int a1d 0 1 2 3 4 5 这个数组将有 6 个元素 sizeof a1d sizeof a1d 0 是这样告诉我的我正在尝试使用二维或更多维数组来做到这一点 int a2d 0
如何使用 GraphAPI 从 Facebook 群组检索照片？

我想使用 GraphAPI 从 Facebook 群组检索照片基于FB Docs http developers facebook com docs reference api group 我看不出与照片有任何联系我想获取照片和上传照片
tf.estimator 错误：ResourceExhausted：打开的文件太多（TF 使 events.out.tfevents 文件保持打开状态）

多次调用后出现以下错误train model在下面的课程中 terminate called after throwing an instance of std system error what Resource temporarily
如何从文本数据中获取词袋？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我正在使用大型文本数据集来研究预测问题我正在实施词袋模型 http en wikipedia org wiki Bag of wor
如何在 Windows Phone 8 中为黑色椭圆添加白色边框

我在 Windows Phone 8 应用程序中使用上面给出的弹出窗口我的问题是对于黑色列表项无法将该项目与其他项目区分开来所以我的问题是如何为这个特定的黑名单项目添加圆形白色边框这是我在应用程序中使用的模板
用户级程序应该捕获哪些“致命”信号？

首先我知道过去也有过类似的问题 https stackoverflow com questions 5297062 recommended signals to catch 但这个问题没有得到正确的回答相反它转而建议如何捕捉信号所以
Spring Batch 中的 DeadlockLoserDataAccessException

我正在努力寻找解决方案希望有人可以提供帮助我们有一个 Spring Hibernate Wicket Tomcat Web 应用程序我们使用 Spring Batch 在后台执行作业有些每分钟执行一次并检查外部系统中的数据库表以查看
Spring-portlet POST ajax xmlHttpRequest

请任何有使用 Spring DispatcherPortlet 处理 post xmlHttpRequests 经验的人告诉我最好的方法是什么我使用 YUI io 模块和 Jackson Object Mapper 作为示例 Resour
资源 ID 是否应该出现在 url 中？

在资源 id 可以通过其他方式识别的情况下例如需要身份验证的页面的 current user 从 url 中省略 id 是一个好主意吗例如 students 1 homework to students homework 另外这会对网
yii 中条目的下一个/上一个按钮的最佳方式

我想知道为数据库中的条目创建下一个上一个按钮的最佳方法是什么假设我们有一个包含图像的表每个图像都有一个 ID 和一个路径如果当前图像的 ID 等于 9 如何获取下一个和上一个 ID 我已经在这里找到了解决方案https stacko
“AttributeError：启用急切执行时，Tensor.name 毫无意义。”在 TPU 上进行“self.optimizer.apply_gradients”训练时

我的代码在 GPU 上运行良好但对于 TPU 我从以下位置开始出错 self optimizer apply gradients zip gradients trainable vars 其中说AttributeError Tensor

“AttributeError：启用急切执行时，Tensor.name 毫无意义。”在 TPU 上进行“self.optimizer.apply_gradients”训练时

“AttributeError：启用急切执行时，Tensor.name 毫无意义。”在 TPU 上进行“self.optimizer.apply_gradients”训练时 的相关文章

随机推荐

热门标签

“AttributeError：启用急切执行时，Tensor.name 毫无意义。”在 TPU 上进行“self.optimizer.apply_gradients”训练时的相关文章