Keras 在调用 train_on_batch、fit 等时使用过多的 GPU 内存

2024-02-01

我一直在搞乱 Keras，到目前为止我很喜欢它。在使用相当深的网络时，我一直遇到一个大问题：当调用 model.train_on_batch 或 model.fit 等时，Keras 分配的 GPU 内存明显多于模型本身所需的内存。这并不是由于尝试在一些非常大的图像上进行训练而导致的，而是网络模型本身似乎需要大量 GPU 内存。我创建了这个玩具示例来展示我的意思。基本上是这样的：

我首先创建一个相当深的网络，并使用 model.summary() 获取网络所需的参数总数（在本例中为 206538153，相当于大约 826 MB）。然后，我使用 nvidia-smi 查看 Keras 分配了多少 GPU 内存，我可以看到它非常有意义（849 MB）。

然后我编译网络，并可以确认这不会增加 GPU 内存使用量。正如我们在本例中所看到的，此时我有近 1 GB 的可用 VRAM。

然后，我尝试向网络提供一个简单的 16x16 图像和一个 1x1 真实数据，然后一切都崩溃了，因为 Keras 再次开始分配大量内存，而原因对我来说并不明显。训练网络似乎比仅仅拥有模型需要更多的内存，这对我来说没有意义。我已经在其他框架中在此 GPU 上训练了更深层次的网络，因此这让我认为我使用 Keras 是错误的（或者我的设置或 Keras 中存在问题，但当然这很难确定）。

这是代码：

from scipy import misc
import numpy as np
from keras.models import Sequential
from keras.layers import Dense, Activation, Convolution2D, MaxPooling2D, Reshape, Flatten, ZeroPadding2D, Dropout
import os

model = Sequential()

model.add(Convolution2D(256, 3, 3, border_mode='same', input_shape=(16,16,1)))
model.add(MaxPooling2D(pool_size=(2,2), strides=(2,2)))
model.add(Convolution2D(512, 3, 3, border_mode='same'))
model.add(MaxPooling2D(pool_size=(2,2), strides=(2,2)))
model.add(Convolution2D(1024, 3, 3, border_mode='same'))
model.add(Convolution2D(1024, 3, 3, border_mode='same'))
model.add(Convolution2D(1024, 3, 3, border_mode='same'))
model.add(Convolution2D(1024, 3, 3, border_mode='same'))
model.add(Convolution2D(1024, 3, 3, border_mode='same'))
model.add(Convolution2D(1024, 3, 3, border_mode='same'))
model.add(Convolution2D(1024, 3, 3, border_mode='same'))
model.add(Convolution2D(1024, 3, 3, border_mode='same'))
model.add(Convolution2D(1024, 3, 3, border_mode='same'))
model.add(Convolution2D(1024, 3, 3, border_mode='same'))
model.add(Convolution2D(1024, 3, 3, border_mode='same'))
model.add(Convolution2D(1024, 3, 3, border_mode='same'))
model.add(Convolution2D(1024, 3, 3, border_mode='same'))
model.add(Convolution2D(1024, 3, 3, border_mode='same'))
model.add(Convolution2D(1024, 3, 3, border_mode='same'))
model.add(Convolution2D(1024, 3, 3, border_mode='same'))
model.add(Convolution2D(1024, 3, 3, border_mode='same'))
model.add(Convolution2D(1024, 3, 3, border_mode='same'))
model.add(Convolution2D(1024, 3, 3, border_mode='same'))
model.add(Convolution2D(1024, 3, 3, border_mode='same'))
model.add(Convolution2D(1024, 3, 3, border_mode='same'))
model.add(Convolution2D(1024, 3, 3, border_mode='same'))
model.add(MaxPooling2D(pool_size=(2,2), strides=(2,2)))
model.add(Convolution2D(256, 3, 3, border_mode='same'))
model.add(Convolution2D(32, 3, 3, border_mode='same'))
model.add(MaxPooling2D(pool_size=(2,2)))
model.add(Flatten())
model.add(Dense(4))
model.add(Dense(1))

model.summary()

os.system("nvidia-smi")
raw_input("Press Enter to continue...")    

model.compile(optimizer='sgd',
              loss='mse', 
              metrics=['accuracy'])

os.system("nvidia-smi")              
raw_input("Compiled model. Press Enter to continue...")

n_batches = 1
batch_size = 1
for ibatch in range(n_batches):
    x = np.random.rand(batch_size, 16,16,1)
    y = np.random.rand(batch_size, 1)

    os.system("nvidia-smi")
    raw_input("About to train one iteration. Press Enter to continue...")

    model.train_on_batch(x, y)         
    print("Trained one iteration")

这为我提供了以下输出：

Using Theano backend.
Using gpu device 0: GeForce GTX 960 (CNMeM is disabled, cuDNN 5103)
/usr/local/lib/python2.7/dist-packages/theano/sandbox/cuda/__init__.py:600: UserWarning: Your cuDNN version is more recent than the one Theano officially supports. If you see any problems, try updating Theano or downgrading cuDNN to version 5.
  warnings.warn(warn)
____________________________________________________________________________________________________
Layer (type)                     Output Shape          Param #     Connected to                     
====================================================================================================
convolution2d_1 (Convolution2D)  (None, 16, 16, 256)   2560        convolution2d_input_1[0][0]      
____________________________________________________________________________________________________
maxpooling2d_1 (MaxPooling2D)    (None, 8, 8, 256)     0           convolution2d_1[0][0]            
____________________________________________________________________________________________________
convolution2d_2 (Convolution2D)  (None, 8, 8, 512)     1180160     maxpooling2d_1[0][0]             
____________________________________________________________________________________________________
maxpooling2d_2 (MaxPooling2D)    (None, 4, 4, 512)     0           convolution2d_2[0][0]            
____________________________________________________________________________________________________
convolution2d_3 (Convolution2D)  (None, 4, 4, 1024)    4719616     maxpooling2d_2[0][0]             
____________________________________________________________________________________________________
convolution2d_4 (Convolution2D)  (None, 4, 4, 1024)    9438208     convolution2d_3[0][0]            
____________________________________________________________________________________________________
convolution2d_5 (Convolution2D)  (None, 4, 4, 1024)    9438208     convolution2d_4[0][0]            
____________________________________________________________________________________________________
convolution2d_6 (Convolution2D)  (None, 4, 4, 1024)    9438208     convolution2d_5[0][0]            
____________________________________________________________________________________________________
convolution2d_7 (Convolution2D)  (None, 4, 4, 1024)    9438208     convolution2d_6[0][0]            
____________________________________________________________________________________________________
convolution2d_8 (Convolution2D)  (None, 4, 4, 1024)    9438208     convolution2d_7[0][0]            
____________________________________________________________________________________________________
convolution2d_9 (Convolution2D)  (None, 4, 4, 1024)    9438208     convolution2d_8[0][0]            
____________________________________________________________________________________________________
convolution2d_10 (Convolution2D) (None, 4, 4, 1024)    9438208     convolution2d_9[0][0]            
____________________________________________________________________________________________________
convolution2d_11 (Convolution2D) (None, 4, 4, 1024)    9438208     convolution2d_10[0][0]           
____________________________________________________________________________________________________
convolution2d_12 (Convolution2D) (None, 4, 4, 1024)    9438208     convolution2d_11[0][0]           
____________________________________________________________________________________________________
convolution2d_13 (Convolution2D) (None, 4, 4, 1024)    9438208     convolution2d_12[0][0]           
____________________________________________________________________________________________________
convolution2d_14 (Convolution2D) (None, 4, 4, 1024)    9438208     convolution2d_13[0][0]           
____________________________________________________________________________________________________
convolution2d_15 (Convolution2D) (None, 4, 4, 1024)    9438208     convolution2d_14[0][0]           
____________________________________________________________________________________________________
convolution2d_16 (Convolution2D) (None, 4, 4, 1024)    9438208     convolution2d_15[0][0]           
____________________________________________________________________________________________________
convolution2d_17 (Convolution2D) (None, 4, 4, 1024)    9438208     convolution2d_16[0][0]           
____________________________________________________________________________________________________
convolution2d_18 (Convolution2D) (None, 4, 4, 1024)    9438208     convolution2d_17[0][0]           
____________________________________________________________________________________________________
convolution2d_19 (Convolution2D) (None, 4, 4, 1024)    9438208     convolution2d_18[0][0]           
____________________________________________________________________________________________________
convolution2d_20 (Convolution2D) (None, 4, 4, 1024)    9438208     convolution2d_19[0][0]           
____________________________________________________________________________________________________
convolution2d_21 (Convolution2D) (None, 4, 4, 1024)    9438208     convolution2d_20[0][0]           
____________________________________________________________________________________________________
convolution2d_22 (Convolution2D) (None, 4, 4, 1024)    9438208     convolution2d_21[0][0]           
____________________________________________________________________________________________________
convolution2d_23 (Convolution2D) (None, 4, 4, 1024)    9438208     convolution2d_22[0][0]           
____________________________________________________________________________________________________
convolution2d_24 (Convolution2D) (None, 4, 4, 1024)    9438208     convolution2d_23[0][0]           
____________________________________________________________________________________________________
maxpooling2d_3 (MaxPooling2D)    (None, 2, 2, 1024)    0           convolution2d_24[0][0]           
____________________________________________________________________________________________________
convolution2d_25 (Convolution2D) (None, 2, 2, 256)     2359552     maxpooling2d_3[0][0]             
____________________________________________________________________________________________________
convolution2d_26 (Convolution2D) (None, 2, 2, 32)      73760       convolution2d_25[0][0]           
____________________________________________________________________________________________________
maxpooling2d_4 (MaxPooling2D)    (None, 1, 1, 32)      0           convolution2d_26[0][0]           
____________________________________________________________________________________________________
flatten_1 (Flatten)              (None, 32)            0           maxpooling2d_4[0][0]             
____________________________________________________________________________________________________
dense_1 (Dense)                  (None, 4)             132         flatten_1[0][0]                  
____________________________________________________________________________________________________
dense_2 (Dense)                  (None, 1)             5           dense_1[0][0]                    
====================================================================================================
Total params: 206538153
____________________________________________________________________________________________________
None
Thu Oct  6 09:05:42 2016       
+------------------------------------------------------+                       
| NVIDIA-SMI 352.63     Driver Version: 352.63         |                       
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  GeForce GTX 960     Off  | 0000:01:00.0      On |                  N/A |
| 30%   37C    P2    28W / 120W |   1082MiB /  2044MiB |      9%      Default |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID  Type  Process name                               Usage      |
|=============================================================================|
|    0      1796    G   /usr/bin/X                                     155MiB |
|    0      2597    G   compiz                                          65MiB |
|    0      5966    C   python                                         849MiB |
+-----------------------------------------------------------------------------+
Press Enter to continue...
Thu Oct  6 09:05:44 2016       
+------------------------------------------------------+                       
| NVIDIA-SMI 352.63     Driver Version: 352.63         |                       
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  GeForce GTX 960     Off  | 0000:01:00.0      On |                  N/A |
| 30%   38C    P2    28W / 120W |   1082MiB /  2044MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID  Type  Process name                               Usage      |
|=============================================================================|
|    0      1796    G   /usr/bin/X                                     155MiB |
|    0      2597    G   compiz                                          65MiB |
|    0      5966    C   python                                         849MiB |
+-----------------------------------------------------------------------------+
Compiled model. Press Enter to continue...
Thu Oct  6 09:05:44 2016       
+------------------------------------------------------+                       
| NVIDIA-SMI 352.63     Driver Version: 352.63         |                       
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  GeForce GTX 960     Off  | 0000:01:00.0      On |                  N/A |
| 30%   38C    P2    28W / 120W |   1082MiB /  2044MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID  Type  Process name                               Usage      |
|=============================================================================|
|    0      1796    G   /usr/bin/X                                     155MiB |
|    0      2597    G   compiz                                          65MiB |
|    0      5966    C   python                                         849MiB |
+-----------------------------------------------------------------------------+
About to train one iteration. Press Enter to continue...
Error allocating 37748736 bytes of device memory (out of memory). Driver report 34205696 bytes free and 2144010240 bytes total 
Traceback (most recent call last):
  File "memtest.py", line 65, in <module>
    model.train_on_batch(x, y)         
  File "/usr/local/lib/python2.7/dist-packages/keras/models.py", line 712, in train_on_batch
    class_weight=class_weight)
  File "/usr/local/lib/python2.7/dist-packages/keras/engine/training.py", line 1221, in train_on_batch
    outputs = self.train_function(ins)
  File "/usr/local/lib/python2.7/dist-packages/keras/backend/theano_backend.py", line 717, in __call__
    return self.function(*inputs)
  File "/usr/local/lib/python2.7/dist-packages/theano/compile/function_module.py", line 871, in __call__
    storage_map=getattr(self.fn, 'storage_map', None))
  File "/usr/local/lib/python2.7/dist-packages/theano/gof/link.py", line 314, in raise_with_op
    reraise(exc_type, exc_value, exc_trace)
  File "/usr/local/lib/python2.7/dist-packages/theano/compile/function_module.py", line 859, in __call__
    outputs = self.fn()
MemoryError: Error allocating 37748736 bytes of device memory (out of memory).
Apply node that caused the error: GpuContiguous(GpuDimShuffle{3,2,0,1}.0)
Toposort index: 338
Inputs types: [CudaNdarrayType(float32, 4D)]
Inputs shapes: [(1024, 1024, 3, 3)]
Inputs strides: [(1, 1024, 3145728, 1048576)]
Inputs values: ['not shown']
Outputs clients: [[GpuDnnConv{algo='small', inplace=True}(GpuContiguous.0, GpuContiguous.0, GpuAllocEmpty.0, GpuDnnConvDesc{border_mode='half', subsample=(1, 1), conv_mode='conv', precision='float32'}.0, Constant{1.0}, Constant{0.0}), GpuDnnConvGradI{algo='none', inplace=True}(GpuContiguous.0, GpuContiguous.0, GpuAllocEmpty.0, GpuDnnConvDesc{border_mode='half', subsample=(1, 1), conv_mode='conv', precision='float32'}.0, Constant{1.0}, Constant{0.0})]]

HINT: Re-running with most Theano optimization disabled could give you a back-trace of when this node was created. This can be done with by setting the Theano flag 'optimizer=fast_compile'. If that does not work, Theano optimizations can be disabled with 'optimizer=None'.
HINT: Use the Theano flag 'exception_verbosity=high' for a debugprint and storage map footprint of this apply node.

有几点需要注意：

我尝试过 Theano 和 TensorFlow 后端。两者都有同样的问题，并且在同一行内存不足。在 TensorFlow 中，Keras 似乎预分配了大量内存（约 1.5 GB），因此 nvidia-smi 无法帮助我们跟踪那里发生的情况，但我得到了相同的内存不足异常。同样，这指向 Keras（我的使用）中的错误（尽管很难确定这些事情，但可能与我的设置有关）。
我尝试在 Theano 中使用 CNMEM，其行为类似于 TensorFlow：它预先分配大量内存（约 1.5 GB），但在同一位置崩溃。
有一些关于 CudNN 版本的警告。我尝试使用 CUDA 而不是 CudNN 运行 Theano 后端，并且得到了相同的错误，所以这不是问题的根源。
如果您想在自己的 GPU 上进行测试，您可能需要使网络更深/更浅，具体取决于您需要多少 GPU 内存来测试。
我的配置如下：Ubuntu 14.04、GeForce GTX 960、CUDA 7.5.18、CudNN 5.1.3、Python 2.7、Keras 1.1.0（通过pip安装）
我尝试更改模型的编译以使用不同的优化器和损失，但这似乎没有改变任何东西。
我尝试更改 train_on_batch 函数以使用 fit 代替，但它有同样的问题。
我在 StackOverflow 上看到了一个类似的问题 -为什么这个 Keras 模型需要超过 6GB 的内存？ https://stackoverflow.com/questions/35757151/why-does-this-keras-model-require-over-6gb-of-memory- 但据我所知，我的配置中没有这些问题。我从未安装过多个版本的 CUDA，并且我已经多次检查 PATH、LD_LIBRARY_PATH 和 CUDA_ROOT 变量，次数多得我无法计算。
Julius 建议激活参数本身会占用 GPU 内存。如果这是真的，有人可以更清楚地解释一下吗？据我所知，我尝试将卷积层的激活函数更改为明显硬编码的函数，没有可学习的参数，但这并没有改变任何东西。此外，这些参数似乎不太可能占用与网络本身其余部分几乎一样多的内存。
经过彻底的测试，我可以训练的最大网络大约有 453 MB 的参数，而我的 GPU RAM 大约为 2 GB。这是正常的吗？
在一些适合我的 GPU 的较小 CNN 上测试 Keras 后，我发现 GPU RAM 使用量突然出现峰值。如果我运行一个包含大约 100 MB 参数的网络，则在训练过程中 99% 的时间它将使用不到 200 MB 的 GPU RAM。但每隔一段时间，内存使用量就会飙升至约 1.3 GB。似乎可以肯定地认为正是这些尖峰导致了我的问题。我从未在其他框架中见过这些峰值，但它们的存在可能有充分的理由吗？如果有人知道导致它们的原因，并且有办法避免它们，请插话！

一个很常见的错误是忘记激活、梯度和优化器矩跟踪变量也使用 VRRAM，而不仅仅是参数，从而大大增加了内存使用量。反向概率计算本身使得训练阶段几乎需要神经网络前向/推理使用的 VRAM 的两倍，而 Adam 优化器则使空间使用量增加了三倍。

因此，在网络创建之初，仅分配参数。然而，当训练开始的时候。模型激活、反向传播计算和优化器的跟踪变量得到分配，从而大大增加了内存使用量。

为了训练更大的模型，人们：

use 模型并行性将权重和计算分散到不同的加速器上
use 梯度检查点 https://medium.com/tensorflow/fitting-larger-networks-into-memory-583e3c758ff9，这允许在反向传播过程中在更多计算与更低内存使用之间进行权衡。
可能使用一个内存高效优化器旨在减少跟踪变量的数量，例如阿达法特 https://arxiv.org/abs/1804.04235，您将找到所有流行深度学习框架的实现。

训练超大型模型的工具：

网格张量流https://arxiv.org/abs/1811.02084 https://arxiv.org/abs/1811.02084 https://github.com/tensorflow/mesh https://github.com/tensorflow/mesh
微软 DeepSpeed：https://github.com/microsoft/DeepSpeed https://github.com/microsoft/DeepSpeed https://www.deepspeed.ai/ https://www.deepspeed.ai/
Facebook FairScale：https://github.com/facebookresearch/fairscale https://github.com/facebookresearch/fairscale
威震天-LM：https://arxiv.org/abs/1909.08053 https://arxiv.org/abs/1909.08053 https://github.com/NVIDIA/Megatron-LM https://github.com/NVIDIA/Megatron-LM
有关 HuggingFace Transformers 中集成的文章：https://huggingface.co/blog/zero-deepspeed-fairscale https://huggingface.co/blog/zero-deepspeed-fairscale

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Keras 在调用 train_on_batch、fit 等时使用过多的 GPU 内存的相关文章

PHP 对象创建和内存使用

一个基本的虚拟类 class foo var bar 0 function foo function boo echo memory get usage echo n foo new foo echo memory get usage ec
Tensorflow Hub - 获取模型的输入形状和问题域？

我正在使用最新版本的tensorflow hub 想知道如何获取有关模型的预期输入形状以及模型属于什么类型的集合的信息例如有没有办法以这种方式在 Python 中加载模型后获取有关预期图像形状的信息 model hub load htt
Keras ZeroDivisionError：整数除法或以零为模

我正在尝试使用 Keras 和 Tensorflow 实现卷积神经网络我有以下代码 from keras models import Sequential from keras layers import Conv2D MaxPoolin
Objective-C 使用字符串池吗？

我知道Java https stackoverflow com questions 3801343 what is string pool in java and C http msdn microsoft com en us librar
sizeof（某个指针）总是等于四吗？

例如 sizeof char 返回 4 也是如此int long long 我尝试过的一切这有什么例外吗您得到的保证是sizeof char 1 没有其他保证包括不保证sizeof int sizeof double 实际上在 16
为什么不使用均方误差来解决分类问题？

我正在尝试使用 LSTM 解决一个简单的二元分类问题我正在尝试找出网络的正确损失函数问题是当我使用二元交叉熵作为损失函数时与使用均方误差 MSE 函数相比训练和测试的损失值相对较高经过研究我发现二元交叉熵应该用于分类问题 MS
ValueError：张量：（...）不是该图的元素

我正在使用 keras 的预训练模型在尝试获取预测时出现错误我在烧瓶服务器中有以下代码 from NeuralNetwork import app route uploadMultipleImages methods POST def
python中的内存错误

Traceback most recent call last File run 1341144766 1067082874 solution py line 27 in main File run 1341144766 106708287
Tensorflow conv2d_transpose 大小错误“out_backprop 的行数与计算的不匹配”

我正在张量流中创建一个卷积自动编码器我得到了这个确切的错误 tensorflow python framework errors InvalidArgumentError Conv2DBackpropInput Number of row
Tensorflow中通过字符串选择不同的模式

我正在尝试构建一个 VAE 网络我希望模型在不同的模式下做不同的事情我有三种模式训练相同和不同以及一个名为 interpolation mode 的函数它根据模式执行不同的操作我的代码如下所示 import tensorf
如何计算选择查询的最佳获取大小

在 JDBC 中默认获取大小为 10 但我想当我有一百万行时这不是最佳获取大小据我所知获取大小太低会降低性能但如果获取大小太高也会降低性能我怎样才能找到最佳尺寸这对数据库端有影响吗它会占用大量内存吗如果您的行很大请记住
Java Runtime.getRuntime().freeMemory() 问题

我搜索并看到了一些线程但没有一个能够解决我遇到的具体问题我正在尝试使用以下方式监视我的内存使用情况Runtime getRuntime freeMemory Runtime getRuntime maxMemory and Runtim
Tensorflow 中的自定义资源

由于某些原因我需要为 Tensorflow 实现自定义资源我试图从查找表实现中获得灵感如果我理解得好的话我需要实现3个TF操作创建我的资源资源的初始化例如在查找表的情况下填充哈希表执行查找查找查询步骤为了促进实施我
赋值运算符和复制构造函数有什么区别？

我不明白C 中赋值构造函数和复制构造函数之间的区别是这样的 class A public A cout lt lt A A lt lt endl The copy constructor A a b The assignment cons
在 C 中复制两个相邻字节的最快方法是什么？

好吧让我们从最明显的解决方案开始 memcpy Ptr const char a b 2 调用库函数的开销相当大编译器有时不会优化它我不会依赖编译器优化但即使 GCC 很聪明如果我将程序移植到带有垃圾编译器的更奇特的平台上我也不
Gradle 构建错误：内存不足

当我使用 gradle 构建时它失败并显示以下信息 OpenJDK 64 Bit Server VM warning INFO os commit memory 0x0000000788800000 89128960 0 failed e
Android上如何模拟后台Activity因内存不足而被系统杀死的过程？

我正在处理内存不足不再有后台进程问题当这种情况发生时我的活动处于后台并被杀死我正在尝试保存并加载实例状态来解决它但因为它并不是每次都会发生在这种情况下我应该如何测试我的活动 Thanks 您可以通过 adb 强制进程终止 g
无法获取未知等级的 Shape 长度

我有一个神经网络来自tf data数据生成器和tf keras模型如下简化版本因为太长 dataset A tf data Dataset反对与next x方法调用get next为了x train迭代器和next y方法调用get
如何将 tf.contrib.seq2seq.Helper 用于非嵌入数据？

我正在尝试使用 tf contrib seq2seq 模块对某些数据仅 float32 向量进行预测但我使用 TensorFlow 中的 seq2seq 模块找到的所有示例都用于翻译因此用于嵌入我正在努力准确理解 tf contr
我可以在我的机器上同时安装 python 2.7 和 3.5 的tensorflow吗？

目前我通过 Anaconda 在我的机器 MAC OX 上安装了 Python 2 7 Python 3 5 Tensorflow for Python 3 5 我也想在我的机器上安装 Tensorflow for Python 2 7 当

随机推荐

如何在 HTML 中点击时隐藏或显示 div

我有四个 HTMLdiv我想在单击时显示和隐藏它们如何执行此操作 div class image one img src image imageone png div div class image two img src image im
DOMPDF 不支持阿拉伯字符

任何人都可以帮助我吗我正在使用 DOMPDF 它运行良好但不适用于阿拉伯字符它显示了这些我尝试使用在 head 标签中还但它不起作用请在这件事上给予我帮助提前致谢在你的 html 中使用下面的样式
在我的 for 循环上进行计算，并希望使用某些函数在没有 for 循环的情况下进行计算

dec 0 1 data np array 100 200 300 400 500 我有一个像这样的 for 循环 y np zeros len data for i in range len data if i 0 y i 1 0 dec
使用 Moq 模拟数据集

我正在尝试开始使用起订量但无法找到任何好的资源来完成我需要的事情我有一个数据接口类它有一个 Get 方法该方法通过存储过程返回数据集这就是代码的编写方式我目前无法更改它因此必须以这种方式完成我想通过模拟数据集并返回数据来测试
iOS 13 中使用 Quickblox 和 CallKit 的传入视频通话问题

功能我在应用程序中实现了 QuickBlox 视频通话问题如果应用程序处于后台收件人不会收到来电通知结果视频通话在 iOS 12 上运行良好但在 iOS 13 上仅出现问题我查了很多链接来解决这个问题 https docs
Xcode 9 中 UINavigationController 方法 setToolbarHidden bug：无限计算自动布局约束导致 OOM

我有一个实例UINavigationController嵌套在UITabBarController 我使用导航控制器到达某个视图控制器选项卡栏仍然可见然后从该控制器转到第二个视图控制器选项卡栏不再可见在第二个视图控制器中一旦我调用
android 在发布版本中添加 DYNAMIC_RECEIVER_NOT_EXPORTED_PERMISSION

使用 api 级别 33 构建我的应用程序后 android 正在合并清单中添加新权限
更改 statelistdrawable 文本颜色 android 按钮

我正在开发 Android 应用程序我对按钮的每个状态按下正常有不同的背景可绘制和文本颜色我创建了 statelistdrawable 对象以便能够添加背景可绘制对象但我现在的问题是如何设置文本颜色有人可以帮忙吗 Button
单击提交按钮的值

这应该是非常简单的我正在检查是否使用 jquery 提交表单该表单有多个具有不同值的提交按钮
如何捕获 Mule foreach 作用域中的异常但保持进程继续进行？

我是 Mule ESB 的新手我创建了一个简单的流程循环遍历订单列表并调用 Magento API 来逐一更新订单状态我的问题是如果 foreach 范围内发生任何异常整个过程就会结束我尝试使用异常策略来捕获异常它确实捕获了异
ng-repeat 不适用于表但适用于列表

我有以下代码 Plnkr 上的代码 http plnkr co edit ULoa3SxPAFIPdHTvbguF p preview 我正在尝试使用ng repeat在一个表内但这是行不通的而相同的代码适用于列表 li 这是相同的片段
为 NSTableView 单元格绘制带有边框和背景的文本

我有一个基于单元格的表格视图我想在该表格视图中显示某种标签最好不必使用基于视图的表格视图是否有一种优雅的方式来实现类似此处示例 HTML 的效果最好还具有背景颜色如果您想坚持使用基于单元格的表格视图您可以子类化NSCell并覆盖
如何使用Google脚本中的URL参数过滤Google表格列中的数据？

我正在尝试 Google 脚本我想根据关键字参数显示数据稍后将 C 列称为数据过滤器它将根据参数关键字中搜索的内容进行显示例如在我之前的项目中我有一个参数作为分页 page 1 limit 10 现在我有一个新问题要解决即搜索
当用户关闭基于 django2.0 的网站上的选项卡或浏览器时，如何强制注销用户

我使用 Django 的内置登录注销功能使用 Django 身份验证这是用于登录的以下 url 模式网址 py from django contrib import admin from django urls import path
当存在不匹配记录时连接两个表

我正在尝试使用 1 个 sql 语句来生成我想要的结果我有 2 个名为 order 和customers 的表并尝试使用这样的查询 select a b customers name from order a customers b w
css :hover 伪类不起作用

我有一个CSS hover不产生任何结果的伪类我正在摆弄一些图像库代码但我设法得到了这个不起作用的代码片段我不明白为什么这里关于大小的一些更奇怪的 CSS 规则是因为这些 div 通常包含图像为了简单起见我删除了图像但保留了规
自制方法装饰器删除所有元数据，我该如何解决它？

我使用 NestJS 和 Nestjs swagger 模块来获取简单的 api 文档但我遇到了麻烦因为我需要验证服务的响应这就是我创建自制方法装饰器的原因但是当我使用它时我遇到了很大的麻烦来自另一个装饰器的所有元数据都丢失了
如何用htaccess重写url？

我必须建立一个银行搜索网站我想像下面的链接一样重写网址 bank https bankifsccode com 请参阅上面的链接在此当您选择银行和所有详细信息时网址也会发生变化我想在 codeigniter 网站中使用相同的 ur
$_GET、$_POST 和 $_REQUEST 未填充

我继承了一台运行着xitami pro服务器的XP机器并安装了PHP 5 2 17 因为我认为我可能需要VC6版本 PHP 的工作方式和phpinfo显示应有的样子当我做www domain com test php x y z test
Keras 在调用 train_on_batch、fit 等时使用过多的 GPU 内存

我一直在搞乱 Keras 到目前为止我很喜欢它在使用相当深的网络时我一直遇到一个大问题当调用 model train on batch 或 model fit 等时 Keras 分配的 GPU 内存明显多于模型本身所需的内存这并不是

Keras 在调用 train_on_batch、fit 等时使用过多的 GPU 内存

Keras 在调用 train_on_batch、fit 等时使用过多的 GPU 内存 的相关文章

随机推荐

热门标签

Keras 在调用 train_on_batch、fit 等时使用过多的 GPU 内存的相关文章