TensorFlow 和 Keras 的相同实现之间的不同行为

2024-01-06

我的机器上有 TensorFlow 1.9 和 Keras 2.0.8。当使用一些玩具数据训练神经网络时，TensorFlow 和 Keras 之间产生的训练曲线非常不同，我不明白为什么。

对于 Keras 实现，网络学习得很好，损失持续减少，而对于 TensorFlow 实现，网络没有学到任何东西，损失也没有减少。我试图确保两种实现都使用相同的超参数。为什么行为如此不同？

网络本身有两个输入：图像和向量。然后，在连接之前，它们会通过自己的层。

这是我的实现。

张量流：

# Create the placeholders
input1 = tf.placeholder("float", [None, 64, 64, 3])
input2 = tf.placeholder("float", [None, 4])
label = tf.placeholder("float", [None, 4])

# Build the TensorFlow network
# Input 1
x1 = tf.layers.conv2d(inputs=input1, filters=30, kernel_size=[5, 5], strides=(2, 2), padding='valid', activation=tf.nn.relu)
x1 = tf.layers.conv2d(inputs=x1, filters=30, kernel_size=[5, 5], strides=(2, 2), padding='valid', activation=tf.nn.relu)
x1 = tf.layers.flatten(x1)
x1 = tf.layers.dense(inputs=x1, units=30)
# Input 2
x2 = tf.layers.dense(inputs=input2, units=30, activation=tf.nn.relu)
# Output
x3 = tf.concat(values=[x1, x2], axis=1)
x3 = tf.layers.dense(inputs=x3, units=30)
prediction = tf.layers.dense(inputs=x3, units=4)

# Define the optimisation
loss = tf.reduce_mean(tf.square(label - prediction))
train_op = tf.train.AdamOptimizer(learning_rate=0.001).minimize(loss)

# Train the model
sess = tf.Session()
sess.run(tf.global_variables_initializer())
training_feed = {input1: training_input1_data, input2: training_input2_data, label: training_label_data}
validation_feed = {input1: validation_input1_data, input2: validation_input2_data, label: validation_label_data}
for epoch_num in range(30):
    train_loss, _ = sess.run([loss, train_op], feed_dict=training_feed)
    val_loss = sess.run(loss, feed_dict=validation_feed)

Keras:

# Build the keras network
# Input 1
input1 = Input(shape=(64, 64, 3), name='input1')
x1 = Conv2D(filters=30, kernel_size=5, strides=(2, 2), padding='valid', activation='relu')(input1)
x1 = Conv2D(filters=30, kernel_size=5, strides=(2, 2), padding='valid', activation='relu')(x1)
x1 = Flatten()(x1)
x1 = Dense(units=30, activation='relu')(x1)
# Input 2
input2 = Input(shape=(4,), name='input2')
x2 = Dense(units=30, activation='relu')(input2)
# Output
x3 = keras.layers.concatenate([x1, x2])
x3 = Dense(units=30, activation='relu')(x3)
prediction = Dense(units=4, activation='linear', name='output')(x3)

# Define the optimisation
model = Model(inputs=[input1, input2], outputs=[prediction])
adam = optimizers.Adam(lr=0.001)
model.compile(optimizer=adam, loss='mse')

# Train the model
training_inputs = {'input1': training_input1_data, 'input2': training_input2_data}
training_labels = {'output': training_label_data}
validation_inputs = {'input1': validation_images, 'input2': validation_state_diffs}
validation_labels = {'output': validation_label_data}
callback = PlotCallback()
model.fit(x=training_inputs, y=training_labels, validation_data=(validation_inputs, validation_labels), batch_size=len(training_label_data[0]), epochs=30)

这是训练曲线（每次实现两次运行）。

张量流：

Keras:

在仔细检查您的实现后，我发现除了批量大小之外，所有超参数都匹配。我不同意@Ultraviolet 的答案，因为默认kernel_initializer of tf.layers.conv2d也是 Xavier（参见 TF 实现conv2d https://github.com/tensorflow/tensorflow/blob/r1.9/tensorflow/python/layers/convolutional.py#L323).

由于以下两个原因，学习曲线不匹配：

Keras 实现（版本 2）中的参数比 TF 实现（版本 1）中的参数接收到更多的更新。在版本 1 中，您在每个时期将完整数据集同时输入到网络中。这导致只有 30 个 adam 更新。相比之下，版本 2 的性能30 * ceil(len(training_label_data)/batch_size)亚当更新，与batch_size=4.
版本 2 的更新比版本 1 的更新噪音更大，因为梯度是在更少的样本上平均的。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

tensorflow

Keras

TensorFlow 和 Keras 的相同实现之间的不同行为的相关文章

Django 营业时间

我想添加诊所的营业时间我已经对此进行了调查在 Django 中实现开放时间的任何现有解决方案 https stackoverflow com questions 8128143 any existing solution to imp
用于读取类似 CSV 行的 Python 正则表达式

我想解析传入的类似 CSV 的数据行值用逗号分隔逗号周围可能有前导和尾随空格并且可以用或引用例如这是有效的行 data1 data2 data3 data4 data5 但这是格式错误的 data1 data2 da ta3
如何检查给定的数字是否是2的幂？

下面的代码不适用于某些输入 a i set 1 while i lt 10000 a add i i lt lt 1 N int input if N in a print True else print False 我最初的想法是检查每个
FastAPI UploadFile 与 Flask 相比慢

我创建了一个端点如下所示 app post report upload def create upload files files UploadFile File try with open files filename wb as wf
Python MySQLdb：connection.close() VS。光标.close()

如果我使用MySQLdb通过Python连接到MySQL Server 我创建一个connection and a cursor像这样 connection MySQLdb connect cursor connection cursor
如何使用 Python 在表单中选择选项？

我想知道如何以格式如下的形式选择选项 td align left td
python 硒按名称查找元素

查找电子邮件输入的正确代码是什么https accounts google com ServiceLogin html 是
使用最新值进行采样

考虑以下系列 created at 2014 01 27 21 50 05 040961 80000 00 2014 03 12 18 46 45 517968 79900 00 2014 09 05 20 54 17 991260 636
在 Python 中引发异常的正确方法是什么？ [复制]

这个问题在这里已经有答案了这是简单的代码 import sys class EmptyArgs StandardError pass if name main The first way to raise an exception if
如何在 tkinter 后台运行函数[重复]

这个问题在这里已经有答案了我是 GUI 编程新手我想用 tkinter 编写一个 Python 程序我想要它做的就是在后台运行一个可以通过 GUI 影响的简单函数该函数从 0 计数到无穷大直到按下按钮为止至少这是我想要它做的但
numpy 向量化而不是 for 循环

我用 Python 写了一些代码运行良好但速度很慢我认为是由于 for 循环我希望可以使用 numpy 命令加速以下操作让我定义目标假设我有一个 2D numpy 数组all CMs尺寸row x col 例如考虑一个6x11数
配置 Django 和 Google 云存储？

I am not使用应用引擎我有一个在虚拟机上运行的普通 Django 应用程序我想使用 Google Cloud Storage 来提供静态文件以及上传提供媒体文件我有一个水桶如何将 Django 应用程序链接到我的存储桶我
如何读取多个文件并将它们合并到一个 pandas 数据框中？

我想读取位于同一目录中的多个文件然后将它们合并到一个 pandas 数据框中如果我这样做的话它会起作用 import pandas as pd df1 pd read csv data 12015 csv df2 pd read csv
数据类和属性装饰器

我一直在阅读 Python 3 7 的数据类作为命名元组的替代品我通常在必须将数据分组到结构中时使用它我想知道数据类是否与属性装饰器兼容以便为数据类的数据元素定义 getter 和 setter 函数如果是这样是否在某处进行了描
将整数转换为特定格式的十六进制字符串

我是 python 新手有以下问题我需要将整数转换为 6 个字节的十六进制字符串例如 281473900746245 gt xFF xFF xBF xDE x16 x05 十六进制字符串的格式很重要 int 值的长度是可变的格式 0
如何在Python中不使用库函数将字符串转换为整数？

我正在尝试转换 a 546 to a 546 不使用任何库函数我能想到的最纯粹 gt gt gt a 546 gt gt gt result 0 gt gt gt for digit in a result 10 for d in 01
Docker Python 脚本找不到文件

我已经成功构建了一个 Docker 容器并将应用程序的文件复制到 Dockerfile 中的容器中但是我正在尝试执行引用输入文件在 Docker 构建期间复制到容器中的 Python 脚本我似乎无法弄清楚为什么我的脚本告诉我它无
基于 Web 请求在 Airflow 上运行作业

我想知道是否可以在通过 HTTP 收到请求时执行气流任务我对 Airflow 的调度部分不感兴趣我只是想用它来代替芹菜因此示例操作如下所示用户提交一份表格请求某些报告后端接收请求并向用户发送请求已收到的通知然后后端使用 Ai
从 HDF5 文件中删除信息

我意识到 SO 用户以前曾问过这个问题question https stackoverflow com questions 1124994 removing data from a hdf5 file rq 1但它是在 2009 年被问到的
处理错误“TypeError: Expected tuple, got str”将 CSV 加载到 pandas 多级和多索引 (pandas)

我正在尝试加载 CSV 文件这个文件 https drive google com file d 13a eVeSzy6HkhffQw32S57U hm5YCj0 view usp sharing 创建一个多索引多级数据帧它有5 五指

随机推荐

连接到上游时 NodeJS connect() 失败（111：连接被拒绝）

我今天遇到一个问题我的 Elastic Beanstalk 应用程序突然将我发送到502 Bad Gateway页现在我过去遇到过这个问题发生这种情况的原因是 Node 命令无法启动我的服务器我通过输入解决了这个问题Node com
MySQL，错误 126：表的密钥文件不正确

我阅读了以下相关问题但答复并不令我满意 MySQL 126 表的密钥文件不正确 https stackoverflow com q 2011050 570796 问题运行查询时出现此错误错误 126 HY000 表的密钥文件不正确问
设备在 google Nexus 手机中没有 com.google.android.gsf 包

我正在 Google Nexus 手机中测试我的应用程序但它在启动过程中强制关闭并出现异常设备没有包 com google android gsf 有任何提示吗我已在三星 Galaxy S3 和三星 Galaxy Y 手机中成功测试
将新 Pod 添加到现有项目时“无法发出预编译标头”

我有一个使用 Obj C 的项目因为我面临的问题是在将新的 pod 添加到项目中后无法发出预编译标头在项目中我正在使用桥接标头来处理 obj C 和 swift 在 Pod 文件中我添加了SendBird 我的 Pod 文件是 Po
多态性不适用于相同数据类型（基类和继承类）的函数返回值

据我所知要重写继承类中的虚函数该函数的返回值数据类型应与基类函数相同但是如果您返回的指针或值属于从原始函数的返回值的类继承的类则编译器将接受更改返回值如下所示 include
如何使用基于键的 linq 更改字典的值？

我有一本字典其类型为 Dictionary
如何在 ASP.NET Webform 中应用单元测试

我正在开发一个 3 层的 asp net webforms 网站 UI BLL 和 DAL 该网站已经开发出来但我喜欢对每种形式的单元测试有更多的控制在特定输入处传递特定值以供我查看应用程序是否存活我已经研究了 NUnit 但是在
在 rxjs 中实现 fromSubscriber

我今天遇到一个有趣的问题我正在开发一个可以上传文件的应用程序并且我们想要实现一个进度栏该应用程序是使用 React Redux Redux Observable 编写的我想调度上传进度的操作这是我为实现它所做的事情 withPro
Django：使用对象作为字典键是否合理？

在 django 中使用对象作为字典的键是否合理我已经这样做了并且有效但我想知道这是否是最佳实践或者是否会造成我现在无法预见的困难我正在开展一个涉及教育标准的项目我的字典的结构类似于 Subject Standards 主题的模型
使用 python 的 Firestore 身份验证电话和电子邮件 OTP

我正在尝试在 python 中添加代码以将 OTP 发送到电子邮件和电话进行验证但我找不到该代码我找到了使用 reCAPTCHA verifier 的 JavaScript 代码但没有找到 python 的代码他们有像 JavaSc
TFS 2010工作项尚未准备好保存，但没有验证项

我试图以编程方式保存 TFS 工作项但总是遇到异常 TF237124 Work Item is not ready to save 现在我明白这告诉我什么了工作项缺少必填字段或类似字段并且我的代码通过调用来预测这一点 ArrayLi
android：即时反映 UI 语言更改，无需重新加载/重新启动应用程序

我的应用程序中有一个设置允许用户选择不同的本地化语言即Chinese German etc 我想做的是一旦用户做出选择立即使用当前所选语言的字符串更新布局当然我希望将语言更改传播到所有当前活动而无需重新加载应用程序我发现了
导入错误：找不到 IProgress。尽管已安装，但请更新 jupyter 和 ipywidgets

我正在使用 jupyter 笔记本并安装 ipywidgets 7 4 2 widgetsnbextension pandas profiling 0 0 我也跑了 jupyter nbextension enable py widgets
如何使用 mongodb 在内部数组中搜索字符串？

如何在多维数组中搜索值例如我想搜索examplemongodb中以下数据中的关键字我曾经从命令获取所有数据 gt db info find id ObjectId 4f74737cc3a51043d26f4b90 id 12345 in
在flutter中使用Mockito模拟第3方库的静态方法的最佳方法是什么

我现在遵循的方法是围绕提供静态方法的类创建一个包装器然后模拟这个包装器而不是模拟真正的类如下所示 class TestClass final ThirdPartyClassWrapper thirdPartyClassWrapper T
如果语句包含 UNION、INTERSECT 或 EXCEPT 运算符（变体），则 ORDER BY 项必须出现在选择列表中

我已经阅读了我能找到的与此错误相关的所有问题但它们并没有完全描述这种情况在其他情况下人们正在做一些事情例如按顺序仅引用一个别名表从联合的一侧我理解为什么 SQLS 在我读过的所有其他问题中抱怨这个特定的错误我不明白为什么 SQ
列计数与第 1 行 JAVA mysql 的值计数不匹配[重复]

这个问题在这里已经有答案了我遇到了一个错误 java sql SQLException Column count doesn t match value count at row 1 at com mysql jdbc SQLError
将引导模式滚动到底部时启用按钮

我想强制用户阅读模式内的所有协议这个想法很简单如果他们不滚动到文本的最后一行该按钮仍然禁用但该按钮未启用这是我的代码 JavaScript agreement scroll function if this scrollTop t
暂时修复后恢复随机种子的最佳方法是什么？

这是取消种子随机数生成器的唯一方法吗 np random seed int time time 如果您希望在循环中重复某些代码例如测试而其他代码希望每个循环都是随机的那么在设置种子后如何将种子重置为随机数生成器下面的代码说明
TensorFlow 和 Keras 的相同实现之间的不同行为

我的机器上有 TensorFlow 1 9 和 Keras 2 0 8 当使用一些玩具数据训练神经网络时 TensorFlow 和 Keras 之间产生的训练曲线非常不同我不明白为什么对于 Keras 实现网络学习得很好损失持续减少

TensorFlow 和 Keras 的相同实现之间的不同行为

TensorFlow 和 Keras 的相同实现之间的不同行为 的相关文章

随机推荐

热门标签

TensorFlow 和 Keras 的相同实现之间的不同行为的相关文章