如何使用 TensorFlow 每次训练 CNN（MNIST 数据集）时获得相同的损失值？

2024-04-18

我想对卷积神经网络（使用 MNIST 数据集和 TensorFlow）进行几次新的训练，并且每次都获得相同的准确度结果。为了得到这个我：

保存未经训练的仅初始化的（global_variables_initializer）网络
每次我开始训练这个未经训练的网络时都加载
设置mnist.train.next_batch shuffle=False，这样图像序列每次都是相同的

我之前已经使用前馈网络（3 个隐藏层）完成了此操作，每次运行此 python 脚本时，我都会得到完全相同的损失和准确性值。

But,将模型从前馈网络更改为卷积神经网络的“相同”脚本使得每次运行脚本时损失/准确性略有不同。

因此，我将批量大小减少到 1，并查找每个图像的损失值，发现前两个图像始终具有相同的损失值，但其余的每次运行脚本时都会略有不同。

知道为什么吗？

感谢 @AlexandrePassos 评论，我在 TensorFlow 中搜索确定性/非确定性操作。

因此，目前所有使用 CUDA 原子并在 GPU 上运行的操作都是不确定的。
请参阅此链接：https://github.com/tensorflow/tensorflow/issues/3103 https://github.com/tensorflow/tensorflow/issues/3103

如果有人知道在 GPU 上使用 TensorFlow 和确定性操作实现 CNN 的方法，请：如何在 GPU 上的 TensorFlow 中创建具有确定性操作的 CNN？ https://stackoverflow.com/questions/44800055/how-to-create-a-cnn-with-deterministic-operations-in-tensorflow-on-a-gpu

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何使用 TensorFlow 每次训练 CNN（MNIST 数据集）时获得相同的损失值？的相关文章

Django 是否使用一个线程来处理 WSGI 或 Gunicorn 中的多个请求？

根据标题我想知道 Django 在通过 WSGI 或 Gunicorn 运行时是否使用一个线程来处理多个请求我知道从不应该访问的地方访问请求是一种不好的做法但我仍然想这样做我认为有充分的理由例如在我的自定义模板加载器中访问当前用户
用于在 Windows 中自动执行桌面活动的 Python 代码

我想使用 Python 在 Windows 环境中自动化桌面活动怎样才能做到呢一些例子也会有帮助我所说的桌面活动是指控制鼠标和键盘访问活动窗口属性双击桌面上的图标最小化和最大化窗口通过键盘向输入弹出窗口输入数据等操作看一下S
Python3 http.server：将日志保存到文件中

我使用Python3 6编写了一个简单的HTTP服务器来重定向所有请求我写的文件可以找到here https github com kmahyyg learn py3 blob master antiscanhttp py 我可以在 Ub
“初始化 MCI 时出现问题”播放声音问题

我正在尝试使用 Playsound 播放代码文件夹中的文件但是每次运行代码时它似乎都能够调用该文件但我总是收到以下输出 playsound PlaysoundException Error 277 for command open p
根据两个预先计算的直方图报告两个样本的 K-S 统计量

Problem 在这里我绘制了存储在文本文件中的 2 个数据集在列表中 dataset 每个包含 218 亿个数据点这使得数据太大而无法作为数组保存在内存中我仍然能够将它们绘制为直方图但我不确定如何通过2 样本KS测试 http
AES 会话密钥的 RSA 解密失败，并显示“AttributeError：‘bytes’对象没有属性‘n’”

我正在努力在 Python 3 6 上从 PyCryptodome 实现公钥加密当我尝试创建对称加密密钥并加密解密变量时一切正常但是当我引入 RSA 和 PKCS1 OAEP 的那一刻一切就都顺理成章了 session key加密
如何使用Python在没有窗口的情况下在屏幕上显示文本

问题我需要在没有窗口的情况下直接将文本写入屏幕文本需要显示在所有其他窗口和全屏应用程序之上并且不应以任何方式单击或交互 Example The text doesn t need to have a transparent backg
如何使用 tweepy 仅提取主题标签中的文本？

我想为我的情感分析项目提取主题标签但是我得到了一个字典列表其中包含所有主题标签及其在推文中的索引我只想要文字我的代码 data tweepy Cursor api search q since a i until b i items
使用 Python 读取 App Engine 上的文件？

是否可以在 GAE 上打开文件来读取其内容并获取最后修改的标签我收到 IOError Errno 13 文件无法访问我知道我无法删除或更新但我相信阅读应该是可能的有人遇到过类似的问题吗 os stat f r st mtim 您可能
python 中的子进程调用以使用 JAVA_OPTS 调用 java jar 文件

示例代码 import subprocess subprocess call java jar temp jar 如何在上面的命令中指定JAVA OPTS 当我使用上述命令时我收到 java lang OutOfMemoryError 无
如何编辑 QProgressBar 的样式表

我无法在我的应用程序中编辑进度条的颜色仅编辑文本颜色 pyhton 3 9 PySide6 QT Creator 7 0 2 Python应用程序 https i stack imgur com 6hKFI png import sys
在 Python 中进行模糊键查找的最佳方法？

我遇到一个问题我需要在哈希映射中进行模糊查找即返回与最接近查询的键相对应的值在我的例子中是通过 Levenshtein 距离测量的我目前的方法是子类化dict使用特殊的查找方法计算所有键的编辑距离然后返回得分最低的键的值基本上是
为什么类型提示“float”接受“int”，而它甚至不是子类？

一方面我了解到数字可以int or float应将类型注释为float 来源 PEP 484 类型提示 https www python org dev peps pep 0484 the numeric tower and 这个计算器问
为什么你可以在字符串上重载 __radd__ 而不是 __rmod__ ？

在Python中您可以覆盖右和左加法运算符
如何配置应用程序中的所有记录器

Python 的日志记录模块允许模块或类定义自己的记录器不同的记录器可以有不同的处理程序其中一些可能选择记录到文件而另一些则选择记录到标准输出现在我的应用程序使用其中几个模块每个模块都有自己的记录器这些记录器具有各种处理程序
如何在 VS Code 宏中将焦点返回到编辑器，将 Python 文本发送到调试控制台？

我尝试按键绑定宏以将 python 文本发送到调试控制台并将焦点返回到 Visual Studio Code 中的编辑器这是我尝试过的安装了vscode python https marketplace visualstudio com
使用 MinGW 链接到 Python

我不想创建一个嵌入Python解释器的跨平台程序并用MinGW编译它但是 Python 二进制发行版没有提供 MinGW 链接的库仅python32 lib对于 Visual C 并且 Python 源包不提供使用 MinGW 编译的
从多个大型 NetCDF 文件中提取数据的快速/高效方法

我只需要从全局网格中提取特定节点集的数据由纬度经度坐标按 5000 10000 的顺序给出这些数据是水力参数的时间序列例如波高全局数据集很大因此分为许多 NetCDF 文件每个 NetCDF 文件大小约为 5GB 包含整个
Python中矩阵元素的双重求和

基于下面的简化示例我想在我的代码中 from sympy import import numpy as np init printing x y symbols x y mat Matrix x 1 1 y X 1 2 3 Y 10 20
从受密码保护的 Excel 文件到 pandas DataFrame

我可以使用以下命令打开受密码保护的 Excel 文件 import sys import win32com client xlApp win32com client Dispatch Excel Application print Exce

随机推荐

扩展C++字符串成员函数

我需要进行不区分大小写的查找并发现以下代码可以解决问题 bool ci equal char ch1 char ch2 return toupper unsigned char ch1 toupper unsigned char ch2
AngularJS 和休息服务

我最近开始尝试AngularJS 我正在构建一个简单的 html5 应用程序来更新MySQL数据库索引 html
获取 LinkedIn 分享计数 JSONP

使用 LinkedIn API 我想获取 URL 的分享计数 https www linkedin com countserv count share url http www linkedin com format json 但这给了我一
从Java调用Android WebView中的jQuery函数？

我正在尝试调用在 html 中定义的 javascript 函数喜欢 WebView loadUrl javascript hoge 我可以调用非 jQuery 函数但无法调用我在 document ready function jQu
IllegalStateException：getAttribute：会话已失效

我的第一个 JSF IceFaces 版本 1 8 2 应用程序在 JBoss 5 1 0 上运行时遇到问题一段时间后我收到一个异常告诉我有关会话问题这很奇怪因为我根本不在我的代码中使用会话以下日志显示由于此错误来自 JBoss
指向动态分配的 boost multi_array 中的类的指针，未编译

我对 C 和 Boost 还很陌生我想要 world 类的对象有一个名为 chunk 类型为 octreenode 的数组以前我有一个普通的一维数组这工作得很好现在我尝试转向使用具有 Boost 的 multi array 功能的
使用 PHP 从多选下拉列表中获取数据并插入到 MySQL 中

我的数据库中有一个使用以下命令创建的日期列表SET数据类型 SET Mon Tue Wed Thr Fri Sat Sun 我希望用户能够使用多选下拉列表选择多天放入数据库
如何在 WPF 中按名称查找样式触发器嵌入元素？

首先问题的核心如果通过样式触发器将一个元素指定为 ContentControl 的内容我似乎无法按名称找到它现在了解更多详细信息我有一个面板其布局和功能根据其数据上下文而有很大差异这是来自错误库的错误当该错误为空时它是一
根据合并请求触发 gitlab-ci 中的作业

是否可以仅根据合并请求从 gitlab ci 运行作业现在我们有一个包含大量测试的大型整体项目但我们只想在合并到分支 master 之前运行测试嗯目前还没有内置但是您自己也不是不可能 Gitlab 允许trigger https
支持 __getitem__ 的类的 Python 类型提示

我想向一个函数添加类型提示该函数将接受带有 getitem 方法例如在 def my function hasitems locator hasitems locator 我不想限制hasitems成为特定类型例如list or d
如何将查询字符串传递给backbone.js 路由

我正在使用 Backbone js 和 jQuery mobile jQuery 移动路由被禁用我仅将库用于 UI 除了选择页面转换之外我一切正常我需要将页面转换向上切片淡入淡出向下滑动传递到主干路由器因为转换根据用户来自的
获取数据工厂中单个管道执行的成本

我正在考虑使用 Azure 数据工厂 V2 进行集成导入并想知道是否有办法跟踪正在运行的各个管道的成本例如如果我有 3 个管道代表 3 个不同的集成是否有办法查看每个管道产生的成本还有一种方法可以近乎实时地执行此操作以便在一个
我们应该使用 setTargetFragment() 吗？我认为 Fragments 不应该互相通信

Android开发者教程建议我使用片段的宿主活动来传递数据等等那么为什么有一个设置获取目标片段方法呢到目前为止我的应用程序包含一个主机活动和一个片段其中有一个启动按钮DialogFragment 其中有一个按钮可以启动另一个Dia
Pandas 会影响 Rapidfuzz 匹配的结果吗？

我正在碰壁如果我在 pandas 数据帧内运行 Rapidfuzz 以及单独运行它它会为字符串分数相似性提供不同的结果吗为什么地址相似度 2 和最后一行的结果不同 from rapidfuzz import process utils
在 Android 中使用带有自定义标签的块模板引擎

我正在尝试在 android 中使用 chunk 我需要这样的东西 Suppose 以下是标签 tags 世界世界 c 丹尼斯里奇苹果工作 Input HELLO world C 是由 c 而java是由 java 编写的 hola
在 R 中安装插入符包时出现依赖问题

我正在尝试安装 R 包caret 这给了我ERROR dependencies ggplot2 reshape2 BradleyTerry2 are not available for package caret 我尝试单独安装其中的每一个
如何在SCSS中获取数组的$values？

我正在制作自己的插件通过编写单个插件自动进行多个媒体查询 includeSCSS 中的行所以当我输入时 include medias bp values width 输出应该是这样的 media all and min width 56
unix select() 调用：如何组合 fd_sets？

我正在用 C 语言为 Linux 编写一个应用程序它使用 2 个独立的第三方库这两个库都是异步的并使用 select 他们还提供了一个 API 可以返回他们等待的文件描述符我的目的是将它们传递给我自己的 select 然后在设置了自己
toDF 问题，值 toDF 不是 org.apache.spark.rdd.RDD 的成员

我已附加错误 value toDF is not a member of org apache spark rdd RDD 的代码片段我正在使用 scala 2 11 8 和 Spark 2 0 0 您能帮我解决 API toDF 的这个
如何使用 TensorFlow 每次训练 CNN（MNIST 数据集）时获得相同的损失值？

我想对卷积神经网络使用 MNIST 数据集和 TensorFlow 进行几次新的训练并且每次都获得相同的准确度结果为了得到这个我保存未经训练的仅初始化的 global variables initializer 网络每次我开始训练

如何使用 TensorFlow 每次训练 CNN（MNIST 数据集）时获得相同的损失值？

如何使用 TensorFlow 每次训练 CNN（MNIST 数据集）时获得相同的损失值？ 的相关文章

随机推荐

热门标签

如何使用 TensorFlow 每次训练 CNN（MNIST 数据集）时获得相同的损失值？的相关文章