为什么我的 GradientDescentOptimizer 会产生 NaN？

2024-06-24

我目前正在修改 Andrew Ng 教授在 Coursera 上的“机器学习”课程作业，但我陷入了逻辑回归部分。

filename = 'data/ex2data1.txt'
data = np.loadtxt(filename, delimiter = ",", unpack = True)

# Data matrices
xtr = np.transpose(np.array(data[:-1]))
ytr = np.transpose(np.array(data[-1:]))

# Initial weights
W = tf.Variable(tf.zeros([2,1], dtype = tf.float64))

# Bias
b = tf.Variable(tf.zeros([1], dtype = tf.float64))

# Cost function
y_ = tf.nn.sigmoid(tf.matmul(xtr,W) + b)

cost = -tf.reduce_mean(ytr*tf.log(y_) + (1-ytr)*tf.log(1-y_))
optimize = tf.train.GradientDescentOptimizer(0.01).minimize(cost)

corr = tf.equal(tf.argmax(ytr,1), tf.argmax(y_,1))
acc = tf.reduce_mean(tf.cast(corr, tf.float64))

init = tf.initialize_all_variables()

with tf.Session() as sess:
    sess.run(init)
    print(sess.run(cost))
    for _ in range(3):
        sess.run(optimize)
        print(sess.run(cost))

这产生了答案：

0.69314718056
nan
nan
nan

成本函数的第一个结果是正确的，但接下来的结果应该是：

3.0133
1.5207
0.7336

相反，我得到了一堆 NaN。我尝试过降低学习率，但都无济于事。我究竟做错了什么？是否可以在 TensorFlow 中重现此作业？

PS：其他 python 解决方案似乎正在使用 scipy.optimize，但我不知道如何将其与 TensorFlow 值一起使用，并且如果可能的话，我只想使用 TensorFlow。

编辑：我也尝试将偏差设置为 tf.ones 而不是 tf.zeros，但它也不起作用。

您的对数没有净化输入。很有可能您的负输入值很快就会导致任何浮点数算术 NaN。

我在 Java 代码中所做的大量使用类似域中的日志： https://github.com/thomasjungblut/thomasjungblut-common/blob/master/src/de/jungblut/math/MathUtils.java#L302

检查 NaN 或无穷大并假设输出为零
如果输入为负，则将输出剪辑为某个静态数字，例如。 log(1e-5) ~= -11.51
否则只取日志

在 Java 中，代码如下所示，应该不难翻译为 tf：

public static double guardedLogarithm(double input) {
    if (Double.isNaN(input) || Double.isInfinite(input)) {
      return 0d;
    } else if (input <= 0d || input <= -0d) {
      // assume a quite low value of log(1e-5) ~= -11.51
      return -10d;
    } else {
      return FastMath.log(input);
    }
  }

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

machinelearning

scipy

tensorflow

artificialintelligence

为什么我的 GradientDescentOptimizer 会产生 NaN？的相关文章

Django 1.6：清除一张表中的数据

我有一个名为 UGC 的表想要清除该表中的所有数据我不想重置整个应用程序这也会删除所有其他模型中的所有数据是否可以只清除一个模型我还为我的应用程序配置了 South 如果这有帮助的话你可以使用原始 SQL https docs
从networkx中的文件中读取具有pos属性的节点

我是 Networkx 的新手我有一个包含以下格式的节点位置的文件 0 23 23 12 23 where 0是一个节点 23 23 and 12 23分别是X和Y坐标有谁知道如何读取节点pos属性使用类似的函数read edgeli
使用不带引号的块样式的 Python YAML 转储

如何使用 PyYAML 加载和转储 YAML 以便它尽可能地使用原始样式我有 Python 来加载和转储 YAML 数据例如 import sys import yaml def represent dictorder self dat
使用 setuptools (pip) 时如何打印警告和错误

我正在使用 setuptools 来打包代码以便可以使用以下命令轻松安装它 cd project name pip install 在设置过程中我想警告用户有关预先存在的配置文件的信息并在系统上打印一些安装后说明例如 etc pro
Python TypeError：不支持的操作数类型 -：“int”和“function”

我是 Python 初学者正在做一项作业我不断得到TypeError unsupported operand type s for int and function 即使在研究了错误并应用了建议的修复之后我并不是在寻找任何人给我一个解
Django表单中的隐藏字段不在cleaned_data中

我有这个表格 class CollaboratorForm forms Form user forms CharField label Username max length 100 canvas forms IntegerField wi
使用 cx_oracle 返回 MERGE 中受影响的行数

如何在 CX Oracle 中执行 MERGE INTO sql 命令来获取受影响的行数当我在cx oracle 上执行MERGE SQL 时我得到的cursor rowcount 为 1 有没有办法获取受合并影响的行数由于 cx o
在 Python 中解压存档时出现错误

我使用 Python 下载 bz2 文件然后我想使用以下方法解压存档 def unpack file dir file cwd os getcwd os chdir dir print Unpacking file s file cmd
如何在 dash/plotly 中使用 iframe？（Python/HTML）

我正在创建一个仪表板我想使用这个交互式地图网站链接 https www ons gov uk peoplepopulationandcommunity healthandsocialcare causesofdeath articles
Python Jinja2 调用宏会导致（不需要的）换行符

我的 JINJA2 模板如下所示 macro print if john name if name John Hi John endif endmacro Hello World print if john Foo print if joh
Plotly：如何在堆叠条形图顶部显示值的总和以及各个条形值？

我正在尝试在 Python 中的 Plotly Express 中添加每个堆叠条形顶部的总计以及各个条形值 import plotly express as px df px data medals long fig px bar df x
在 MATLAB 中从头开始编程基本神经网络

我过去曾在这个网站上问过一些关于神经网络的问题并得到了很好的答案但我仍然在努力为自己实现一个这是一个相当长的问题但我希望它可以作为其他人在 MATLAB 中创建自己的基本神经网络的指南所以它应该是值得的到目前为止我所做的可能是完
Python 中没有名称属性的表单提交

背景在Python中使用urllib和urllib2 您可以进行表单提交您首先创建一个字典 formdictionary search stackoverflow 然后使用 urllib 的 urlencode 方法来转换这个字典 pa
python 函数中的对象不可迭代错误

我有一个简单的功能如下 comdList range 0 27 for t in comdList print t 但是它返回一个 in object not iterable 错误在函数之外它工作正常这是怎么回事尝试这个 for t
将列表列表替换为“压缩”列表列表，同时保持顺序

我有一个列表列表如我所附的代码所示如果有任何共同值我想链接每个子列表然后我想用列表的精简列表替换列表的列表例子如果我有一个清单 1 2 3 3 4 I want 1 2 3 4 如果我有 4 3 1 2 3 I want 4 3
numpy.polyval() 的反函数

我想知道 np polyval 是否有一个方便的反函数我在其中给出 y 值并求解 x 我知道我可以做到这一点的一种方法是 import numpy as np Set up the question p np array 1 1 10 y
Python httplib 和 POST

我目前正在使用别人编写的一段代码它用httplib向服务器发出请求它以正确的格式提供所有数据例如消息正文标头值等问题是每次尝试发送 POST 请求时数据都在那里我可以在客户端看到它但没有任何内容到达服务器我已经阅读了库规
训练某些网络时，Keras（Tensorflow 后端）在 GPU 上比在 CPU 上慢

我很难理解为什么 GPU 和 CPU 速度在小规模网络中相似 CPU 有时更快而 GPU 在大规模网络中更快问题底部的代码在 i7 6700k 上运行时间为 103 7 秒但使用tensorflow gpu 时代码运行时间为 29
如何让 Python 生成器返回 None 而不是 StopIteration？

我使用生成器在列表中执行搜索如下简单示例 gt gt gt a 1 2 3 4 gt gt gt i for i v in enumerate a if v 4 next 3 只是为了稍微说明一下示例与上面的列表相比我使用的列表要长得
用于监视文件夹和更新数据库的 Python 守护进程

这专门用于管理 MP3 文件但它应该可以轻松地适用于任何包含大量文件的目录结构我想找到或编写一个守护程序最好用Python 来监视一个包含许多子文件夹的文件夹这些子文件夹都应该包含X个MP3文件每当添加更新或删除文件时它都应该

随机推荐

Angular ng-repeat 导致闪烁

我正在使用以下代码显示缩略图列表 div class channel img class channel img div 在控制器中我有一个 ajax 请求它可以获取新的缩略图因此 Angular 会更新图像但会导致闪烁有没有办法
如何在 Docpad 中处理路线

这应该是非常明显的但我就是无法理解它如何在 Docpad 中添加额外的路线我正在寻找相当于express js的Docpad app post function res req next Do stuff 据我所知我需要为此创建一个
dynamodb：如何增加地图中的值

我正在尝试使用 dynamodb 来维护map名称及其值 eg scores player a 10 我还希望使用增量运算符来执行原子增量但是我找不到关于如何使用更新 dynamodb 地图的文档这是我到目前为止的Python代码
DOMXPath 根据前一个同级值获取同级

假设我有这个
如何使用 Calc 列规则在 Emacs Org 模式中实现行索引列

我希望在组织模式表中有一个列是一个简单的单调递增值即行号这样当我插入和删除随机行时索引值会自动调整我怀疑这应该很简单但看起来我让它变得太困难了请注意我是使用 Emacs 和 org 模式构建电子表格的新手因此一个简单的电子表
d3-sankey 链接在拖动事件时未更新

问题一我无法更新拖动事件上的 d3 sankey 链接我正在尝试复制与此类似的 d3 垂直和水平拖动事件 https bl ocks org d3noob 5028304 https bl ocks org d3noob 5028304
如何使用 angularjs 动态添加行？

我使用代码通过单击添加行来添加行和 2 列我的需要是首先在输入字段中填写值单击添加项目按钮后值必须显示在表结构中我是初学者无法使用 for 循环任何人都可以解决这个问题吗尝试代码 https jsfiddle net
如何有效地将图像从服务器加载到tableView？

我有一个表格视图其中所有单元格都有 UITableViewCellStyleSubtitle 所有细胞的图像均从服务器获取然而这些图像并不经常改变有人可以告诉我如何改善用户体验吗每次用户向下滚动表格时就好像它再次上网检查和下载图
Windows 上的 DLL Main 与 Windows 上的 DLL Main Linux 上的 __attribute__((constructor)) 入口点

考虑代码 EXE int main printf Executable Main loading library n ifdef HAVE WINDOWS HMODULE lib LoadLibraryA testdll dll elif
以科学计数法的格式显示数组

我想以科学计数法显示我的结果例如 1 2e3 我的数据是数组格式有没有类似的函数tolist 可以将数组转换为浮点数以便我可以使用 E 来格式化输出这是我的代码 import numpy as np a np zeros shape
如何将wiremock POST 请求与一些可选的JSON 参数和任何值相匹配？

我需要使用wiremock 来测试发送数据的POST 请求如下所示 name known fixed value dateOfBirth 5123456789000 email known fixed value currentDate
如何在RESTEasy客户端框架中设置HTTP标头？

RESTEasy 一个 JAX RS 实现有一个很好的客户端框架 http docs jboss org resteasy docs 2 0 0 GA userguide html RESTEasy Client Framework ht
单击按钮文本并释放按钮时按钮元素不会触发单击事件（但仍在按钮内部）？

在 WebKit 浏览器上我在 Mac 上的 Chrome 和 Safari 上进行了测试按钮元素的行为很奇怪温在这把小提琴中http jsfiddle net 5ReUn 3 http jsfiddle net 5ReUn 3 您执
Mysql 选择记录的倒数对，不重复

我有一个包含两列的表人物ID person id 第一个字段 id 正在与谁合作我需要选择所有合作对这很容易但问题出在哪里表有如下数据 987 102 103 104 104 103 21 102 根据这些数据我应该有 3 个合
Facebook Opengraph og 的动态图像：图像元标记

我正在尝试在 Facebook 上分享我网站上的图片图像可以是动态的但其他元将保持不变有没有办法可以在 OG IMAGE 标签中拥有动态数据或者我必须使用 FB Post API 的其他选项是和不是 Facebook 会抓取您的网
使用 ViewModel 屏蔽可为 null 的域属性

我正在使用 Entity Framework 4 0 并使用 POCO 对象当我从数据库填充 POCO 对象时我将属性值转换为我自己的域对象我们可以将其称为我的模型当然我的模型的字段是否可为空取决于它在数据库中映射到的值是否来自
不允许 CREATE 操作

我正在尝试利用CloudKit在我的 iOS 应用程序中但是当我尝试为User记录类型记录类型名为Users 我收到此错误
在django上无损压缩图像

我正在做优化 Google 建议对图像进行无损压缩正在寻找一种在 Django 中实现这一点的方法这是他们指定的图像我认为为了有效地完成它需要在系统范围内实现可能使用中间件类想知道以前是否有人这样做过这是谷歌页面速度分析的链接
从外部函数访问 QLCDNumber 对象

每次线程 t1 每秒调用函数 wait thread v1 时我的 python 脚本都需要更改一个对象 lcd p1 但是如何做到这一点呢我不知道如何在函数内访问这个对象有人可以帮忙吗 vazao1 12 global pulses
为什么我的 GradientDescentOptimizer 会产生 NaN？

我目前正在修改 Andrew Ng 教授在 Coursera 上的机器学习课程作业但我陷入了逻辑回归部分 filename data ex2data1 txt data np loadtxt filename delimiter un

为什么我的 GradientDescentOptimizer 会产生 NaN？

为什么我的 GradientDescentOptimizer 会产生 NaN？ 的相关文章

随机推荐

热门标签

为什么我的 GradientDescentOptimizer 会产生 NaN？的相关文章