无法近似具有 1 个隐藏层的神经网络中的简单乘法函数

2024-01-01

我只是想测试神经网络近似乘法函数（回归任务）的效果如何。我正在使用 Azure 机器学习工作室。我有 6500 个样本，1 个隐藏层（我已经测试了每个隐藏层 5 /30 /100 个神经元），没有标准化。以及默认参数学习率 - 0.005，学习迭代次数 - 200，初始学习权重 - 0.1，动量 - 0 [描述] https://msdn.microsoft.com/en-us/library/azure/dn906030.aspx。我的准确率非常差，接近于 0。同时，提升决策森林回归显示出非常好的近似值。

我究竟做错了什么？这个任务对于 NN 来说应该很容易。

大乘法函数梯度迫使网络几乎立即进入某种可怕的状态，其中所有隐藏节点的梯度为零。我们可以使用两种方法：

1) 除以常数。我们只是在学习之前将所有内容相除，然后相乘。

2）进行对数归一化。它将乘法变成加法：

m = x*y => ln(m) = ln(x) + ln(y).

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

无法近似具有 1 个隐藏层的神经网络中的简单乘法函数的相关文章

Keras，训练模型后如何预测？

我正在使用 reuters example 数据集它运行良好我的模型已经过训练我阅读了有关如何保存模型的信息以便稍后加载它以再次使用但如何使用这个保存的模型来预测新文本呢我用吗models predict 我必须以特殊方式准备这
张量流：简单 LSTM 网络的共享变量错误

我正在尝试构建一个最简单的 LSTM 网络只是想让它预测序列中的下一个值np input data import tensorflow as tf from tensorflow python ops import rnn cell im
在 Tensorflow 中使用队列将数据馈送到网络时分开验证和训练图

我一直在做大量关于如何使用队列将数据正确输入网络的研究但是我在互联网上找不到任何解决方案目前我的代码能够读取训练数据并执行训练但无需验证和测试这里有一些重要的行构成了我的代码 images volumes utils inputs
Tensorflow Inception 多 GPU 训练损失未求和？

我正在尝试检查多个 GPU 在一台机器上的 Tensorflow 初始代码我很困惑因为据我所知我们从不同的塔又名 GPU 中得到了多次损失但是loss评估的变量似乎只是最后一个塔的变量而不是所有塔的损失之和 for step
Tensorflow构建量化工具-bazel构建错误

我正在尝试编译量化脚本如下所述皮特沃登的博客 https petewarden com 2016 05 03 how to quantize neural networks with tensorflow 但是在运行以下 bazel
如何在快速人工智能中获得给定测试集的预测并计算准确性？

我正在尝试加载由导出的学习者learn export 我想针对测试集运行它我希望我的测试集有标签以便我可以测量其准确性这是我的代码 test src TextList from df df path cols texts split
Google Colab：为什么 CPU 比 TPU 快？

我正在使用 Google colabTPU训练一个简单的Keras模型删除分布式strategy并在CPU比TPU 这怎么可能 import timeit import os import tensorflow as tf from sk
从文本文件中提取与输入单词最相似的前 N 个单词

我有一个文本文件其中包含我使用 BeautifulSoup 提取的网页内容我需要根据给定的单词从文本文件中找到 N 个相似的单词流程如下从中提取文本的网站 https en wikipedia org wiki Football h
我可以使用自动编码器进行聚类吗？

在下面的代码中他们使用自动编码器作为监督聚类或分类因为它们具有数据标签 http amunategui github io anomaly detection h2o http amunategui github io anomaly
结合两个 CNN

我想在 Keras 中将两个 CNN 合并为一个我的意思是我希望神经网络拍摄两张图像并在单独的 CNN 中处理每一张图像然后将它们连接在一起进入扁平化层并使用全连接层来做最后的工作我做了什么 Start With First Bran
是否有可能在每个训练步骤中获得目标函数值？

在通常的 TensorFlow 训练循环中例如 train op tf train AdamOptimizer minimize cross entropy with tf Session as sess for i in range n
Keras Maxpooling2d 层给出 ValueError

我正在尝试在 keras 中复制 VGG16 模型以下是我的代码 model Sequential model add ZeroPadding2D 1 1 input shape 3 224 224 model add Convoluti
Keras 获取中间层的输出

what my model looks like defining the model archictecture model Sequential 1st conv layer model add Conv2D 32 5 5 activa
当我想在电脑中加载该模型时，我可以在 colab bu 中加载我的深度模型，但我不能

我在colab中通过keras 2 3 1和tensorflow 2 1 0训练了一个深度模型我用JSON和Keras保存了我的模型 saveWeightPath content drive My Drive model info mod
输入维度/分辨率会影响卷积神经网络的性能吗？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我正在构建一个图像分类器其中有 66 个类和大约 50000 个图像我的电脑内存为 12 GB 我的内存不足以训练图像我的问题是
为神经网络打乱两个 numpy 数组

我有两个 numpy 数组用于输入数据 X 和输出数据 y X np array 2 3 sample 1 x 16 4 dtype float sample 2 x y np array 1 0 sample 1 y 0 1 dtype
caffe reshape / 上采样全连接层

假设我们有一个像这样的层 layer name fully connected type InnerProduct bottom bottom top top inner product param num output 1 输出是batc
访问 GCP 深度学习平台映像的 dockerfiles

我正在使用源自的图像深度学习容器 https cloud google com ai platform deep learning containers docs 在 AI Platform Notebooks 产品中运行多个任务为了对我
无法获取未知等级的 Shape 长度

我有一个神经网络来自tf data数据生成器和tf keras模型如下简化版本因为太长 dataset A tf data Dataset反对与next x方法调用get next为了x train迭代器和next y方法调用get
如何将神经网络的输出限制在特定范围内？

我正在使用 Keras 进行回归任务并希望将输出限制在一个范围内例如 1 到 10 之间有没有办法保证这一点像这样编写自定义激活函数 a simple custom activation from keras import back

随机推荐

矩阵加法的复杂度是多少？

我已经发现在另一个问题中提到矩阵加法是二次运算 https stackoverflow com questions 1868009 speed up matrix addition in c 但我认为这是线性的如果我将矩阵的大小加倍我需
生成可预测的随机数组

SO 问题这是众所周知的伪随机数 http en wikipedia org wiki Pseudorandom number generator 伪实际上意味着尽管它们通常是随机的即不可预测的但它们的顺序仍然相同其中使用了相同
在列表上迭代两次的正确方法？

对容器执行多次迭代的正确方法是什么来自 python 文档迭代器容器对象例如列表产生一个全新的对象每次将迭代器传递给 iter 函数或在迭代器中使用它时 for 循环使用迭代器尝试这样做只会返回相同的结果耗尽前一个迭代过程中
如何从R中的字符串中删除+（加号）？

假设我使用 gsub 并希望从字符串中删除以下符号并替换为下划线有人可以描述当我尝试使用带加号的 gsub 时发生的情况吗 test lt sandwich bread mustard ketchup 1 sandwich bread
updateTabItems 的问题。在 R 中与 Golem 一起闪亮

我正在 R 中使用 golem 构建一个应用程序我正在尝试通过按钮将 TabItem 从 tabItem accueil 更改为其他 tabItem Rating 这是模块 Acceuil mod Accueil ui lt functi
如何使用 AS3 让按钮自动发送电子邮件

我正在使用 Actionscript 3 0 并正在制作一个网站在我的网站中我想制作一个按钮通过单击按钮发送电子邮件但我不希望它打开他们的邮件客户端而只是发送电子邮件我目前正在使用 mailto 功能但想知道如何使其自动发送
MVC中属性和过滤器有什么区别

现在我可以进行比较而不仅仅是定义吗 Example SomeClassAttribute or ISomeClassAttribute VS SomeClassFilter or ISomeClassFilter 我有一种感觉它们可以以相
使用 CXF wsdl2java 从 wsdl 生成 java 时如何更改 javadoc 注释语言？

我使用 CXF wsdl2java 命令从 wsdl 文件生成 java 源 wsdl2java impl server d
如何从服务中调用组件方法？（角度2）

我想创建一个可以与一个组件交互的服务我的应用程序中的所有其他组件都应该能够调用该服务并且该服务应该与该组件交互如何从服务中调用组件方法 Component selector component export class Compone
为什么在 ES6 的严格模式下 `"foo".bar = 42;` 会抛出 `TypeError` ？

根据ES5 1规范该程序 use strict foo bar 42 导致String要创建的对象分配给它的属性然后扔掉该对象导致没有可观察到的效果包括任何异常可以通过在 Opera 12 等兼容 ES5 的 JS 实现中尝试来
request.GET.get 在做什么？

我正在看 A Mele Django 示例第 1 章 def post list request category None object list Post published all paginator Paginator objec
IDP 发起的 SSO (SAML) 中是否需要 Keystore/JKSKeyManager？

我已经使用 Spring SAML 扩展成功实现了 SSO 身份验证我们的主要要求是支持 IDP 发起的对我们的应用程序的 SSO 好吧通过使用 spring security saml2 sample 中的配置即使是 SP 发起的
Rails 4 date_field，最小和最大年份？

我正在尝试使用 Rails 4 方法 date field 为表单设置最大年份值因为用户似乎可以输入大于 4 位数字的年份我一直在尝试这样使用但似乎没有任何效果我就是这样做的我使用 Ruby 的 Date 类中的方法使用内置选择器
OpenGL 和线程

众所周知 OpenGL 驱动程序通常不支持多线程然而是否必须处理主线程例如 SDL 调出 GL 上下文如果一个线程产生一个线程并且从那时起从那里发送 OpenGL 命令安全吗或者有没有仅限于启动 GL 的主线程语境您需要将
使用 jQuery 即时创建标签

我需要动态创建标签和文本字段并且还包括文本字段的日期选择器我需要这样的东西
JQuery .load() 回调函数

我见过很多类似问题的问题和解决方案但没有一个对我有用我有这个 function bdiv load bosses php icc10n function return bdiv html 但这不起作用为了澄清一下我想将内容加载到 b
Xcode版本预处理器

我的应用程序中有一个小错误仅在使用 Xcode 6 构建时存在我修复了此错误但在使用 Xcode 5 构建时这部分出现了错误因此两个 Xcode 版本之间展开了一场丑陋的战斗现在我想检查使用哪个 Xcode 版本通过预处理器构
如何在 Jasmine 中正确模拟 Amplify 以进行单元测试？

我对单元测试还很陌生所以请耐心等待我正在尝试对一项服务进行单元测试该服务用于在 Angular 应用程序中使用 Amplify 登录用户现在在规范文件中我正在做 beforeEach async gt TestBed configu
替换换行符，但保留空行

我想用空格替换换行符 r n 但我想保留空白行换句话说如果 r n 前面没有另一个 r n 我想用替换 r n 例如 line 1 line 2 line 3 line 4 最终应该是 line 1 line 2 line 3 lin
无法近似具有 1 个隐藏层的神经网络中的简单乘法函数

我只是想测试神经网络近似乘法函数回归任务的效果如何我正在使用 Azure 机器学习工作室我有 6500 个样本 1 个隐藏层我已经测试了每个隐藏层 5 30 100 个神经元没有标准化以及默认参数学习率 0 005 学习迭代次

无法近似具有 1 个隐藏层的神经网络中的简单乘法函数

无法近似具有 1 个隐藏层的神经网络中的简单乘法函数 的相关文章

随机推荐

热门标签

无法近似具有 1 个隐藏层的神经网络中的简单乘法函数的相关文章