无法近似具有 1 个隐藏层的神经网络中的简单乘法函数

2024-01-01

我只是想测试神经网络近似乘法函数(回归任务)的效果如何。 我正在使用 Azure 机器学习工作室。我有 6500 个样本,1 个隐藏层 (我已经测试了每个隐藏层 5 /30 /100 个神经元),没有标准化。以及默认参数学习率 - 0.005,学习迭代次数 - 200,初始学习权重 - 0.1, 动量 - 0 [描述] https://msdn.microsoft.com/en-us/library/azure/dn906030.aspx。我的准确率非常差,接近于 0。同时,提升决策森林回归显示出非常好的近似值。

我究竟做错了什么?这个任务对于 NN 来说应该很容易。


大乘法函数梯度迫使网络几乎立即进入某种可怕的状态,其中所有隐藏节点的梯度为零。 我们可以使用两种方法:

1) 除以常数。我们只是在学习之前将所有内容相除,然后相乘。

2)进行对数归一化。它将乘法变成加法:

m = x*y => ln(m) = ln(x) + ln(y).
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

无法近似具有 1 个隐藏层的神经网络中的简单乘法函数 的相关文章

随机推荐

  • 矩阵加法的复杂度是多少?

    我已经发现在另一个问题中提到矩阵加法是二次运算 https stackoverflow com questions 1868009 speed up matrix addition in c 但我认为这是线性的 如果我将矩阵的大小加倍 我需
  • 生成可预测的随机数组

    SO 问题 这是众所周知的伪随机数 http en wikipedia org wiki Pseudorandom number generator 伪 实际上意味着 尽管它们通常是随机的 即不可预测的 但它们的顺序仍然相同 其中使用了相同
  • 在列表上迭代两次的正确方法?

    对容器执行多次迭代的正确方法是什么 来自 python 文档 迭代器 容器对象 例如列表 产生一个全新的对象 每次将迭代器传递给 iter 函数或在迭代器中使用它时 for 循环 使用迭代器尝试这样做只会返回相同的结果 耗尽前一个迭代过程中
  • 如何从R中的字符串中删除+(加号)?

    假设我使用 gsub 并希望从字符串中删除以下 符号并替换为下划线 有人可以描述当我尝试使用带加号 的 gsub 时发生的情况吗 test lt sandwich bread mustard ketchup 1 sandwich bread
  • updateTabItems 的问题。在 R 中与 Golem 一起闪亮

    我正在 R 中使用 golem 构建一个应用程序 我正在尝试通过按钮将 TabItem 从 tabItem accueil 更改为其他 tabItem Rating 这是模块 Acceuil mod Accueil ui lt functi
  • 如何使用 AS3 让按钮自动发送电子邮件

    我正在使用 Actionscript 3 0 并正在制作一个网站 在我的网站中 我想制作一个按钮 通过单击按钮发送电子邮件 但我不希望它打开他们的邮件客户端 而只是发送电子邮件 我目前正在使用 mailto 功能 但想知道如何使其自动发送
  • MVC中属性和过滤器有什么区别

    现在我可以进行比较而不仅仅是定义吗 Example SomeClassAttribute or ISomeClassAttribute VS SomeClassFilter or ISomeClassFilter 我有一种感觉 它们可以以相
  • 使用 CXF wsdl2java 从 wsdl 生成 java 时如何更改 javadoc 注释语言?

    我使用 CXF wsdl2java 命令从 wsdl 文件生成 java 源 wsdl2java impl server d
  • 如何从服务中调用组件方法? (角度2)

    我想创建一个可以与一个组件交互的服务 我的应用程序中的所有其他组件都应该能够调用该服务 并且该服务应该与该组件交互 如何从服务中调用组件方法 Component selector component export class Compone
  • 为什么在 ES6 的严格模式下 `"foo".bar = 42;` 会抛出 `TypeError` ?

    根据ES5 1规范 该程序 use strict foo bar 42 导致String要创建的对象 分配给它的属性 然后扔掉该对象 导致没有可观察到的效果 包括任何异常 可以通过在 Opera 12 等兼容 ES5 的 JS 实现中尝试来
  • request.GET.get 在做什么?

    我正在看 A Mele Django 示例 第 1 章 def post list request category None object list Post published all paginator Paginator objec
  • IDP 发起的 SSO (SAML) 中是否需要 Keystore/JKSKeyManager?

    我已经使用 Spring SAML 扩展成功实现了 SSO 身份验证 我们的主要要求是支持 IDP 发起的对我们的应用程序的 SSO 好吧 通过使用 spring security saml2 sample 中的配置 即使是 SP 发起的
  • Rails 4 date_field,最小和最大年份?

    我正在尝试使用 Rails 4 方法 date field 为表单设置最大年份值 因为用户似乎可以输入大于 4 位数字的年份 我一直在尝试这样使用 但似乎没有任何效果 我就是这样做的 我使用 Ruby 的 Date 类中的方法使用内置选择器
  • OpenGL 和线程

    众所周知 OpenGL 驱动程序通常不支持多线程 然而 是否必须处理主线程 例如 SDL 调出 GL 上下文 如果一个线程产生一个线程并且从那时起 从那里发送 OpenGL 命令安全吗 或者有没有 仅限于启动 GL 的主线程 语境 您需要将
  • 使用 jQuery 即时创建标签

    我需要动态创建标签和文本字段 并且还包括文本字段的日期选择器 我需要这样的东西
  • JQuery .load() 回调函数

    我见过很多类似问题的问题和解决方案 但没有一个对我有用 我有这个 function bdiv load bosses php icc10n function return bdiv html 但这不起作用 为了澄清一下 我想将内容加载到 b
  • Xcode版本预处理器

    我的应用程序中有一个小错误 仅在使用 Xcode 6 构建时存在 我修复了此错误 但在使用 Xcode 5 构建时这部分出现了错误 因此 两个 Xcode 版本之间展开了一场丑陋的战斗 现在 我想检查使用哪个 Xcode 版本通过预处理器构
  • 如何在 Jasmine 中正确模拟 Amplify 以进行单元测试?

    我对单元测试还很陌生 所以请耐心等待 我正在尝试对一项服务进行单元测试 该服务用于在 Angular 应用程序中使用 Amplify 登录用户 现在在规范文件中我正在做 beforeEach async gt TestBed configu
  • 替换换行符,但保留空行

    我想用空格替换换行符 r n 但我想保留空白行 换句话说 如果 r n 前面没有另一个 r n 我想用 替换 r n 例如 line 1 line 2 line 3 line 4 最终应该是 line 1 line 2 line 3 lin
  • 无法近似具有 1 个隐藏层的神经网络中的简单乘法函数

    我只是想测试神经网络近似乘法函数 回归任务 的效果如何 我正在使用 Azure 机器学习工作室 我有 6500 个样本 1 个隐藏层 我已经测试了每个隐藏层 5 30 100 个神经元 没有标准化 以及默认参数学习率 0 005 学习迭代次