在 Keras 中实现 Rprop 算法

2024-01-08

我正在尝试为 Keras 实现弹性反向传播优化器（link http://www.inf.fu-berlin.de/lehre/WS06/Musterererkennung/Paper/rprop.pdf），但具有挑战性的部分是能够根据每个单独的参数对应的梯度是正、负还是零来执行更新。我编写了下面的代码作为实现 Rprop 优化器的开始。但是，我似乎找不到单独访问参数的方法。循环播放params（如下面的代码所示）返回p, g, g_old, s, wChangeOld在每次迭代时都是矩阵。

有没有办法可以迭代各个参数并更新它们？如果我可以根据参数向量的梯度符号对参数向量进行索引，它也会起作用。

class Rprop(Optimizer):
    def __init__(self, init_step=0.01, **kwargs):
        super(Rprop, self).__init__(**kwargs)
        self.init_step = K.variable(init_step, name='init_step')
        self.iterations = K.variable(0., name='iterations')

        self.posStep = 1.2
        self.negStep = 0.5
        self.minStep = 1e-6
        self.maxStep = 50.

    def get_updates(self, params, constraints, loss):
        grads = self.get_gradients(loss, params)
        self.updates = [K.update_add(self.iterations, 1)]

        shapes = [K.get_variable_shape(p) for p in params]
        stepList = [K.ones(shape)*self.init_step  for shape in shapes]
        wChangeOldList = [K.zeros(shape) for shape in shapes]
        grads_old = [K.zeros(shape) for shape in shapes]

        self.weights = stepList + grads_old + wChangeOldList
        self.updates = []

        for p, g, g_old, s, wChangeOld in zip(params, grads, grads_old, 
                                                                  stepList, wChangeOldList):
            change = K.sign(g * g_old)

            if change > 0:
                s_new = K.minimum(s * self.posStep, self.maxStep)
                wChange = s_new * K.sign(g)
                g_new = g

            elif change < 0:
                s_new = K.maximum(s * self.posStep, self.maxStep)
                wChange = - wChangeOld
                g_new = 0

            else:
                s_new = s
                wChange = s_new * K.sign(g)
                g_new = p

            self.updates.append(K.update(g_old, g_new))
            self.updates.append(K.update(wChangeOld, wChange))
            self.updates.append(K.update(s, s_new))

            new_p = p - wChange

            # Apply constraints
            if p in constraints:
                c = constraints[p]
                new_p = c(new_p)

            self.updates.append(K.update(p, new_p))
        return self.updates

    def get_config(self):
        config = {'init_step': float(K.get_value(self.init_step))}
        base_config = super(Rprop, self).get_config()
        return dict(list(base_config.items()) + list(config.items()))

我也在 Keras 中寻找 RProp 算法并发现了这个问题。我冒昧地根据我的目的调整了您的代码，现在将其发布回此处。到目前为止，它似乎工作得很好，但我没有对其进行广泛的测试。

免责声明：我对 keras 很陌生，但对 theano （和块）有很多经验。此外，我仅使用 theano 作为后端进行了测试，但没有使用张量流。

class RProp(Optimizer):
    def __init__(self, init_alpha=1e-3, scale_up=1.2, scale_down=0.5, min_alpha=1e-6, max_alpha=50., **kwargs):
        super(RProp, self).__init__(**kwargs)
        self.init_alpha = K.variable(init_alpha, name='init_alpha')
        self.scale_up = K.variable(scale_up, name='scale_up')
        self.scale_down = K.variable(scale_down, name='scale_down')
        self.min_alpha = K.variable(min_alpha, name='min_alpha')
        self.max_alpha = K.variable(max_alpha, name='max_alpha')

    def get_updates(self, params, constraints, loss):
        grads = self.get_gradients(loss, params)
        shapes = [K.get_variable_shape(p) for p in params]
        alphas = [K.variable(numpy.ones(shape) * self.init_alpha) for shape in shapes]
        old_grads = [K.zeros(shape) for shape in shapes]
        self.weights = alphas + old_grads
        self.updates = []

        for param, grad, old_grad, alpha in zip(params, grads, old_grads, alphas):
            new_alpha = K.switch(
                K.greater(grad * old_grad, 0),
                K.minimum(alpha * self.scale_up, self.max_alpha),
                K.maximum(alpha * self.scale_down, self.min_alpha)
            )
            new_param = param - K.sign(grad) * new_alpha
            # Apply constraints
            if param in constraints:
                c = constraints[param]
                new_param = c(new_param)
            self.updates.append(K.update(param, new_param))
            self.updates.append(K.update(alpha, new_alpha))
            self.updates.append(K.update(old_grad, grad))

        return self.updates

    def get_config(self):
        config = {
            'init_alpha': float(K.get_value(self.init_alpha)),
            'scale_up': float(K.get_value(self.scale_up)),
            'scale_down': float(K.get_value(self.scale_down)),
            'min_alpha': float(K.get_value(self.min_alpha)),
            'max_alpha': float(K.get_value(self.max_alpha)),
        }
        base_config = super(RProp, self).get_config()
        return dict(list(base_config.items()) + list(config.items()))

重要笔记：

RProp 通常不包含在机器学习库中，原因是：除非您使用全批量学习，否则它根本不起作用。仅当训练集较小时，全批量学习才有用。
Adam（Keras 内置）优于此 RProp 算法。也许是因为事情就是这样，或者也许是因为我犯了一个错误:)

关于您的代码的一些评论（指您的原始变量名称）：

wChange永远不会在迭代中使用，因此您不需要将它们存储在永久变量中。
change > 0没有做你认为它会做的事情，因为change是一个张量变量。您想要的是逐元素比较，使用K.switch()反而。
你用过maxStep两次而不是使用minStep另一次。
情况在哪里change为零是可以忽略不计的，因为这在实践中几乎不会发生。
g_new = 0 and g_new = p都是完全伪造的，应该是g_new = g就像第一个 if 分支一样。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在 Keras 中实现 Rprop 算法的相关文章

为什么从 Pandas 1.0 中删除了日期时间？

我在 pandas 中处理大量数据分析并每天使用 pandas datetime 最近我收到警告 FutureWarning pandas datetime 类已弃用并将在未来版本中从 pandas 中删除改为从 datetime 模块
元组有什么用？

我现在正在学习 Python 课程我们刚刚介绍了元组作为数据类型之一我阅读了它的维基百科页面但是我无法弄清楚这种数据类型在实践中会有什么用处我可以提供一些需要一组不可变数字的示例吗也许是在 Python 中这与列表有何不同每
跟踪 pypi 依赖项 - 谁在使用我的包

无论如何是否可以通过 pip 或 PyPi 来识别哪些项目在 Pypi 上发布可能正在使用我的包也在 PyPi 上发布我想确定每个包的用户群以及可能尝试积极与他们互动预先感谢您的任何答案即使我想做的事情是不可能的这实际上是不
将 python2.7 与 Emacs 24.3 和 python-mode.el 一起使用

我是 Emacs 新手我正在尝试设置我的 python 环境到目前为止我已经了解到在 python 缓冲区中使用 python mode el C c C c将当前缓冲区的内容加载到交互式 python shell 中显然使用了什么
独立滚动矩阵的行

我有一个矩阵准确地说是 2d numpy ndarray A np array 4 0 0 1 2 3 0 0 5 我想滚动每一行A根据另一个数组中的滚动值独立地 r np array 2 0 1 也就是说我想这样做 print np
我可以在我的机器上同时安装 python 2.7 和 3.5 的tensorflow吗？

目前我通过 Anaconda 在我的机器 MAC OX 上安装了 Python 2 7 Python 3 5 Tensorflow for Python 3 5 我也想在我的机器上安装 Tensorflow for Python 2 7 当
张量流服务错误：参数无效：JSON 对象：没有命名输入

我正在尝试使用 Amazon Sagemaker 训练模型并且希望使用 Tensorflow 服务来为其提供服务为了实现这一目标我将模型下载到 Tensorflow 服务 docker 并尝试从那里提供服务 Sagemaker 的训练
您可以格式化 pandas 整数以进行显示，例如浮点数的“pd.options.display.float_format”？

我见过this https stackoverflow com questions 18404946 py pandas formatdataframe and this https stackoverflow com questions
Python 2：SMTPServerDisconnected：连接意外关闭

我在用 Python 发送电子邮件时遇到一个小问题 me my email address you recipient s email address me email protected cdn cgi l email protectio
Python，将函数的输出重定向到文件中

我正在尝试将函数的输出存储到Python中的文件中我想做的是这样的 def test print This is a Test file open Log a file write test file close 但是当我这样做时我收到
如何使用 Mysql Python 连接器检索二进制数据？

如果我在 MySQL 中创建一个包含二进制数据的简单表 CREATE TABLE foo bar binary 4 INSERT INTO foo bar VALUES UNHEX de12 然后尝试使用 MySQL Connector P
如何使用 pybrain 黑盒优化训练神经网络来处理监督数据集？

我玩了一下 pybrain 了解如何生成具有自定义架构的神经网络并使用反向传播算法将它们训练为监督数据集然而我对优化算法以及任务学习代理和环境的概念感到困惑例如我将如何实现一个神经网络例如 1 以使用 pybrain 遗传算法
pyspark 将 twitter json 流式传输到 DF

我正在从事集成工作spark streaming with twitter using pythonAPI 我看到的大多数示例或代码片段和博客是他们从Twitter JSON文件进行最终处理但根据我的用例我需要所有字段twitter J
从 NumPy ndarray 中选择行

我只想从 a 中选择某些行NumPy http en wikipedia org wiki NumPy基于第二列中的值的数组例如此测试数组的第二列包含从 1 到 10 的整数 gt gt gt test numpy array nump
Pandas 将多行列数据帧转换为单行多列数据帧

我的数据框如下 code df Car measurements Before After amb temp 30 268212 26 627491 engine temp 41 812730 39 254255 engine eff 15
根据列 value_counts 过滤数据框（pandas）

我是第一次尝试熊猫我有一个包含两列的数据框 user id and string 每个 user id 可能有多个字符串因此会多次出现在数据帧中我想从中导出另一个数据框一个只有那些user ids列出至少有 2 个或更多string
Python：XML 内所有标签名称中的字符串替换（将连字符替换为下划线）

我有一个格式不太好的 XML 标签名称内有连字符我想用下划线替换它以便能够与 lxml objectify 一起使用我想替换所有标签名称包括嵌套的子标签示例 XML
实现 XGboost 自定义目标函数

我正在尝试使用 XGboost 实现自定义目标函数在 R 中但我也使用 python 所以有关 python 的任何反馈也很好我创建了一个返回梯度和粗麻布的函数它工作正常但是当我尝试运行 xgb train 时它不起作用然后我
Keras：多类 NLP 任务中 model.evaluate 与 model.predict 的准确性差异

我正在使用以下代码在 keras 中为 NLP 任务训练一个简单模型训练集测试集和验证集的变量名称是不言自明的该数据集有 19 个类因此网络的最后一层有 19 个输出标签也是 one hot 编码的 nb classes 19 m
Kivy - 单击按钮时编辑标签

我希望 Button1 在单击时编辑标签 etykietka 但我不知道如何操作你有什么想法吗 class Zastepstwa App def build self lista WebOps getList layout BoxLayo

随机推荐

PHP 在文本区域中回显时显示 \r\n 字符

我的数据正在读取从数据库文本保存的数据我的问题是它也有这些字符 r n 我怎样才能阻止这些字符的显示在将数据库文本放入文本区域之前调用 nl2br 函数作为参数 r n 字符是 ASCII 不可见字符编码回车和换行 http
Android 主屏幕小部件（图标、标签 - 样式）

我正在尝试创建一个可以放置在 Android 主屏幕上的图标小部件 1 个单元 x 1 个单元该小部件的外观和行为与 Android 中的其他标准快捷方式完全相同它将有一个图标在该标签下有一个标签可以使用轨迹球可突出显示选择它
Web 应用程序和 API 在同一个 Laravel 项目中？

我正在尝试找出构建我即将开始的新项目的最佳方法我们目前有一个网络应用程序和一个移动应用程序它们都通过 API 提供数据目前 Web 应用程序是在安装 CodeIgniter 时完成的而 API 是在单独安装 CodeIgniter
webview 从输入字段打开相机，无需文件选择器

我的个人应用程序快完成了就是按下输入字段用相机拍照并将其上传到外部php服务器最后一部分工作正常我只是无法让它按照我想要的方式工作当我按下网络视图外部源中的输入字段时我会看到名为图像选择器的菜单其中包含选项相机和文档
访问目标函数 Gekko 外部函数中的决策变量值

我需要访问目标函数之外的决策变量我有以下内容 tc var for index in index f a tc var index m Var value 25 name tc var format index lb 15 ub 45 i
PdfWriter 和事件

我想创建一个 PdfWriter 对象并设置页眉和页脚事件问题是如果我创建一个新的 PDF 它就会起作用但我的问题是我的输出流中已经有一个 PDF 请在下面找到我的示例代码 Document document new Document
Magento - 无法将产品添加到管理面板后端的手动订单中

我遇到一个问题当我在 Magento 1 4 1 1 的管理面板中创建订单时我可以启动订单选择客户然后选择语言它会加载所有信息但是当我去时到添加产品我可以打开它并选择产品但是当我单击将所选产品添加到订单时它会短暂显示
在尊重括号的同时用逗号分割列表中的字符串

我有一个清单例如 a john is great paul school robert jack john 然后我正在构建一个空列表来附加分割 b 然后我这样做 for i in a b append i split 但列表是这样出现的
如何防止鼠标监听器暂时出现在窗口上？

我正在用 Java 编写一个游戏这是我试图做得漂亮的第一个游戏这款游戏名为 Bantumi 这是一款棋盘游戏现在我正在为动作编写动画问题是当运动动画运行时板仍然会获取鼠标事件如果用户选择新的运动则正在运行的运动将被丢弃
FileProvider“无法找到配置的根”异常

这些 FileProvider 又一个失去了灵魂我已经在这个问题上工作了一天多了看来我错过了一些大东西任何帮助将不胜感激我正在尝试使用 FileProvider 发送带有附件的电子邮件我的 AndroidManifest xml
将会话中保存的数组中的多行插入表中？

我使用一个插入命令通过 php 将存储在会话变量中的多个状态值传递到 MySQL 表中我想知道是否可以将每个状态值插入到不同的行中我还有一个 ID 保存在变量中我想将其与每个状态一起插入 campaign id 每个状态都存储在该会话
匹配 foo 或 bar vim 正则表达式

有没有一种方法可以同时匹配多个单词vim搜索和替换就像是 s foo bar g 寻找foo or bar并替换为任何内容这会搜索模式foo bar 这不是我想要的我可以搜索多个人物这边走 abcdef s ace g 结果是 bdf
有没有办法在开发时只刷新 javascript include ？

在 js 文件上进行开发时我只想刷新该文件而不是整个页面以节省时间有人知道这方面的技术吗这是创建新脚本元素的函数它附加一个递增的整数以使脚本的 URL 唯一如 Kon 建议以便强制下载 var index 0 function
Laravel 4 Auth::attempt() 总是返回 false

我正在尝试 Laravel 的 Auth 类但每次我尝试登录用户时该方法都会返回 false 这是我的代码路线 php Route get new user function return View make register Rou
使用Fisher方法matlab组合P值？

完成 CDF 后我收到了以下值P 其中的样本 0 43 0 12 0 0021 0 05 0 017 0 001 0 025 0 038 0 35 0 29 我想结合我的P值的帮助下Fisher https en wikipedia or
基于json输入绘制网络拓扑图

我想通过证明 json 数据作为输入使用 Highchart 或任何其他 js 库绘制网络拓扑图在查看示例时http www highcharts com demo renderer http www highcharts com de
设置滚动条拇指大小

我正在尝试计算与 WPF 滚动条拇指元素大小相关的算法拇指元素的大小可以使用Scrollbar ViewportSize属性但又与Scrollbar Minimum and Scrollbar Maximum价值观到目前为止我发现的是
android 从加速度计读数中删除重力

我正在开发一个 Android 应用程序我需要从加速度计读数中消除重力我已经阅读了关于这个问题的多个讨论我还找到了一个算法here http developer android com reference android hardwa
pandas 中给定日期的季度天数

我创建了一个日期数据框如下所示 import pandas as pd timespan 366 df pd DataFrame Date pd date range pd datetime today periods timespan
在 Keras 中实现 Rprop 算法

我正在尝试为 Keras 实现弹性反向传播优化器 link http www inf fu berlin de lehre WS06 Musterererkennung Paper rprop pdf 但具有挑战性的部分是能够根据每个单独的

在 Keras 中实现 Rprop 算法

在 Keras 中实现 Rprop 算法 的相关文章

随机推荐

热门标签

在 Keras 中实现 Rprop 算法的相关文章