如何在python中实现小批量梯度下降？

2024-03-14

我刚刚开始学习深度学习。当谈到梯度下降时，我发现自己陷入了困境。我知道如何实现批量梯度下降。我知道它是如何工作的以及小批量和随机梯度下降在理论上是如何工作的。但实在无法理解如何用代码实现。

import numpy as np
X = np.array([ [0,0,1],[0,1,1],[1,0,1],[1,1,1] ])
y = np.array([[0,1,1,0]]).T
alpha,hidden_dim = (0.5,4)
synapse_0 = 2*np.random.random((3,hidden_dim)) - 1
synapse_1 = 2*np.random.random((hidden_dim,1)) - 1
for j in xrange(60000):
    layer_1 = 1/(1+np.exp(-(np.dot(X,synapse_0))))
    layer_2 = 1/(1+np.exp(-(np.dot(layer_1,synapse_1))))
    layer_2_delta = (layer_2 - y)*(layer_2*(1-layer_2))
    layer_1_delta = layer_2_delta.dot(synapse_1.T) * (layer_1 * (1-layer_1))
    synapse_1 -= (alpha * layer_1.T.dot(layer_2_delta))
    synapse_0 -= (alpha * X.T.dot(layer_1_delta))

这是 ANDREW TRASK 博客中的示例代码。它很小而且很容易理解。该代码实现了批量梯度下降，但我想在此示例中实现小批量和随机梯度下降。我怎么能这样做呢？为了分别实现小批量和随机梯度下降，我必须在这段代码中添加/修改什么？你的帮助会对我有很大帮助。提前致谢。（我知道这个示例代码有几个例子，而我需要大数据集来分割成小批量。但我想知道如何实现它）

该函数返回给定输入和目标的小批量：

def iterate_minibatches(inputs, targets, batchsize, shuffle=False):
    assert inputs.shape[0] == targets.shape[0]
    if shuffle:
        indices = np.arange(inputs.shape[0])
        np.random.shuffle(indices)
    for start_idx in range(0, inputs.shape[0] - batchsize + 1, batchsize):
        if shuffle:
            excerpt = indices[start_idx:start_idx + batchsize]
        else:
            excerpt = slice(start_idx, start_idx + batchsize)
        yield inputs[excerpt], targets[excerpt]

这告诉您如何使用它进行训练：

for n in xrange(n_epochs):
    for batch in iterate_minibatches(X, Y, batch_size, shuffle=True):
        x_batch, y_batch = batch
        l_train, acc_train = f_train(x_batch, y_batch)

    l_val, acc_val = f_val(Xt, Yt)
    logging.info('epoch ' + str(n) + ' ,train_loss ' + str(l_train) + ' ,acc ' + str(acc_train) + ' ,val_loss ' + str(l_val) + ' ,acc ' + str(acc_val))

显然，您需要根据您正在使用的优化库（例如 Lasagne、Keras）自行定义 f_train、f_val 和其他函数。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

machinelearning

neuralnetwork

deeplearning

gradientdescent

如何在python中实现小批量梯度下降？的相关文章

Django 的内联管理：一个“预填充”字段

我正在开发我的第一个 Django 项目我希望用户能够在管理中创建自定义表单并向其中添加字段当他或她需要它们时为此我在我的项目中添加了一个可重用的应用程序可在 github 上找到 https github com stephen
与区域指示符字符类匹配的 python 正则表达式

我在 Mac 上使用 python 2 7 10 表情符号中的标志由一对表示区域指示符号 https en wikipedia org wiki Regional Indicator Symbol 我想编写一个 python 正则表达式来在
如何用python脚本控制TP LINK路由器

我想知道是否有一个工具可以让我连接到路由器并关闭它然后从 python 脚本重新启动它我知道如果我写 import os os system ssh l root 192 168 2 1 我可以通过 python 连接到我的路由器但是
如何使用 opencv.omnidir 模块对鱼眼图像进行去扭曲

我正在尝试使用全向模块 http docs opencv org trunk db dd2 namespacecv 1 1omnidir html用于对鱼眼图像进行扭曲处理Python 我正在尝试适应这一点C 教程 http docs op
安装了 32 位的 Python，显示为 64 位

我需要运行 32 位版本的 Python 我认为这就是我在我的机器上运行的因为这是我下载的安装程序当我重新运行安装程序时它会将当前安装的 Python 版本称为 Python 3 5 32 位然而当我跑步时platform arch
独立滚动矩阵的行

我有一个矩阵准确地说是 2d numpy ndarray A np array 4 0 0 1 2 3 0 0 5 我想滚动每一行A根据另一个数组中的滚动值独立地 r np array 2 0 1 也就是说我想这样做 print np
您可以格式化 pandas 整数以进行显示，例如浮点数的“pd.options.display.float_format”？

我见过this https stackoverflow com questions 18404946 py pandas formatdataframe and this https stackoverflow com questions
立体太阳图 matplotlib 极坐标图 python

我正在尝试创建一个与以下类似的简单的立体太阳路径图 http wiki naturalfrequent com wiki Sun Path Diagram http wiki naturalfrequency com wiki Sun Pa
如何在不丢失注释和格式的情况下更新 YAML 文件 / Python 中的 YAML 自动重构

我想在 Python 中更新 YAML 文件值而不丢失 Python 中的格式和注释例如我想改造 YAML 文件 value 456 nice value to value 6 nice value 界面类似于 y yaml load
如何使用python在一个文件中写入多行

如果我知道要写多少行我就知道如何将多行写入一个文件但是当我想写多行时问题就出现了但是我不知道它们会是多少我正在开发一个应用程序它从网站上抓取并将结果的链接存储在文本文件中但是我们不知道它会回复多少行我的代码现在如下 r
pyspark 将 twitter json 流式传输到 DF

我正在从事集成工作spark streaming with twitter using pythonAPI 我看到的大多数示例或代码片段和博客是他们从Twitter JSON文件进行最终处理但根据我的用例我需要所有字段twitter J
javascript 是否有等效的 __repr__ ？

我最接近Python的东西repr这是 function User name password this name name this password password User prototype toString function r
如何在 Windows 命令行中使用参数运行 Python 脚本

这是我的蟒蛇hello py script def hello a b print hello and that s your sum sum a b print sum import sys if name main hello sys
Pandas 将多行列数据帧转换为单行多列数据帧

我的数据框如下 code df Car measurements Before After amb temp 30 268212 26 627491 engine temp 41 812730 39 254255 engine eff 15
python import inside函数隐藏现有变量

我在我正在处理的多子模块项目中遇到了一个奇怪的 UnboundLocalError 分配之前引用的局部变量问题并将其精简为这个片段使用标准库中的日志记录模块 import logging def foo logging info fo
Python ImportError：无法导入名称 __init__.py

我收到此错误 ImportError cannot import name life table from cdc life tables C Users tony OneDrive Documents Retirement retirem
使用for循环时如何获取前一个元素？ [复制]

这个问题在这里已经有答案了可能的重复 Python 循环内的上一个和下一个值 https stackoverflow com questions 1011938 python previous and next values inside
模拟pytest中的异常终止

我的多线程应用程序遇到了一个错误主线程的任何异常终止例如未捕获的异常或某些信号都会导致其他线程之一死锁并阻止进程干净退出我解决了这个问题但我想添加一个测试来防止回归但是我不知道如何在 pytest 中模拟异常终止如果我只
Keras：多类 NLP 任务中 model.evaluate 与 model.predict 的准确性差异

我正在使用以下代码在 keras 中为 NLP 任务训练一个简单模型训练集测试集和验证集的变量名称是不言自明的该数据集有 19 个类因此网络的最后一层有 19 个输出标签也是 one hot 编码的 nb classes 19 m
Kivy - 单击按钮时编辑标签

我希望 Button1 在单击时编辑标签 etykietka 但我不知道如何操作你有什么想法吗 class Zastepstwa App def build self lista WebOps getList layout BoxLayo

随机推荐

如何获取或生成 Google Cloud Run 服务的部署 URL

如何在 CI 环境中以编程方式获取已部署服务的 URL 成功部署后确实会记录 URL 但如果我想以编程方式提取并使用 URL 作为部署后需求的一部分例如该怎么办发布验收测试的 URL 只需使用该标志 format value stat
如何监控Linux上进程的线程数？

我想监视 Linux 上特定进程使用的线程数有没有一种简单的方法可以在不影响流程性能的情况下获取此信息 try ps huH p
如何在cx_Oracle和python 2.7中处理unicode数据？

我在用 Python 2 7 cx Oracle 6 0 2 我在我的代码中做了类似的事情 import cx Oracle connection string s s s 192 168 8 168 1521 xe connection
适用于 Azure Service Fabric 无状态 Web API 应用程序的 Swagger

我正在开发 Web API 服务并作为微服务托管在 Azure Service Fabric 上我需要为 API 定义实现 Swagger 并且我可以看到 SwaggerConfig Register 方法在应用程序启动时未调用所以我无
mysql_close 和 pg_close 是否是必需的？ [复制]

这个问题在这里已经有答案了可能的重复使用 mysql close https stackoverflow com questions 2065282 using mysql close 是否需要 mysql close 和 pg clo
Java HashMap Get 基准测试（JMH 与循环）

我的最终目标是使用标准 Java 集合作为基线为多个 Java 原始集合库创建一套全面的基准测试过去我曾使用循环方法来编写此类微基准我将要进行基准测试的函数放入循环中并迭代 100 万次以上以便 jit 有机会预热我计算循环的总时
如何在Python中使用AutoReg预测时间序列

我正在尝试仅使用自动回归算法来构建老式模型我发现它有一个实现statsmodel包裹我已阅读文档据我了解它应该像 ARIMA 一样工作所以这是我的代码 import statsmodels api as sm model sm
使用 AND 和 OR 的 C# 谓词生成器

我有以下课程 public class testClass public string name get set public int id get set public int age get set 和以下代码 var list new
如何在 MySQL 中返回数据透视表输出？

如果我有一个看起来像这样的 MySQL 表 company name action pagecount Company A PRINT 3 Company A PRINT 2 Company A PRINT 3 Company B EMAI
AttributeError：模块“jaxlib.xla_extension”没有属性“PmapFunction”

有人可以帮我修复在 check not jax transformed f 中的 usr local lib python3 7 dist packages haiku src transform py in check not jax t
Ruby Mechanize：点击链接

在 Mechanize on Ruby 中我必须为我访问的每个新页面分配一个新变量例如 page2 page1 link with text gt Continue click page3 page2 link with text gt
Cucumber 在一段时间后逐步停止执行

我的一个测试会等到事件发生Then步如果测试工作正常则没有问题但如果测试失败即没有触发任何事件那么它就会挂起我怎样才能设置超时Cucumber I know JUnit有一个超时参数您可以在 Test annotation h
使用 Spark SQL 跳过/获取

如何使用 Spark SQL 实现跳过获取查询典型的服务器端网格分页我在网上搜索过只能找到非常基本的示例例如 https databricks training s3 amazonaws com data exploration
使用键盘快捷键聚焦于文本字段

我有一个 macOS Monterrey 应用程序其中包含TextField在工具栏上我用它来搜索我的应用程序上的文本现在我正在尝试添加键盘快捷键以专注于TextField 我尝试了下面的代码添加带有快捷方式的按钮作为测试这是否可
在sqlite不同数据库中触发

我有 2 个不同的数据库 A 和 B 我需要创建一个触发器当我在数据库 A 的表 T1 中插入任何条目时数据库 B 的表 T2 的条目将得到已删除请给我推荐一个方法这不可能在SQLite中触发器内部的DML只能修改同一数据库的表
将字符串提取函数包装在 ifelse 语句中

下面的问题是一个延伸这个问题 https stackoverflow com questions 74135095 adding a column to the data that looks for a list of words and
在现实世界应用中使用语义网络技术的示例[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案您正在开发使用 RDF OWL SPARQL 技术的可能是商业的产品吗如果是这样您能描述一下您的产品吗 O Reilly 的
写入/编辑 CSV 文件（不要重写整个文件！）

我需要替换直接在 CSV 文件上操作的客户端的某些功能该文件用作系统的配置文件搜索到的大多数案例都是关于从 CSV 读取到其他格式的其他将整个 CSV 放入内存附加专用行和更改然后将它们写回新文件或覆盖现有文件我想更聪明地完成
Jetpack Compose 应用程序范围内的条件 TopAppBar 最佳实践

我有一个 Android Jetpack Compose 应用程序它使用BottomNavigation and TopAppBar可组合项从通过打开的选项卡BottomNavigation用户可以更深入地导航到导航图问题 The T
如何在python中实现小批量梯度下降？

我刚刚开始学习深度学习当谈到梯度下降时我发现自己陷入了困境我知道如何实现批量梯度下降我知道它是如何工作的以及小批量和随机梯度下降在理论上是如何工作的但实在无法理解如何用代码实现 import numpy as np X np ar

如何在python中实现小批量梯度下降？

如何在python中实现小批量梯度下降？ 的相关文章

随机推荐

热门标签

如何在python中实现小批量梯度下降？的相关文章