如何在张量流中实现多元线性随机梯度下降算法？

2024-01-18

我从单变量线性梯度下降的简单实现开始，但不知道将其扩展到多元随机梯度下降算法？

单变量线性回归

import tensorflow as tf
import numpy as np

# create random data
x_data = np.random.rand(100).astype(np.float32)
y_data = x_data * 0.5

# Find values for W that compute y_data = W * x_data 
W = tf.Variable(tf.random_uniform([1], -1.0, 1.0))
y = W * x_data

# Minimize the mean squared errors.
loss = tf.reduce_mean(tf.square(y - y_data))
optimizer = tf.train.GradientDescentOptimizer(0.01)
train = optimizer.minimize(loss)

# Before starting, initialize the variables
init = tf.initialize_all_variables()

# Launch the graph.
sess = tf.Session()
sess.run(init)

# Fit the line.
for step in xrange(2001):
    sess.run(train)
    if step % 200 == 0:
        print(step, sess.run(W))

你的问题有两部分：

如何把这个问题转移到更高维空间。
如何从批量梯度下降更改为随机梯度下降。

要获得更高维度的设置，您可以定义线性问题y = <x, w>。然后，您只需更改变量的维度W匹配以下之一w并替换乘法W*x_data通过标量积tf.matmul(x_data, W)你的代码应该运行得很好。

要将学习方法更改为随机梯度下降，您需要使用以下方法抽象成本函数的输入tf.placeholder.
一旦你定义了X and y_为了保存每一步的输入，您可以构建相同的成本函数。然后，您需要通过提供正确的小批量数据来调用您的步骤。

这是一个如何实现这种行为的示例，它应该表明：W很快收敛到w.

import tensorflow as tf
import numpy as np

# Define dimensions
d = 10     # Size of the parameter space
N = 1000   # Number of data sample

# create random data
w = .5*np.ones(d)
x_data = np.random.random((N, d)).astype(np.float32)
y_data = x_data.dot(w).reshape((-1, 1))

# Define placeholders to feed mini_batches
X = tf.placeholder(tf.float32, shape=[None, d], name='X')
y_ = tf.placeholder(tf.float32, shape=[None, 1], name='y')

# Find values for W that compute y_data = <x, W>
W = tf.Variable(tf.random_uniform([d, 1], -1.0, 1.0))
y = tf.matmul(X, W, name='y_pred')

# Minimize the mean squared errors.
loss = tf.reduce_mean(tf.square(y_ - y))
optimizer = tf.train.GradientDescentOptimizer(0.01)
train = optimizer.minimize(loss)

# Before starting, initialize the variables
init = tf.initialize_all_variables()

# Launch the graph.
sess = tf.Session()
sess.run(init)

# Fit the line.
mini_batch_size = 100
n_batch = N // mini_batch_size + (N % mini_batch_size != 0)
for step in range(2001):
    i_batch = (step % n_batch)*mini_batch_size
    batch = x_data[i_batch:i_batch+mini_batch_size], y_data[i_batch:i_batch+mini_batch_size]
    sess.run(train, feed_dict={X: batch[0], y_: batch[1]})
    if step % 200 == 0:
        print(step, sess.run(W))

两个旁注：

下面的实现称为小批量梯度下降，因为在每一步中，梯度都是使用大小数据的子集来计算的mini_batch_size。这是随机梯度下降的变体，通常用于稳定每一步的梯度估计。随机梯度下降可以通过设置获得mini_batch_size = 1.
可以在每个时期对数据集进行洗牌，以使实现更接近理论考虑。最近的一些工作还考虑仅对数据集使用一次传递，因为它可以防止过度拟合。对于更数学和详细的解释，你可以看到Bottou12 http://research.microsoft.com/pubs/192769/tricks-2012.pdf。这可以根据您的问题设置和您正在寻找的统计属性轻松更改。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何在张量流中实现多元线性随机梯度下降算法？的相关文章

使用 python requests 模块时出现 HTTP 503 错误

我正在尝试发出 HTTP 请求但当前可以从 Firefox 浏览器访问的网站响应 503 错误代码本身非常简单在网上搜索一番后我添加了user Agent请求参数但也没有帮助有人能解释一下如何消除这个 503 错误吗顺便说一句
将html数据解析成python列表进行操作

我正在尝试读取 html 网站并提取其数据例如我想查看公司过去 5 年的 EPS 每股收益基本上我可以读入它并且可以使用 BeautifulSoup 或 html2text 创建一个巨大的文本块然后我想搜索该文件我一直在使用
用枢轴点拟合曲线 Python

我有下面的图我想用 2 条线来拟合它使用 python 我设法适应上半部分 def func x a b x np array x return a x b popt pcov curve fit func up x up y 我想用另
使用 Python 从文本中删除非英语单词

我正在 python 上进行数据清理练习我正在清理的文本包含我想删除的意大利语单词我一直在网上搜索是否可以使用像 nltk 这样的工具包在 Python 上执行此操作例如给出一些文本 Io andiamo to the beach w
使用 kivy textinput 的 'input_type' 属性的问题

您好我在使用 kivy 的文本输入小部件的 input type 属性时遇到问题问题是我制作了两个自定义文本输入其中一个称为 StrText 其中设置了 input type text 然后是第二个文本输入名为 NumText 其
Python zmq SUB 套接字未接收 MQL5 Zmq PUB 套接字

我正在尝试在 MQL5 中设置一个 PUB 套接字并在 Python 中设置一个 SUB 套接字来接收消息我在 MQL5 中有这个 include
您可以格式化 pandas 整数以进行显示，例如浮点数的“pd.options.display.float_format”？

我见过this https stackoverflow com questions 18404946 py pandas formatdataframe and this https stackoverflow com questions
如何将张量流模型部署到azure ml工作台

我在用Azure ML Workbench执行二元分类到目前为止一切正常我有很好的准确性我想将模型部署为用于推理的 Web 服务我真的不知道从哪里开始 azure 提供了这个doc https learn microsoft co
Numpy - 根据表示一维的坐标向量的条件替换数组中的值

我有一个data多维数组最后一个是距离另一方面我有距离向量r 例如 Data np ones 20 30 100 r np linspace 10 50 100 最后我还有一个临界距离值列表称为r0 使得 r0 shape Dat
Cython 和类的构造函数

我对 Cython 使用默认构造函数有疑问我的 C 类 Node 如下 Node h class Node public Node std cerr lt lt calling no arg constructor lt lt std e
Python3 在 DirectX 游戏中移动鼠标

我正在尝试构建一个在 DirectX 游戏中执行一些操作的脚本除了移动鼠标之外我一切都正常是否有任何可用的模块可以移动鼠标适用于 Windows python 3 Thanks I used pynput https pypi or
使用特定颜色和抖动在箱形图上绘制数据点

我有一个plotly graph objects Box图我显示了箱形图中的所有点我需要根据数据的属性为标记着色如下所示我还想抖动这些点下面未显示 Using Box我可以绘制点并抖动它们但我不认为我可以给它们着色 fig a
如何使用原始 SQL 查询实现搜索功能

我正在创建一个由 CS50 的网络系列指导的应用程序这要求我仅使用原始 SQL 查询而不是 ORM 我正在尝试创建一个搜索功能用户可以在其中查找存储在数据库中的书籍列表我希望他们能够查询书籍表中的 ISBN 标题作者列目前它
为什么 Pickle 协议 4 中的 Pickle 文件是协议 3 中的两倍，而速度却没有任何提升？

我正在测试 Python 3 4 我注意到 pickle 模块有一个新协议因此我对 2 个协议进行了基准测试 def test1 pickle3 open pickle3 wb for i in range 1000000 pickle
python import inside函数隐藏现有变量

我在我正在处理的多子模块项目中遇到了一个奇怪的 UnboundLocalError 分配之前引用的局部变量问题并将其精简为这个片段使用标准库中的日志记录模块 import logging def foo logging info fo
实现 XGboost 自定义目标函数

我正在尝试使用 XGboost 实现自定义目标函数在 R 中但我也使用 python 所以有关 python 的任何反馈也很好我创建了一个返回梯度和粗麻布的函数它工作正常但是当我尝试运行 xgb train 时它不起作用然后我
如何计算Python中字典中最常见的前10个值

我对 python 和一般编程都很陌生所以请友善我正在尝试分析包含音乐信息的 csv 文件并返回最常听的前 n 个乐队从下面的代码中每听一首歌曲都是一个列表中的字典条目格式如下 album Exile on Main Street
cv2.VideoWriter：请求一个元组作为 Size 参数，然后拒绝它

我正在使用 OpenCV 4 0 和 Python 3 7 创建延时视频构造 VideoWriter 对象时文档表示 Size 参数应该是一个元组当我给它一个元组时它拒绝它当我尝试用其他东西替换它时它不会接受它因为它说参数不是
使用 z = f(x, y) 形式的 B 样条方法来拟合 z = f(x)

作为一个潜在的解决方案这个问题 https stackoverflow com questions 76476327 how to avoid creating many binary switching variables in gekk
使用随机放置的 NaN 创建示例 numpy 数组

出于测试目的我想创建一个M by Nnumpy 数组与c随机放置的 NaN import numpy as np M 10 N 5 c 15 A np random randn M N A mask np nan 我在创建时遇到问题mas

随机推荐

在媒体窗口中选择图片后添加/更新自定义字段 (Wordpress)

我有一个关于 WordPress 的问题我刚刚在添加编辑帖子页面中添加了一个名为添加滑块的按钮这是我的 function php 中的代码 Add button to create slider add action media
求值器中的表达式非法（&访问冲突）

我试图通过使用类 Tbb2uc 来处理纯文本文件加载到 StringList 中但在调用函数 GetAddress 时获取 AV TArrayQuotePositions array 1 4 of integer Tbb2uc clas
将 CSV 直接下载到 Python CSV 解析器中

我正在尝试从 Morningstar 下载 CSV 内容然后解析其内容如果我将 HTTP 内容直接注入 Python 的 CSV 解析器结果的格式不正确然而如果我将 HTTP 内容保存到文件 tmp tmp csv 然后将该文件导
如何从 MailItem 获取特定于任务的属性

我一直在为自己做一个周末小项目其中包括从 Outlook 获取所有 ToDo 任务将它们放入 DataGridView 中然后我就能够编辑和导出它们我遇到的唯一问题是当标记的电子邮件仍然存在时我无法获取它们的任务特定属性我只是
声明 std::string 变量后，Cout 没有输出

我编写了一个简单的程序返回作为参数传递的 IP 地址的主机名该程序使用两个函数 getaddrinfo 和 getnameinfo 我正在使用 Linux Mint Netbeans IDE 和 G 编译器输出没问题没有错误但是当
阿拉伯字符“？？？？？？”关于 php 和 mysql [重复]

这个问题在这里已经有答案了这是我的问题我有一个阿拉伯数据库 mysqli UTF8 general ci 并且我的 php 文件的字符集是 UTF 8 当我出售数据时我得到在 php 上我的管理员我可以毫无问题地写入和读取在 p
Django 模型主键作为一对

我正在尝试制作一个应用程序用户可以登录他们的个人资料并将歌曲添加到他们最喜欢的列表中我为此定义了 M2M 关系我的问题是如何说歌曲歌手的组合是独特的我搜索了一下发现通过unique together也许可以这是设置的正确方
使用 LEFT JOIN 删除

我想根据引用第一个表的另一个表中存在的数据从表中删除但是当我将其作为 SELECT stetement 运行时我有有效的代码并显示要删除的值但是当我将其更改为删除它给了我错误我不明白它们为什么在那里 DELETE leadCust
如何使用facet_wrap在每个方面具有不同数字的离散类别之间创建相等的距离

我的目标是使图中所有国家之间的距离大致相等例如在第一类中 Increase 国家分散另一方面第二类和第三类国家彼此距离太近这迫使我减小国家文本的大小例如 IS UK 和绘制的估计值例如 1 5 1 2 因此一旦我将此文件提取
GCE Kubernetes 会话持久化

我正在 GCE Kubernetes 上运行一个 wordpress woocommerce 网站但由于会话持久性而在扩展时遇到问题 LoadBalancer GCE Ingress 将所有流量发送到反向代理然后反向代理将流量发送到我设
在 Scala 中将列表[Try[A]] 转换为列表[A]

我想从输入数据中过滤掉错误的输入我目前正在使用scala util Try包装任何异常下面是一个简单的例子其中 3I 抛出一个NumberFormatException 我想知道在 Scala 中是否有更好的方法来做到这一点 val
OpenGL 和 QtQuick 纹理问题

我正在基于 Qt 附带的 openglunderqml 示例在 C 中开发一个简单的 QQuickItem 实现我做了一些修改以使用不同的着色器和加载的两个纹理这个想法是着色器将在两个纹理之间交叉淡入淡出本质上只是我加载到纹理中的图像
Flutter Web：堆栈和耀斑问题

我试图在 Flutter Web 开发频道 v1 13 2 上创建一个简单的网页但出现了这个奇怪的问题当我尝试在堆栈小部件中放置耀斑动画时该堆栈小部件分别有 2 个附加小部件一个背景和一个居中文本耀斑似乎没有出现但是当我移除背景
如何将 8 个打包的 32 位整数（在 __m256i 中）的 +-1 符号打包为 64 位整数的字节？

给定一个 m256i打包 32 位有符号整数的价值如何获取每个字节所在的单个 64 位数字1如果原始的相应 32 位有符号整数 m256i大于或等于0 并得到 1如果该 32 位整数是负数 AVX2 可能还有 AVX512 很有趣这是另
Jenkins 要求接受 TFS EULA

我在 Jenkins 上创建了一个附加到 TFS 服务器的构建作业我使用 Team Explorer Everywhere 来促进这一点我第一次运行该作业时收到以下消息 Error You must accept the End Us
如何使用 Express.js 指定 HTTP 错误代码？

我努力了 app get function req res next var e new Error error message e status 400 next e and app get function req res next r
FIND_IN_SET 有两个字符串

我有这个员工列表的员工表 ID EMPLOYEE ID SKILLS 1 1 3 4 2 2 3 5 2 3 3 1 5 和列
ARC Welder 打包的 Android 应用程序只能在 Chrome 操作系统上使用吗？

如果我使用 Google ARC Welder 打包 Android 应用程序并通过 Chrome 网上应用店分发它它是否适用于 Windows Mac Linux 还是仅适用于 Chrome 操作系统如果是这样有什么消息表明这种情况
使用 openssl C 进行 AES（aes-cbc-128、aes-cbc-192、aes-cbc-256）加密/解密

我只想用这 3 种模式测试 openSSL 的 AES 密钥长度为 128 192 和 256 但我的解密文本与我的输入不同我不知道为什么另外当我传递一个巨大的输入长度比方说 1024 字节时我的程序显示core dumped
如何在张量流中实现多元线性随机梯度下降算法？

我从单变量线性梯度下降的简单实现开始但不知道将其扩展到多元随机梯度下降算法单变量线性回归 import tensorflow as tf import numpy as np create random data x data np r

如何在张量流中实现多元线性随机梯度下降算法？

如何在张量流中实现多元线性随机梯度下降算法？ 的相关文章

随机推荐

热门标签

如何在张量流中实现多元线性随机梯度下降算法？的相关文章