TensorFlow中矩阵乘法函数的使用

2024-03-22

我对这个函数的使用有点困惑tf.matmul()在 TensorFlow 中。不过，我的问题可能更多是关于深度学习的理论。假设你有一个输入 X 和权重矩阵 W（假设零偏差），我想将 WX 计算为输出，可以通过以下方式完成tf.matmul(W, X)。然而，在教程中适合初学者的 MNIST https://www.tensorflow.org/versions/master/tutorials/mnist/beginners/index.html#mnist-for-ml-beginners它是相反的并且tf.matmul(X, W)被用来代替。另一方面，在下一个教程中TensorFlow 力学 101 https://www.tensorflow.org/versions/master/tutorials/mnist/tf/index.html#tensorflow-mechanics-101, tf.matmul(W, X)用来。由于矩阵大小对于乘法很重要，我想知道是否有人可以澄清这个问题。

我想你一定是误读了《力学 101》教程——或者你能指出具体的一行吗？

一般来说，对于网络层，我认为输入“流经”权重。为了代表这一点，我写tf.matmul(Inputs, Weights)产生该层的输出。该输出可能会有偏差b添加到其中，并将结果输入到非线性函数（例如 relu）中，然后输入到另一个函数中tf.matmul作为下一层的输入。

其次，请记住，可以调整权重矩阵的大小以产生多个输出。这就是为什么它是一个矩阵，而不仅仅是一个向量。例如，如果您想要两个隐藏单元并且有五个输入特征，则可以使用形状[5, 2]权重矩阵，如下所示（为了便于说明，在 numpy 中显示 - 您可以在张量流中执行相同的操作）：

import numpy as np
a = np.array([1, 2, 3, 4, 5])
W = np.array([[.5, .6], [.7, .8], [.9, .1], [.2, .3], [.4, .5]])

>>> np.dot(a, W)
array([ 7.4,  6.2])

这有一个很好的行为，如果您添加一个批量维度a，它仍然有效： a = np.array[[1, 2, 3, 4, 5], [6,7,8,9,0]]

>>> np.dot(a, W)
array([[  7.4,   6.2],
       [ 20.9,  17.7]])

当您使用 tf.matmul 从输入特征到隐藏单元，或从一层隐藏单元到另一层时，这正是您正在做的事情。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

deeplearning

tensorflow

TensorFlow中矩阵乘法函数的使用的相关文章

重命名 TensorFlow 中保存模型的变量范围

是否可以在张量流中重命名给定模型的变量范围例如我根据教程创建了 MNIST 数字的逻辑回归模型 with tf variable scope my first scope NUM IMAGE PIXELS 784 NUM CLASS B
如何加载 caffe 模型并转换为 numpy 数组？

我有一个 caffemodel 文件其中包含 ethereon 的 caffe tensorflow 转换实用程序不支持的层我想生成我的咖啡模型的 numpy 表示我的问题是如何将 caffemodel 文件我还有 prototx
带有 TF 后端的 Keras：获取输出相对于输入的梯度

我有一个非常简单的 Keras MLP 并且我正在尝试获取输出相对于输入的梯度我正在使用以下代码 regressor Sequential Dense 32 input shape n features activation relu D
TensorFlow：训练时参数不更新

我正在使用 TensorFlow 实现分类模型我面临的问题是当我运行训练步骤时我的权重和误差没有更新结果我的网络不断返回相同的结果我根据以下内容开发了我的模型MNIST 示例 https www tensorflow org v
加载视频数据集（Keras）

我正在尝试实现 LRCN C LSTM RNN 来对视频中的情绪进行分类我的数据集结构分为两个文件夹 train set 和 valid set 当你打开其中任何一个时你可以找到3个文件夹积极消极和惊喜最后这 3 个文件夹中
如何在 Tensorflow 中计算 R^2

我正在尝试在 Tensorflow 中进行回归我不确定我计算 R 2 是否正确因为 Tensorflow 给出的答案与sklearn metrics r2 score有人可以看看我下面的代码让我知道我是否正确地实现了图中的方程谢谢
使用 keras.utils.Sequence 多处理和数据库 - 何时连接？

我正在使用 Keras 和 Tensorflow 后端训练神经网络数据集不适合 RAM 因此我将其存储在 Mongo 数据库中并使用子类检索批次keras utils Sequence 一切正常如果我跑的话model fit gene
张量流中是否存在无操作（传递）操作？

正如标题所示我想利用这样的操作来重命名节点并更好地组织图表或者是否有其他推荐的做法来重命名图中的现有节点谢谢有tf no op https www tensorflow org api docs python tf no op它允许
Windows 10 上的 Tensorflow 安装问题

我正在尝试在 Win 10 计算机上安装 Tensorflow 我成功安装了Python 3 7 然后尝试按照tensorflow org上的安装说明进行操作执行时 pip install tensorflow 我收到以下错误消息错误
张量流多元线性回归不收敛

我正在尝试使用张量流训练具有正则化的多元线性回归模型由于某种原因我无法获取以下代码的训练部分来计算我想要用于梯度下降更新的误差我在设置图表时做错了什么吗 def normalize data matrix averages np av
BERT 输出不确定

BERT 输出是不确定的当我输入相同的输入时我希望输出值是确定性的但我的 bert 模型的值正在变化听起来很尴尬同一个值返回两次一次也就是说一旦出现另一个值就会出现相同的值并重复如何使输出具有确定性让我展示我的代码片段
Keras 中的 model.fit() 和 model.evaluate() 有什么区别？

我使用 Keras 和 TensorFlow 后端来训练 CNN 模型之间是什么model fit and model evaluate 我应该最好使用哪一种我在用model fit 截至目前我知道的用处model fit and m
如何设置 1dCNN+LSTM 网络（Keras）的输入形状？

我有以下想法要实施 Input gt CNN gt LSTM gt Dense gt Output 输入有 100 个时间步长每个步长有一个 64 维特征向量 A Conv1D层将在每个时间步提取特征 CNN 层包含 64 个滤波器每个
Keras 中的 Tensorflow 自定义损失函数 - 张量循环

我正在尝试在 Keras 中编写自定义损失函数如下所示 Keras 中的自定义损失函数 https stackoverflow com questions 43818584 custom loss function in keras 我的
使用 Keras 的 ImageDataGenerator 预测单个图像

我对深度学习很陌生所以请原谅我这个可能很简单的问题我训练了一个网络来分类positive and negative 为了简化图像生成和拟合过程我使用了ImageDataGenerator和fit generator函数如下图 imp
Tensorflow批处理：将结果保留为字符串

这个简单的程序 import tensorflow as tf input string batch tf train batch tf constant input batch size 1 with tf Session as sess
当我想在电脑中加载该模型时，我可以在 colab bu 中加载我的深度模型，但我不能

我在colab中通过keras 2 3 1和tensorflow 2 1 0训练了一个深度模型我用JSON和Keras保存了我的模型 saveWeightPath content drive My Drive model info mod
在 Pytorch 中估计高斯模型的混合

我实际上想估计一个以高斯混合作为基本分布的归一化流所以我有点被火炬困住了但是您可以通过估计 torch 中高斯模型的混合来在代码中重现我的错误我的代码如下 import numpy as np import matplotlib p
对图像使用 Pixellib 自定义训练时出现 input_image 元形状错误

我正在使用 Pixellib 来训练自定义图像实例分割我创建了一个数据集可以在下面的链接中看到数据集 https drive google com drive folders 1MjpDNZtzGRNxEtCDcTmrjUuB1ics
在 Tensorflow 2.0 中的简单 LSTM 层之上添加 Attention

我有一个由一个 LSTM 和两个 Dense 层组成的简单网络如下所示 model tf keras Sequential model add layers LSTM 20 input shape train X shape 1 trai

随机推荐

ProtocolViolation：错误：绑定消息提供 0 个参数，但准备好的语句“”需要 1 个参数

我正在尝试创建一个留下评论的独特患者列表按照最先留下最近评论的患者的顺序排列这是我用于创建列表的 Ruby erb 代码 comment list order created at desc each with index do com
Java 中的 x86 80 位浮点类型

我想模拟 x86 扩展精度类型并执行算术运算并转换为 Java 中的其他类型我可以尝试使用 BigDecimal 来实现它但涵盖 NaN 无穷大和强制转换的所有特殊情况可能是一项乏味的任务我知道一些库提供比 double 精度更高的其
增加java中单个工作线程的堆栈空间

在我的java web应用程序中我有一个后台工作线程它需要大量的堆栈空间因为它使用activiti工作流引擎和groovy脚本任务运行一个非常复杂的工作流目前我需要在 64 位 Java 和 Tomcat 上将 JVM Xss 设
不同平台上的平台默认字符集？

一些遗留代码依赖于平台的默认字符集进行翻译对于西方世界中的 Windows 和 Linux 安装我知道这意味着什么但考虑到俄罗斯或亚洲平台我完全不确定他们平台的默认字符集是什么只是 UTF 16 因此我想知道执行以下代码行时会
Array.prototype.includes函数如何比较对象

在 ECMA 规范中我们读到Array prototype includes https tc39 es ecma262 sec array prototype includes uses 相同值零 https tc39 es ecma2
为什么错误：元素类型无效：需要一个字符串（对于内置组件）或一个类/函数（对于复合组件）但得到：数字

我正在运行这个程序来显示 SVG 图像 import React Component from react import View from react native import Expo from assets check mark s
不幸的是应用程序已停止 - android.os.NetworkOnMainThreadException [重复]

这个问题在这里已经有答案了我正在编写一个应用程序其中允许用户输入其详细信息但每当用户单击提交按钮时我都会收到错误消息错误消息如下不幸的是应用程序已停止 android os NetworkOnMainThreadExcept
通过键盘触发 JQuery 模态框的 Ctrl+P 打印

我有一个在 JQuery 模态框中弹出的文档该文档末尾有一个打印按钮只需打印弹出框中的文档我正在寻找一种解决方案可以通过按 Ctrl P 打印弹出框现在 Ctrl p 打印所有页面包括背景我只是希望找到一个解决方案帮助我仅在
如何使用 MSTest 从命令行运行 SpecFlow 场景？

我有 Visual Studio 2010 并且我们有两个使用的 VS 解决方案第一个是 Web 应用程序第二个是严格用于 SpecFlow 测试同时运行两个 Visual Studio 实例来运行 SpecFlow 功能会占用所有可
从另一个网站获取数据

我正在使用 PHP 创建一个新网站我想从另一个有我的个人资料的网站获取数据其中包含壁纸徽标等我想从该网站获取数据并将其显示在我的新网站的内容部分中请给我一些关于如何在 PHP 中完成此任务的想法提前致谢参见例如这卷曲延伸 ht
Clojure 中的惯用模式函数

我正在学习 Clojure 想要一些关于惯用用法的建议作为小型统计包的一部分我有一个计算一组数据的众数的函数背景众数是一组数据中最常见的值几乎有十几种已发布的算法来计算它这里使用的算法来自 Bernard Rosner 的生物
鼠标移动时滚动窗口

大家好我的意思是当鼠标移向窗口边缘 x 或 y 或两者时我希望页面滚动当鼠标停止移动时我希望页面停止滚动有很多关于如何基于使用 onClick 事件或窗口边缘的滚动区域进行滚动的示例但基于鼠标光标的移动的示例并不多任何帮助将
解析多部分表单数据

我正在尝试组合一个 HTML POST 表单该表单具有两个字段文件上传和文本字段由于表单具有用于文件上传的 multipart form data 类型因此我无法通过正常的 PHP POST 变量获取文本字段那么如何使用 PHP
ASP.NET 中的静态对象浪费内存？

前几天我只是想知道这个问题我不太确定 ASPX 如何管理垃圾处理但据我所知完成加载不会删除静态内存值或在页面重新加载后至少就 C 而言静态意味着内存分配会跟随您的程序直到程序本身关闭 ASPX 中也是这样吗如果我有一个静态值
我们可以在 C# 项目中使用 COM 对象吗？

我按照教程制作了一个 C COM 对象 http www codeproject com Articles 18939 C Com http www codeproject com Articles 18939 C Com 现在我想在 C
VB.NET 中的 UploadString（Post 方法）不起作用

我正在尝试将简单数据发布到某个站点在本例中发布到本地服务器上的 php 文件我的 VB NET 代码 Dim W As New Net WebClient Dim A As String W Encoding System Text E
Google 如何确定将页面索引为讨论页面？ [关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案我正在自己建立一个问答网站我想让这个网站被Google索引为问答网站或论坛可以在使用Google中的讨论时检索到根据我的个人经验当我想获得
pymongo：使用 MongoReplicaSetClient 的优点？

看来两者Mongo客户端 http api mongodb org python current api pymongo mongo client html and MongoReplicaSet客户端 http api mongodb o
IOS：停止 NSTimer [重复]

这个问题在这里已经有答案了可能的重复 NSTimer 不会停止 https stackoverflow com questions 1031554 nstimer doesnt stop 我有这个代码 NSTimer scheduledT
TensorFlow中矩阵乘法函数的使用

我对这个函数的使用有点困惑tf matmul 在 TensorFlow 中不过我的问题可能更多是关于深度学习的理论假设你有一个输入 X 和权重矩阵 W 假设零偏差我想将 WX 计算为输出可以通过以下方式完成tf matmul W

TensorFlow中矩阵乘法函数的使用

TensorFlow中矩阵乘法函数的使用 的相关文章

随机推荐

热门标签

TensorFlow中矩阵乘法函数的使用的相关文章