TensorFlow中矩阵乘法函数的使用

2024-03-22

我对这个函数的使用有点困惑tf.matmul()在 TensorFlow 中。不过,我的问题可能更多是关于深度学习的理论。假设你有一个输入 X 和权重矩阵 W(假设零偏差),我想将 WX 计算为输出,可以通过以下方式完成tf.matmul(W, X)。然而,在教程中适合初学者的 MNIST https://www.tensorflow.org/versions/master/tutorials/mnist/beginners/index.html#mnist-for-ml-beginners它是相反的并且tf.matmul(X, W)被用来代替。另一方面,在下一个教程中TensorFlow 力学 101 https://www.tensorflow.org/versions/master/tutorials/mnist/tf/index.html#tensorflow-mechanics-101, tf.matmul(W, X)用来。由于矩阵大小对于乘法很重要,我想知道是否有人可以澄清这个问题。


我想你一定是误读了《力学 101》教程——或者你能指出具体的一行吗?

一般来说,对于网络层,我认为输入“流经”权重。为了代表这一点,我写tf.matmul(Inputs, Weights)产生该层的输出。该输出可能会有偏差b添加到其中,并将结果输入到非线性函数(例如 relu)中,然后输入到另一个函数中tf.matmul作为下一层的输入。

其次,请记住,可以调整权重矩阵的大小以产生多个输出。这就是为什么它是一个矩阵,而不仅仅是一个向量。例如,如果您想要两个隐藏单元并且有五个输入特征,则可以使用形状[5, 2]权重矩阵,如下所示(为了便于说明,在 numpy 中显示 - 您可以在张量流中执行相同的操作):

import numpy as np
a = np.array([1, 2, 3, 4, 5])
W = np.array([[.5, .6], [.7, .8], [.9, .1], [.2, .3], [.4, .5]])

>>> np.dot(a, W)
array([ 7.4,  6.2])

这有一个很好的行为,如果您添加一个批量维度a,它仍然有效: a = np.array[[1, 2, 3, 4, 5], [6,7,8,9,0]]

>>> np.dot(a, W)
array([[  7.4,   6.2],
       [ 20.9,  17.7]])

当您使用 tf.matmul 从输入特征到隐藏单元,或从一层隐藏单元到另一层时,这正是您正在做的事情。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

TensorFlow中矩阵乘法函数的使用 的相关文章

随机推荐

  • ProtocolViolation:错误:绑定消息提供 0 个参数,但准备好的语句“”需要 1 个参数

    我正在尝试创建一个留下评论的独特患者列表 按照最先留下最近评论的患者的顺序排列 这是我用于创建列表的 Ruby erb 代码 comment list order created at desc each with index do com
  • Java 中的 x86 80 位浮点类型

    我想模拟 x86 扩展精度类型并执行算术运算并转换为 Java 中的其他类型 我可以尝试使用 BigDecimal 来实现它 但涵盖 NaN 无穷大和强制转换的所有特殊情况可能是一项乏味的任务 我知道一些库提供比 double 精度更高的其
  • 增加java中单个工作线程的堆栈空间

    在我的java web应用程序中 我有一个后台工作线程 它需要大量的堆栈空间 因为它使用activiti工作流引擎和groovy脚本任务运行一个非常复杂的工作流 目前 我需要在 64 位 Java 和 Tomcat 上将 JVM Xss 设
  • 不同平台上的平台默认字符集?

    一些遗留代码依赖于平台的默认字符集进行翻译 对于 西方世界 中的 Windows 和 Linux 安装 我知道这意味着什么 但考虑到俄罗斯或亚洲平台 我完全不确定他们平台的默认字符集是什么 只是 UTF 16 因此我想知道执行以下代码行时会
  • Array.prototype.includes函数如何比较对象

    在 ECMA 规范中 我们读到Array prototype includes https tc39 es ecma262 sec array prototype includes uses 相同值零 https tc39 es ecma2
  • 为什么错误:元素类型无效:需要一个字符串(对于内置组件)或一个类/函数(对于复合组件)但得到:数字

    我正在运行这个程序来显示 SVG 图像 import React Component from react import View from react native import Expo from assets check mark s
  • 不幸的是应用程序已停止 - android.os.NetworkOnMainThreadException [重复]

    这个问题在这里已经有答案了 我正在编写一个应用程序 其中允许用户输入其详细信息 但每当用户单击 提交 按钮时 我都会收到错误消息 错误消息如下 不幸的是应用程序已停止 android os NetworkOnMainThreadExcept
  • 通过键盘触发 JQuery 模态框的 Ctrl+P 打印

    我有一个在 JQuery 模态框中弹出的文档 该文档末尾有一个打印按钮 只需打印弹出框中的文档 我正在寻找一种解决方案 可以通过按 Ctrl P 打印弹出框 现在 Ctrl p 打印所有页面 包括背景 我只是希望找到一个解决方案 帮助我仅在
  • 如何使用 MSTest 从命令行运行 SpecFlow 场景?

    我有 Visual Studio 2010 并且我们有两个使用的 VS 解决方案 第一个是 Web 应用程序 第二个是严格用于 SpecFlow 测试 同时运行两个 Visual Studio 实例来运行 SpecFlow 功能会占用所有可
  • 从另一个网站获取数据

    我正在使用 PHP 创建一个新网站 我想从另一个有我的个人资料的网站获取数据 其中包含壁纸 徽标等 我想从该网站获取数据并将其显示在我的新网站的内容部分中 请给我一些关于如何在 PHP 中完成此任务的想法 提前致谢 参见例如这卷曲延伸 ht
  • Clojure 中的惯用模式函数

    我正在学习 Clojure 想要一些关于惯用用法的建议 作为小型统计包的一部分 我有一个计算一组数据的众数的函数 背景 众数是一组数据中最常见的值 几乎有十几种已发布的算法来计算它 这里使用的算法来自 Bernard Rosner 的 生物
  • 鼠标移动时滚动窗口

    大家好我的意思是 当鼠标移向窗口边缘 x 或 y 或两者 时 我希望页面滚动 当鼠标停止移动时 我希望页面停止滚动 有很多关于如何基于使用 onClick 事件或窗口边缘的滚动区域进行滚动的示例 但基于鼠标光标的移动的示例并不多 任何帮助将
  • 解析多部分表单数据

    我正在尝试组合一个 HTML POST 表单 该表单具有两个字段 文件上传和文本字段 由于表单具有用于文件上传的 multipart form data 类型 因此我无法通过正常的 PHP POST 变量获取文本字段 那么如何使用 PHP
  • ASP.NET 中的静态对象浪费内存?

    前几天我只是想知道这个问题 我不太确定 ASPX 如何管理垃圾处理 但据我所知 完成加载 不会删除静态内存值或在页面重新加载后 至少就 C 而言 静态意味着内存分配会跟随您的程序 直到程序本身关闭 ASPX 中也是这样吗 如果我有一个静态值
  • 我们可以在 C# 项目中使用 COM 对象吗?

    我按照教程制作了一个 C COM 对象 http www codeproject com Articles 18939 C Com http www codeproject com Articles 18939 C Com 现在我想在 C
  • VB.NET 中的 UploadString(Post 方法)不起作用

    我正在尝试将简单数据发布到某个站点 在本例中发布到本地服务器上的 php 文件 我的 VB NET 代码 Dim W As New Net WebClient Dim A As String W Encoding System Text E
  • Google 如何确定将页面索引为讨论页面? [关闭]

    Closed 这个问题是无关 help closed questions 目前不接受答案 我正在自己建立一个问答网站 我想让这个网站被Google索引为问答网站或论坛 可以在使用Google中的 讨论 时检索到 根据我的个人经验 当我想获得
  • pymongo:使用 MongoReplicaSetClient 的优点?

    看来两者Mongo客户端 http api mongodb org python current api pymongo mongo client html and MongoReplicaSet客户端 http api mongodb o
  • IOS:停止 NSTimer [重复]

    这个问题在这里已经有答案了 可能的重复 NSTimer 不会停止 https stackoverflow com questions 1031554 nstimer doesnt stop 我有这个代码 NSTimer scheduledT
  • TensorFlow中矩阵乘法函数的使用

    我对这个函数的使用有点困惑tf matmul 在 TensorFlow 中 不过 我的问题可能更多是关于深度学习的理论 假设你有一个输入 X 和权重矩阵 W 假设零偏差 我想将 WX 计算为输出 可以通过以下方式完成tf matmul W