MatMul 运算在张量流中如何工作？

2024-01-15

我注意到张量流中定义的 MatMul 运算：

形状函数：

Status MatMulShape(shape_inference::InferenceContext* c) {
   ShapeHandle a;
   TF_RETURN_IF_ERROR(c->WithRank(c->input(0), 2, &a));
   ShapeHandle b;
   TF_RETURN_IF_ERROR(c->WithRank(c->input(1), 2, &b));

和 MatMulOp 中的计算函数：

void Compute(OpKernelContext* ctx) override {
   const Tensor& a = ctx->input(0);
   const Tensor& b = ctx->input(1);

   // Check that the dimensions of the two matrices are valid.
   OP_REQUIRES(ctx, TensorShapeUtils::IsMatrix(a.shape()),
             errors::InvalidArgument("In[0] is not a matrix"));
   OP_REQUIRES(ctx, TensorShapeUtils::IsMatrix(b.shape()),
             errors::InvalidArgument("In[1] is not a matrix"));

这意味着输入的等级是 2，但是以下是可以的：

a=tf.placeholder(tf.int32, [None, None, None])
b=tf.placeholder(tf.int32, [None, None, None])
c=tf.matmul(a, b)

它包括一个额外的批次暗淡。我想知道怎么运行的.

我定义了一个ngram op，输入是一个1阶张量：

TF_RETURN_IF_ERROR(c->WithRank(c->input(0), 1, &sent));

但应用批处理时会出现错误：

a = tf.placeholder(tf.int32, [None, None])
c = ngram.ngram(a, vocab_size=5000, bucket_size=100000, word_ngrams=3)

why?

我检查了代码，发现批处理工作应该另外完成。 python/ops/math_ops.py 中的 matmul 函数：

def matmul (a, b, ....
    ...
    if (not a_is_sparse and not b_is_sparse) and ((a_shape is None or len(a_shape) > 2) and (b_shape is None or len(b_shape) > 2)):
        ...
        return gen_math_ops._batch_mat_mul(a, b, adj_x=adjoint_a, adj_y=adjoint_b, name=name)

python/ops/gen_math_ops.py 中的 _batch_mat_mul 函数：

def _batch_mat_mul(x, y, adj_x=False, adj_y=False, name=None):
    ...
    if _ctx.in_graph_mode():
        _, _, _op = _op_def_lib._apply_op_helper("BatchMatMul", x=x, y=y, adj_x=adj_x, adj_y=adj_y, name=name)

在 BatchMatMul(tensorflow/core/kernals/batch_matmul_op_impl.h) 中计算：

void Compute(OpKernelContext* ctx) override {
    const Tensor& in0 = ctx->input(0);
    const Tensor& in1 = ctx->input(1);
    OP_REQUIRES(ctx, in0.dims() == in1.dims(),
                errors::InvalidArgument("In[0] and In[1] has different ndims: ",
                                        in0.shape().DebugString(), " vs. ",
                                        in1.shape().DebugString()));
    const int ndims = in0.dims();
    OP_REQUIRES(
        ctx, ndims >= 2,
        errors::InvalidArgument("In[0] and In[1] ndims must be >= 2: ", ndims));
    TensorShape out_shape;
    for (int i = 0; i < ndims - 2; ++i) {
      OP_REQUIRES(ctx, in0.dim_size(i) == in1.dim_size(i),
                  errors::InvalidArgument("In[0].dim(", i, ") and In[1].dim(",
                                          i, ") must be the same: ",
                                          in0.shape().DebugString(), " vs ",
                                          in1.shape().DebugString()));
      out_shape.AddDim(in0.dim_size(i));
    }
    auto n = (ndims == 2) ? 1 : out_shape.num_elements();
    auto d0 = in0.dim_size(ndims - 2);
    auto d1 = in0.dim_size(ndims - 1);
    Tensor in0_reshaped;
    CHECK(in0_reshaped.CopyFrom(in0, TensorShape({n, d0, d1})));
    auto d2 = in1.dim_size(ndims - 2);
    auto d3 = in1.dim_size(ndims - 1);
    Tensor in1_reshaped;
    CHECK(in1_reshaped.CopyFrom(in1, TensorShape({n, d2, d3})));
    if (adj_x_) std::swap(d0, d1);
    if (adj_y_) std::swap(d2, d3);
    OP_REQUIRES(ctx, d1 == d2,
                errors::InvalidArgument(
                    "In[0] mismatch In[1] shape: ", d1, " vs. ", d2, ": ",
                    in0.shape().DebugString(), " ", in1.shape().DebugString(),
                    " ", adj_x_, " ", adj_y_));
    out_shape.AddDim(d0);
    out_shape.AddDim(d3);
    Tensor* out = nullptr;
    OP_REQUIRES_OK(ctx, ctx->allocate_output(0, out_shape, &out));
    if (out->NumElements() == 0) {
      return;
    }
    if (in0.NumElements() == 0 || in1.NumElements() == 0) {
      functor::SetZeroFunctor<Device, Scalar> f;
      f(ctx->eigen_device<Device>(), out->flat<Scalar>());
      return;
    }
    Tensor out_reshaped;
    CHECK(out_reshaped.CopyFrom(*out, TensorShape({n, d0, d3})));
    LaunchBatchMatMul<Device, Scalar>::Launch(ctx, in0_reshaped, in1_reshaped,
                                              adj_x_, adj_y_, &out_reshaped);
  }

最后每个矩阵乘法在某个“Run”函数中计算：

static void Run(const Tensor& in_x, const Tensor& in_y, bool adj_x,
                bool adj_y, Tensor* out, int start, int limit) {
  for (int i = start; i < limit; ++i) {
    auto x = ConstTensorSliceToEigenMatrix(in_x, i);
    auto y = ConstTensorSliceToEigenMatrix(in_y, i);
    auto z = TensorSliceToEigenMatrix(out, i);
    // TODO(rmlarsen): Get rid of the special casing here when we have
    // upstreamed improvements for matrix*vector and vector*matrix to
    // Eigen's general matrix product.
    if (!adj_x && x.rows() == 1) {
      Multiply(adj_x, adj_y, x.row(0), y, z);
    } else if (adj_x && x.cols() == 1) {
      Multiply(adj_x, adj_y, x.col(0), y, z);
    } else if (!adj_y && y.cols() == 1) {
      Multiply(adj_x, adj_y, x, y.col(0), z);
    } else if (adj_y && y.rows() == 1) {
      Multiply(adj_x, adj_y, x, y.row(0), z);
    } else {
      Multiply(adj_x, adj_y, x, y, z);
    }
  }
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

c

tensorflow

MatMul 运算在张量流中如何工作？的相关文章

无法对 ContainsGenericParameters 为 true 的类型或方法执行后期绑定操作

我有一个适用于所有实体的扩展 public static class EntityBaseExtensions public static T Clone
如何在C编程中获取当前时间（以毫秒为单位）[重复]

这个问题在这里已经有答案了可能的重复如何使用 ANSI C 测量以毫秒为单位的时间 https stackoverflow com questions 361363 how to measure time in milliseconds
静态成员函数与C语言绑定？

以下 C 代码可使用 Visual C 和 g 进行编译 struct S static void foo extern C void S foo struct T static void foo extern C void T foo a
ZedGraph 缩放和调整大小

当我绘制图形放大和缩小并重新绘制图形时图形的位置不会改变我想要做的是每当重新绘制数据时视图都会更改以查看所有图形数据如果您在重绘之前放大或缩小这似乎会被禁用 Thanks 设置属性 IsZoomOnMouseCenter对于控
C++17 中带有 noexcept 的 std::function

在 C 17 中noexcept 已添加到类型系统中 http www open std org jtc1 sc22 wg21 docs papers 2015 p0012r1 html void r1 void f noexcept f
NUnit 测试运行顺序

默认情况下 nunit 测试按字母顺序运行有谁知道有什么方法可以设置执行顺序吗是否存在这样的属性我只是想指出虽然大多数受访者认为这些是单元测试但问题并没有具体说明它们是 nUnit 是一个很棒的工具可用于各种测试情况我可以看到
有哪些 API 可在 Windows 中使用 C# 配置扬声器设置？

我环顾了很多不同的地方但似乎找不到一个简单的方法来做到这一点我在 Windows 7 中有多个声卡并使用 HDMI 将声音输出到我的 AVR 放大器我遇到的问题是当放大器关闭时它会导致窗口丢失扬声器配置所以我想做的是编写一个小
没有真正理解 std::atomic::compare_exchange_weak 和compare_exchange_strong 的逻辑

我读了https en cppreference com w cpp atomic atomic compare exchange https en cppreference com w cpp atomic atomic compare
为什么Boost在“程序选项”中使用全局函数覆盖来实现自定义验证器

这个例子 http www boost org doc libs 1 55 0 doc html program options howto html idp163429032显示一个名为validate在全局范围内定义重载函数boost
使用成员函数作为 std::shared_ptr 的自定义删除器时出现问题

我正在尝试弄清楚如何将 std shared ptr 与自定义删除器一起使用具体来说我将其与 SDL Surface 一起使用如下所示 std shared ptr
让 GCC/Clang 使用 CMOV

我有一个简单的标记值联合这些值可以是int64 ts or doubles 我正在对这些联合进行加法但需要注意的是如果两个参数都代表int64 t值那么结果也应该有一个int64 t value 这是代码 include
编译器在函数名称前添加下划线前缀的原因是什么？

当我看到 C 应用程序的汇编代码时如下所示 emacs hello c clang S O hello c o hello s cat hello s 函数名称以下划线作为前缀例如callq printf 为什么这样做以及它有什么优点
适用于 Windows 的键值数据库？

除了 MongoDB 和 Memcached 之外 Windows 上还运行哪些键值存储我见过的大多数似乎只能在 Linux 上运行 Hypertable Redis Lightcloud 相关链接是否有经过商业验证的云存储 Key g
使用 for 循环创建链表

这是我的结构 struct ListItem int data struct ListItem next 假设链表的第一个节点的 data 0 我想编写一个 for 循环来创建大小为 5 的链表但我不知道如何工作我尝试了以下方法 int
带有 Unicode 字符的主机名在 Windows 8 中有效

Uri CheckHostName 回报UriHostNameType Unknown到处都是但在 Windows 8 上它又回来了UriHostNameType Dns 为什么突然间带有 Unicode 西里尔字符的主机名在 Wind
RabbitMQ + Windows + LDAP 无需发送密码

我正在尝试在 Windows 7 上使用 RabbitMQ 3 6 2 进行 LDAP 身份验证授权我已经在应用程序发送用户名密码的情况下进行了基本身份验证但密码位于我需要弄清楚如何进行的代码中避免有没有人在不提供密码的情况下成功
即使对于新上下文，OnModelCreating 也仅调用一次

我有多个相同但内容不同的 SQL Server 表在编写代码优先 EF6 程序时我尝试为每个程序重用相同的数据库上下文并将表名称传递给上下文构造函数然而虽然每次都会调用构造函数但尽管每次都是从 new 创建数据库上下文但 On
使用自定义层运行 Keras 模型时出现问题

我目前正在攻读学士学位论文FIIT STU https www fiit stuba sk en html page id 749 其主要目标是尝试复制和验证以下结果study http arxiv org abs 2006 00885 这
如何通过Task.ContinueWith创建传递？

我想在原始任务结束时添加一个任务但想保留原始结果和类型附加任务仅用于记录目的例如写入控制台等例如 Task Run gt DateTime Now Hour gt 12 Hey throw new Exception Continu
为什么 32 位 .NET 进程的引用类型的最小大小为 12 字节

我正在读专业 Net 性能 https rads stackoverflow com amzn click com 1430244585本书有关参考类型内部结构的部分它提到对于 32 位 net 进程引用类型具有 4 字节的对象头和

随机推荐

Tomcat项目清理错误

当我尝试从 tomcat 中清理项目时我收到此错误无法删除可能被另一个进程锁定有什么办法可以解决这个问题吗首先尝试只restart tomcat 然后尝试clean一切清理Tomcat服务器在Eclipse中右键单击To
iOS通用应用程序链接是否支持使用同一域的多个应用程序？

背景为多个客户端构建普通应用程序相同的代码库具有不同的包 ID 即 com 公司 client1 com 公司 client2 希望使用相同的通用应用程序链接支持所有客户端版本即 company com app path 尝试将其添加
在Emacs中，如何在当前文件的函数之间跳转？

我想快速将指向移动到 Emacs 缓冲区中的函数我想运行一些函数并得到一个提示询问我函数名称并为当前缓冲区中定义的每个函数提供完成我通常使用 etag 进行导航但有时我正在寻找已在多个文件中覆盖的框架方法在这些情况下我可以找到
有没有办法像我们在 iOS 中那样将用户发送到 macOS 下应用程序的隐私设置？

与许多应用程序一样如果禁用了某些隐私权限我的 iOS 应用程序将为用户提供打开应用程序设置页面的机会在iOS中使用特殊的UIApplicationOpenSettingsURLString openSettingsURLString
为什么在中断上下文中执行的内核代码/线程无法休眠？

我正在阅读罗伯特洛夫 Robert Love 撰写的以下文章 http www linuxjournal com article 6916 http www linuxjournal com article 6916 说的是让我们讨论一
从 URL 打开应用程序适用于 Android 版 Firefox，但不适用于 Google Chrome

我想在用户点击我的网页链接最好是来自 Facebook 共享帖子但让我们从纯 URL 开始时打开我的 Android 应用程序为了实现这一目标我创建了一个 ActivityUrlReceiver并将此代码添加到我的AndroidM
你会写 seq x x 吗？

我不太清楚 seq 在 Haskell 中是如何工作的看来在很多情况下写起来很有用 seq x x 甚至可以定义一个函数 strict x seq x x 但这样的功能还不存在所以我猜这种方法在某种程度上是错误的有人可以告诉我这是否有
列表框鼠标悬停背景颜色

我遇到的问题是 MouseOver 触发器在选定的行上为背景着色失败对于任何未选定的行鼠标悬停时背景会变成蓝色但所选行没有蓝色背景单击一行然后蓝色背景消失我还尝试了 ListBox ItemContainerStyle 中的样式
XmlDocument.WriteTo 截断生成的文件

尝试将 XmlDocument 序列化为文件 XmlDocument 相当大但是在调试器中我可以看到 InnerXml 属性中包含所有 XML blob 它没有被截断以下是将 XmlDocument 对象写入文件的代码 Write t
聊天应用程序：node.js 还是 APE？

我想创建一个聊天应用程序它将使用 php codeigniter 来执行视图和用户界面我在 stackoverflow 上阅读了很多推荐 node js 或 socket io 的帖子但我也遇到过 APE Ajax Push Engi
C 中二维数组的内存映射

你觉得什么这次讨论 http www mattababy org belmonte Teaching CCC CrashCourseC html关于二维数组的内存映射是否正确尤其是这张照片 http www mattababy org b
如何在 cakephp 中设置 cron 作业？

我如何使用 cakephp 中的 cron 作业来调用 Ubuntu 上控制器的操作我试图通过 crontab 来完成它但它不起作用使用外壳在 cron 作业中使用 CakePHP 应用程序的 Cake Way 是创建 shell
抽象类中的公共构造函数是代码吗？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案抽象类中的公共构造函数是代码吗将构造函数设置为受保护可以提供您可以使用的所有访问权限使其成为公共将提供的唯一额外访问权限是允许将类的实例声明
如何导入 require.cache 和 require.resolve

因为我在 package json 中使用模块类型或import而不是要求我如何导入 require cache 和 require resolve 我正在尝试重新加载文件并更新所做的更改 error require is not def
Scala 类型（推理）问题？

我正在 Scala 中使用以下方法开发 REST Web 服务Jersey http jersey java net JAX RS 参考实现我收到一个奇怪的错误我正在尝试创建一个内容配置 http jersey java net non
更改单元格中部分文本的字体颜色

我的单元格将包含以下值 Image not allowed png 我想改变颜色 png独自一人或之后发生的任何事情现在我尝试使用下面的代码更改字体颜色 Cells 4 2 Font Color RGB 255 50 25 它将更改整个单
在包含 AudioToolbox 框架的 Objective-C iOS 项目中找不到 AudioServices.h

根据苹果文档 AudioServices h应该是AudioToolbox框架的一部分尽管我已将 AudioToolbox 框架添加到我的 Xcode 项目中但当我 import AudioServices 时我收到错误未找到 Au
在 foreach 中强制转换为数组是否被认为是一种不好的做法？

在启动 foreach 循环时转换为数组是否被认为是一种不好的做法像这样的事情 foreach array examples as example Do stuff 这可以防止为 foreach 提供的参数无效免于发生或者首先检查它
如何使用Keras API提取“从输入层到隐藏层”和“从隐藏层到输出层”的权重？

我是 Keras 新手我正在尝试获取 Keras 中的权重我知道如何在 Python 中的 Tensorflow 中执行此操作 Code data np array attributes int64 target np array la
MatMul 运算在张量流中如何工作？

我注意到张量流中定义的 MatMul 运算形状函数 Status MatMulShape shape inference InferenceContext c ShapeHandle a TF RETURN IF ERROR c gt W

MatMul 运算在张量流中如何工作？

MatMul 运算在张量流中如何工作？ 的相关文章

随机推荐

热门标签

MatMul 运算在张量流中如何工作？的相关文章