pytorch中嵌入的加权求和

2023-12-31

I have a sequence of 12 words which I represent using a 12x256 matrix (using word embeddings). Let us refer to these as $e_1,\dots,e_{12}$ . I wish to take this as input and output a 1x256 vector. However I don't want to use a (12x256) x 256 dense layer. Instead I want to create the output embedding using a weighted summation of the 12 embeddings

其中 wi 是标量（因此存在权重共享）。

如何在 pytorch 中创建可训练的 wi s？我是新手，只熟悉像 nn.Linear 这样的标准模块。

您可以通过 kernel_size = 1 的一维卷积来实现

import torch

batch_size=2

inputs = torch.randn(batch_size, 12, 256)
aggregation_layer = torch.nn.Conv1d(in_channels=12, out_channels=1, kernel_size=1)
weighted_sum = aggregation_layer(inputs)

这样的卷积将有 12 个参数。每个参数将等于您提供的公式中的 e_i。

换句话说，这个卷积将在大小为 256 的维度上运行，并将其与可学习的权重相加。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Pytorch

pytorch中嵌入的加权求和的相关文章

下载变压器模型以供离线使用

我有一个训练有素的 Transformer NER 模型我想在未连接到互联网的机器上使用它加载此类模型时当前会将缓存文件下载到 cache 文件夹要离线加载并运行模型需要将 cache 文件夹中的文件复制到离线机器上然而这些文
Pytorch ValueError：优化器得到一个空参数列表

当尝试创建神经网络并使用 Pytorch 对其进行优化时我得到了 ValueError 优化器得到一个空参数列表这是代码 import torch nn as nn import torch nn functional as F fro
Pytorch Tensor 如何获取元素索引？ [复制]

这个问题在这里已经有答案了我有 2 个名为x and list它们的定义如下 x torch tensor 3 list torch tensor 1 2 3 4 5 现在我想获取元素的索引x from list 预期输出是一个整数 2
Pytorch GPU 使用率低

我正在尝试 pytorch 的例子https pytorch org tutorials beginner blitz cifar10 tutorial html https pytorch org tutorials beginner b
保存具有自定义前向功能的 Bert 模型并将其置于 Huggingface 上

我创建了自己的 BertClassifier 模型从预训练开始然后添加由不同层组成的我自己的分类头微调后我想使用 model save pretrained 保存模型但是当我打印它并从预训练上传时我看不到我的分类器头代码如下
在requirements.txt中包含.whl安装

如何将其包含在requirements txt 文件中对于Linux pip install http download pytorch org whl cu75 torch 0 1 12 post2 cp27 none linux x8
Pytorch .to('cuda') 或 .cuda() 不起作用并且卡住了

我正在尝试做 pytorch 教程当我尝试将他们的设备设置为 cuda 时它不起作用并且我的代码运行被卡住有关具体信息我正在使用 conda 环境蟒蛇3 7 3 火炬1 3 0 cuda 10 2 NVIDIA RTX2080TI
Google Colab 使用 Transformers 和 PyTorch 微调 BERT Base Case 时出现间歇性“RuntimeError: CUDA out of memory”错误

我正在运行以下代码来微调 Google Colab 中的 BERT Base Cased 模型有时代码第一次运行良好没有错误其他时候相同的代码使用相同的数据会导致 CUDA 内存不足错误以前重新启动运行时或退出笔记本返回笔
PyTorch DataLoader 对并行运行的批次使用相同的随机种子

有一个bug https tanelp github io posts a bug that plagues thousands of open source ml projects 在 PyTorch Numpy 中当并行加载批次时Da
如何同时有效地运行多个 Pytorch 进程/模型？ Traceback：分页文件太小，无法完成此操作

背景我有一个非常小的网络我想用不同的随机种子进行测试该网络几乎只使用了我的 GPU 计算能力的 1 因此理论上我可以同时运行 50 个进程来同时尝试许多不同的种子 Problem 不幸的是我什至无法在多个进程中导入 pytorch 当
Huggingface 变形金刚模块未被 anaconda 识别

我正在使用 Anaconda python 3 7 Windows 10 我尝试通过安装变压器https huggingface co transformers https huggingface co transformers 在我的环境
如何以干净高效的方式在 pytorch 中获得小批量？

我试图做一件简单的事情即使用火炬通过随机梯度下降 SGD 训练线性模型 import numpy as np import torch from torch autograd import Variable import pdb def
如何解决错误：PyTorch 中预期输入批量大小与目标批量大小不匹配？

我尝试通过 PyTorch 在 CIFAR10 数据集上创建逻辑模型但是我收到错误 ValueError 预期输入batch size 900 与目标batch size 300 匹配我认为正在发生的事情是 3 100 是 300 所以
将 Pytorch 模型 .pth 转换为 onnx 模型

我有一个预训练的模型其格式为 pth 扩展名我想将其转换为 Tensorflow protobuf 但我没有找到任何方法来做到这一点我见过 onnx 可以将模型从 pytorch 转换为 onnx 然后从 onnx 转换为 Tenso
PyTorch：运行时错误：函数 MulBackward0 在索引 0 处返回无效梯度 - 预期类型 torch.cuda.FloatTensor 但得到 torch.FloatTensor

我不明白这个错误告诉我什么在另一个帖子 https github com NVIDIA flownet2 pytorch issues 139也解决了同样的问题但没有有效的解决方案 Traceback most recent call
带有填充掩码的 TransformerEncoder

我正在尝试使用 src key padding mask 不等于 none 来实现 torch nn TransformerEncoder 想象输入的形状src 20 95 二进制填充掩码的形状为src mask 20 95 填充标记的位置
设置 torch.gather(...) 调用的结果

我有一个形状为 n x m 的 2D pytorch 张量我想使用索引列表来索引第二个维度可以使用 torch gather 完成然后然后还设置新值到索引的结果 Example data torch tensor 0 1 2 3 4
Pytorch LSTM：计算交叉熵损失的目标维度

我一直在尝试在 Pytorch 中使用 LSTM LSTM 后跟自定义模型中的线性层但在计算损失时出现以下错误 Assertion cur target gt 0 cur target lt n classes failed 我用以下函数
RuntimeError: 预期所有张量都在同一设备上，但发现至少有两个设备，cpu 和 cuda:0！使用我的模型进行预测时

我使用变压器训练了一个序列分类模型 BertForSequenceClassification 我收到错误预计所有张量都在同一设备上但发现至少有两个设备 cpu 和 cuda 0 在方法wrapper index select中检查参
PyTorch：加速数据加载

我正在使用 dendnet121 从 Kaggle 数据集进行猫狗检测我启用了cuda 看起来训练速度非常快然而数据加载或者可能是处理似乎非常慢有一些方法可以加快速度吗我尝试玩女巫批量大小但没有提供太多帮助我还将 num

随机推荐

StreamBuilder 抛出脏状态

我正在尝试从互联网获取一些数据将其存储到我的 sqlite 数据库中并使用ListView 当我第一次获取数据时一切正常并且我能够在屏幕上看到数据数据也被插入到 sqlite 数据库中但是当我重新打开应用程序时我收到一条错误消息
尝试在 iOS 中分发 Flutter 应用程序时出现“无效的配置文件签名”错误

我正在尝试将我的构建发送到商店但是当我尝试使用 Xcode 分发应用程序时出现以下错误供应配置文件签名无效捆绑包 com grafenit velyvelo Payload Runner app 中包含的配置文件在获得 Apple
在 Keras 中检查验证结果显示只有 50% 正确。明显随机

我正在努力解决一个看似简单的问题我不知道如何将我的输入图像与我的模型产生的结果概率相匹配我的模型的训练和验证香草VGG16 重新训练 2 个类别狗和猫进展顺利使我的验证准确度接近 97 但是当我运行检查以查看我做对了什么和做错了
OnPageChangeListener 中的滚动方向

是否可以在方法中知道滚动的方向onPageScrolled of the OnPageChangeListener应用于一个ViewPager 我用过这样的东西 mPager setOnPageChangeListener new OnPa
Visual Studio 无法识别已安装 NuGet 包的头文件

我正在尝试通过教程来学习 Halide 我正在 VS 15 中工作并添加了 Halide 的 NuGet 包并将其添加为我的项目的引用如图所示我看过的 NuGet 教程似乎表明一旦我添加引用 VS 应该自动识别项目的头文件但这并
如何以 boost 精神从 C++11 lambda 语义操作构建综合参数？

我正在尝试构建具有 boost 精神的 AST 并且在使用 C 11 lambda 表达式作为语义操作时我一直在努力解决如何构建合成参数的问题假设我有一个规则 qi rule
使用自己的属性推断类型

我试图找出是否有一种方法可以从实现的属性推断接口中的类型简化示例 interface Options type string number demanded boolean interface Command The parameter
NSURLConnection 委托方法不会被调用...无法弄清楚并阅读了很多帖子

我有一堂课叫BackendConnector它使用一个NSURLConnection打电话给SoapWebservice那就是https 我找到了很多帖子并尝试实现有关身份验证的委托方法但它们不会被调用并且在 google 中 6 小
Server.Transfer 导致会话异常

在我的全局中当发生错误时我有以下代码来处理 code goes here Server Transfer Error aspx ErrorID errorId 它曾经是一个Response Redirect除了改变了 url 之外它工作
无法将 ViewBag 数据传递给 AngularJS

我有一个控制器 public ActionResult Edit int id ViewBag IsComplete false return View dbContext Users Where user gt user Id id 以及
React：改变消费者的上下文

以下问题与 React Context 文档中的以下部分相关动态上下文 https reactjs org docs context html dynamic context 从嵌套组件更新上下文 https reactjs org do
如何在 Windows 8 和 10 中枚举已安装的 StoreApps 及其 ID

我想要获取的是所有已安装的 StoreApp 应用程序的 AppUserModelId 以便我可以将其传递给IApplicationActivationManager gt ActivateApplication 在 Windows 8 中
如何让 rspec 不显示数据库查询而只显示rails_12factor 的点？

ruby 2 0 rails 3 2 17 rspec 2 14 8 Database mysql rspec spec用于仅输出点当我推送到 Heroku 并最近添加了rails 12factor宝石来绕过它然而现在当我在本地运行规
Angular5需要功能来检查/取消选中mat-table内的mat-checkbox

我可以让表格中的复选框在选中取消选中时发出更改但在单击地图图钉来切换复选框状态时往复遇到问题我的桌子和地图 https i stack imgur com CBJsu png 这是我的桌子
有关通用 Scala 函数的更多信息

尝试在 Scala 中实现以下 Haskell 函数来自 Learn You a Haskell 以便它可以与 Int Double 等一起使用 doubleUs x y x 2 y 2 请注意这类似于Scala 如何定义通用函数参
OpenCV4 上没有名为 Windows 和 WINDOW_GUI_EXPANDED 的按钮图标

我有同样的问题这个问题 https stackoverflow com q 49634045 4483946 当我在 OpenCV 4 中使用带有 WINDOW GUI EXPANDED 的命名窗口时我得到带有按钮放大缩小等的窗口
永久禁用 Visual Studio 2015 中的 Git 集成

我使用的是 Android studio 在那里我总是使用 Git 但在 Visual studio 2015 中我使用 VFS 问题是 Visual Studio 始终连接到我的 Git 存储库而不是 Team Foundation S
Powershell - 脚本在函数外部工作但不在函数内工作

我正在尝试编写一个简单的函数该函数从指定目录获取文件使用一个条件过滤它们然后将结果放回我想出了如下如果它没有放置在函数中则它可以工作而当放置在函数中时它只运行Get ChildItem我不知道为什么这是我的简单代码 fun
如何设置 docker 注册表作为代理？

我有一台服务器我们将其命名为 A 它可以访问互联网并且我可以从该服务器从官方 docker io 注册表中提取图像我还有其他服务器 B C 出于安全原因它们不能具有相同的访问权限但允许访问 A 我还决定在 A 上安装一个私有注册表
pytorch中嵌入的加权求和

I have a sequence of 12 words which I represent using a 12x256 matrix using word embeddings Let us refer to these as I w

pytorch中嵌入的加权求和

pytorch中嵌入的加权求和 的相关文章

随机推荐

热门标签

pytorch中嵌入的加权求和的相关文章