如何在张量流中使用非常大（>2M）的词嵌入？

2024-03-24

我正在运行一个具有非常大的词嵌入（> 2M 词）的模型。当我使用 tf.embedding_lookup 时，它需要一个很大的矩阵。当我运行时，我随后出现了 GPU 内存错误。如果我减小嵌入的大小，一切都会正常。

有没有办法处理更大的嵌入？

推荐的方法是使用分区器 https://www.tensorflow.org/versions/r0.12/api_docs/python/state_ops/variable_partitioners_for_sharding将这个大张量分成几个部分：

embedding = tf.get_variable("embedding", [1000000000, 20],
                            partitioner=tf.fixed_size_partitioner(3))

这会将张量沿 0 轴分成 3 个分片，但程序的其余部分会将其视为普通张量。最大的好处是使用分区器参数服务器复制，像这样：

with tf.device(tf.train.replica_device_setter(ps_tasks=3)):
  embedding = tf.get_variable("embedding", [1000000000, 20],
                              partitioner=tf.fixed_size_partitioner(3))

这里的关键函数是tf.train.replica_device_setter https://www.tensorflow.org/api_docs/python/tf/train/replica_device_setter。它允许您运行 3 个不同的进程，称为参数服务器 https://www.tensorflow.org/deploy/distributed，存储所有模型变量。大的embedding张量将被分割到这些服务器上，如图所示。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何在张量流中使用非常大（>2M）的词嵌入？的相关文章

给定文档，选择相关片段

当我在这里提出问题时自动搜索返回的问题的工具提示给出了问题的前一点但其中相当一部分没有给出任何比理解问题更有用的文本标题有谁知道如何制作一个过滤器来删除问题中无用的部分我的第一个想法是修剪仅包含某个列表中的单词的任何前导句子例如
如何使用动词时态/语气制作稀疏匹配器模式？

我一直在尝试使用动词时态和情绪为 spacy 匹配器创建一个特定的模式我发现了如何使用 model vocab morphology tag map token tag 访问使用 spacy 解析的单词的形态特征当动词处于虚拟语气模式
在 Tensorflow 中使用 tf.while_loop 更新变量

我想更新 Tensorflow 中的变量因此我使用 tf while loop 例如 a tf Variable 0 0 0 0 0 0 dtype np int16 i tf constant 0 size tf size a def
精度类型

使用 keras 库获得的精度如下 model compile optimizer sgd loss mse metrics tf keras metrics Precision sklearn 计算出的哪种精度与 keras 计算出的精度
LSTM - 一段时间后预测相同的常数值

我有一个变量我想预测未来 30 年的情况不幸的是我没有很多样品 df pd DataFrame FISCAL YEAR 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 199
在 Tensorflow 中每行选择一个元素的优雅方法

Given 一个矩阵A形状的 m n 张量I形状的 m 我想要一份清单J的元素来自A where J i A i I i 那是 I保存要从每行中选择的元素的索引A 背景我已经有了argmax A 1 现在我也想要max 我知道我可以使用r
将 tf.contrib.layers.xavier_initializer() 更改为 2.0.0

我该如何改变 tf contrib layers xavier initializer tf 版本 gt 2 0 0 所有代码 W1 tf get variable W1 shape self input size h size initi
如何从 Pandas DataFrame 转换为 Tensorflow BatchDataset 以进行 NLP？

老实说我想弄清楚如何转换数据集格式 pandasDataFrame或 numpy 数组转换为简单文本分类张量流模型可以训练用于情感分析的形式我使用的数据集类似于 IMDB 包含文本和标签正面或负面我看过的每个教程要么以不同的方式
tensorflow：检查标量布尔张量是否为 True

我想使用占位符控制函数的执行但不断收到错误不允许使用 tf Tensor 作为 Python bool 这是产生此错误的代码 import tensorflow as tf def foo c if c print This is tr
TensorFlow 2.0：在自定义训练循环中显示进度条

我正在为音频分类任务训练 CNN 并且使用带有自定义训练循环的 TensorFlow 2 0 RC 如中所述本指南 https www tensorflow org beta guide keras training and evaluat
在按顺序读取的多个特征文件上训练 Keras 模型以节省内存

当我尝试读取大量功能文件时我遇到了内存问题见下文我想我应该分割训练文件并按顺序读取它们做到这一点的最佳方法是什么 x train np load path features x train npy y train np load p
具有不同尺寸图像的 Tensorflow 输入数据集

我正在尝试使用不同大小的输入图像来训练完全卷积神经网络我可以通过循环训练图像并在每次迭代时创建单个 numpy 输入来做到这一点即 for image input label in zip image data labels train
为什么分割任务使用 Dice Coefficient 而不是 IOU？

我见过人们使用IOU作为衡量标准detection任务和Dice Coeff for segmentation任务这两个指标在方程方面看起来非常相似只是骰子给予相交部分的权重是两倍如果我是对的那么 Dice 2 x A B A B
Java文本输出中的UTF-8编码问题

我一直致力于测试高棉语 Unicode Wordbreaker 的各种解决方案高棉语单词之间没有空格这使得拼写检查和语法检查变得困难以及从旧高棉语转换为高棉语 Unicode 我得到了一些源代码现在在线 http www white
如何修复 Tensorflow 中的“ValueError：操作数无法与形状 (2592,) (4,) 一起广播”？

我目前正在设计一个 NoisyNet 层如下所示探索嘈杂的网络 https arxiv org abs 1706 10295 在 Tensorflow 中并得到如标题所示的维度误差而两个张量的维度将在行中按元素相乘filtered o
Tensorflow 中使用 Adam Optimizer 时损失突然增加

I am using a CNN for a regression task I use Tensorflow and the optimizer is Adam The network seems to converge perfectl
窗口多维 Tensorflow 数据集

我有形状的二维数据m by n我想要的窗口大小w沿着第一个轴进入数据集m w许多二维数组每个数组的大小w by n 例如如果数据是 0 1 2 3 4 5 6 7 8 9 10 11 然后我想将其窗口化 0 1 2 3 4 5 6 7 8
Keras 中批量大小可变的batch_dot

我正在尝试编写一个层来合并 2 个张量formula https i stack imgur com I49aj png x 0 和x 1 的形状都是 1 500 M是500 500的矩阵我希望输出为 500 500 我认为这在理论上是可
Keras如何在Relu激活函数中使用max_value

keras activation py 中定义的 Relu 函数为 def relu x alpha 0 max value None return K relu x alpha alpha max value max value 它有一个
model.fit 在 Keras 中如何工作？

我之前的帖子或错误是这样的one https stackoverflow com questions 52261090 do the operations defined in array ops in tensorflow have gr

随机推荐

小块饼图上的标签（ggplot）

我想用ggplot制作饼图 My data lab lt c a b c d e f g h percentage lt c 50 20 10 10 2 2 2 2 df prison lt data frame lab percentag
如何设置内联集合？

例如 DataTable table new DataTable Columns new DataColumnCollection new DataColumn col1 new DataColumn col2 你说的是集合初始化器 htt
完全用汇编语言编写操作系统有什么好处？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案 MenuetOS http en wikipedia org wiki MenuetOS是完全用汇编编写的操作系统的示例用汇编语言编写它比用
在 Visual Basic 6 中对 Excel 工作表进行编码

我想将excelsheet1的列A的值获取到Visual Basic的某个变量中然后在更改该值后发送回下一个sheet2 这是一个完整且有效的项目示例它将值从 Sheet1 单元格 A1 复制到 Sheet2 单元格 A1 declar
C# 中的空可扩展树节点

我想在 C 中创建一个可扩展的空树节点即一个空的树节点旁边有符号原因是因为最初它是空的但是一旦单击一个节点我想用许多子节点填充它我面临的唯一问题是空树节点不可扩展所以我不知道该怎么办有没有办法解决这个问题或者有什么解决方
AF-XDP：实现共享 Umem 套接字

我想实现 XDP SHARED UMEM https www kernel org doc html latest networking af xdp html xdp shared umem bind flag https www ker
c:out 和使用 $ 打印输出之间的区别

在 JSTL 中有两种打印输出的方法 h1 h1
hh_client 报告包错误

我正在按照中的说明进行操作入门 https docs hhvm com hack getting started starting a real project在 Hacklang 官方网站上正如它所说我运行 touch hhconfi
在包中包含一个“哈希表”

我正在整理一个我已经工作了近一年的包我有一个音节查找函数所需的哈希表哈希表实际上只是一个环境我想我不是计算机高手它是一个查找表您可以在下面看到我创建它的函数我有一个数据集DICTIONARY 约 20 000 个字将在加载包时
在JAVA中从字符串（从url类型更改）中删除尾部斜杠

我想从 Java 中的字符串中删除尾部斜杠我想检查字符串是否以 url 结尾如果是我想删除它这是我所拥有的 String s http almaden ibm com s s replaceAll 和这个 String s http
使用 jQuery 创建新的 html5 视频对象

如何使用 jQuery 创建视频元素并将其属性例如 control 添加到 true
Python 和 MySQL：有 MySQLdb 的替代品吗？

是否有一个纯粹用 Python 编写的模块允许脚本与 MySQL 数据库通信我已经尝试过 MySQLdb 但没有成功它需要太多 GCC zlib 和 openssl 我无法使用这些工具即使我这样做了我也不想浪费时间让他们一起工作我
使用Camel的spring-rabbitmq组件时如何自动声明交换？

我正在尝试从 Camel 3 x 迁移到 Camel 4 x 版本因此我需要从rabbitmq替换组件spring rabbitmq With rabbitmq我正在使用的组件declare https camel apache org
如何自动滚动到网格视图的末尾？

当我将项目添加到网格视图的末尾时我希望用户看到已添加的内容这是我的意思的一个例子用户通过按图标添加项目问题是在第 14 项之后没有任何反馈表明已添加任何项目当最后一项添加到列表中时如何自动滚动到最后一项奖励点当第 n 个项
允许使用 docker-compose 在两个 docker 桥接网络之间进行通信

我正在使用 docker compose 创建相当复杂的 docker 容器基础设施这些容器在 4 个不同的网络中运行类似于我模仿的生产环境 Docker Compose 为我创建了这四个网络并且一切正常因为容器不会尝试与不同网络内
数据切换和数据目标在引导程序中不起作用

我正在使用 bootstrap 开发导航栏该导航栏上有两个按钮一个用于登录另一个用于注册我希望当用户单击登录时会弹出一个模式弹出窗口并且当单击注册时用户将被重定向到另一个页面下面是我的代码但在我看来它不起作用我尝
保护 REST API 和 Slim 框架的安全

我对 REST API 相当陌生我意识到已经发布了很多问题然而仔细阅读这些实际上让我对如何处理这个问题更加困惑我使用创建了一个 REST API纤薄的框架 http www slimframework com 我只是用它来传输数据
Rails 5.x：如何在运行时添加路由而不覆盖原始路由表？

假设我有一个控制器操作应该会导致将新路由添加到路由表中 def make route vanity url params vanity url vanity redirect params vanity redirect return r
odbc 驱动程序不支持请求的属性

当我们在最后一行运行程序时 odbc 驱动程序不支持请求的属性错误出现任何人都可以给我一个想法 Dim conn As New ADODB Connection Dim rsRec As ADODB Recordset Dim cmd
如何在张量流中使用非常大（>2M）的词嵌入？

我正在运行一个具有非常大的词嵌入 gt 2M 词的模型当我使用 tf embedding lookup 时它需要一个很大的矩阵当我运行时我随后出现了 GPU 内存错误如果我减小嵌入的大小一切都会正常有没有办法处理更大的嵌入

如何在张量流中使用非常大（>2M）的词嵌入？

如何在张量流中使用非常大（>2M）的词嵌入？ 的相关文章

随机推荐

热门标签

如何在张量流中使用非常大（>2M）的词嵌入？的相关文章