如何在张量流中使用非常大(>2M)的词嵌入?

2024-03-24

我正在运行一个具有非常大的词嵌入(> 2M 词)的模型。当我使用 tf.embedding_lookup 时,它需要一个很大的矩阵。当我运行时,我随后出现了 GPU 内存错误。如果我减小嵌入的大小,一切都会正常。

有没有办法处理更大的嵌入?


推荐的方法是使用分区器 https://www.tensorflow.org/versions/r0.12/api_docs/python/state_ops/variable_partitioners_for_sharding将这个大张量分成几个部分:

embedding = tf.get_variable("embedding", [1000000000, 20],
                            partitioner=tf.fixed_size_partitioner(3))

这会将张量沿 0 轴分成 3 个分片,但程序的其余部分会将其视为普通张量。最大的好处是使用分区器参数服务器复制, 像这样:

with tf.device(tf.train.replica_device_setter(ps_tasks=3)):
  embedding = tf.get_variable("embedding", [1000000000, 20],
                              partitioner=tf.fixed_size_partitioner(3))

这里的关键函数是tf.train.replica_device_setter https://www.tensorflow.org/api_docs/python/tf/train/replica_device_setter。 它允许您运行 3 个不同的进程,称为参数服务器 https://www.tensorflow.org/deploy/distributed,存储所有模型变量。大的embedding张量将被分割到这些服务器上,如图所示。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何在张量流中使用非常大(>2M)的词嵌入? 的相关文章

随机推荐

  • 小块饼图上的标签(ggplot)

    我想用ggplot制作饼图 My data lab lt c a b c d e f g h percentage lt c 50 20 10 10 2 2 2 2 df prison lt data frame lab percentag
  • 如何设置内联集合?

    例如 DataTable table new DataTable Columns new DataColumnCollection new DataColumn col1 new DataColumn col2 你说的是集合初始化器 htt
  • 完全用汇编语言编写操作系统有什么好处? [关闭]

    Closed 这个问题是基于意见的 help closed questions 目前不接受答案 MenuetOS http en wikipedia org wiki MenuetOS是完全用汇编编写的操作系统的示例 用汇编语言编写它比用
  • 在 Visual Basic 6 中对 Excel 工作表进行编码

    我想将excelsheet1的列A的值获取到Visual Basic的某个变量中 然后在更改该值后发送回下一个sheet2 这是一个完整且有效的项目示例 它将值从 Sheet1 单元格 A1 复制到 Sheet2 单元格 A1 declar
  • C# 中的空可扩展树节点

    我想在 C 中创建一个可扩展的空树节点 即一个空的树节点 旁边有 符号 原因是因为最初它是空的 但是一旦单击一个节点 我想用许多子节点填充它 我面临的唯一问题是空树节点不可扩展 所以我不知道该怎么办 有没有办法解决这个问题 或者有什么解决方
  • AF-XDP:实现共享 Umem 套接字

    我想实现 XDP SHARED UMEM https www kernel org doc html latest networking af xdp html xdp shared umem bind flag https www ker
  • c:out 和使用 $ 打印输出之间的区别

    在 JSTL 中有两种打印输出的方法 h1 h1
  • hh_client 报告包错误

    我正在按照中的说明进行操作入门 https docs hhvm com hack getting started starting a real project在 Hacklang 官方网站上 正如它所说 我运行 touch hhconfi
  • 在包中包含一个“哈希表”

    我正在整理一个我已经工作了近一年的包 我有一个音节查找函数所需的哈希表 哈希表实际上只是一个环境 我想我不是计算机高手 它是一个查找表 您可以在下面看到我创建它的函数 我有一个数据集DICTIONARY 约 20 000 个字 将在加载包时
  • 在JAVA中从字符串(从url类型更改)中删除尾部斜杠

    我想从 Java 中的字符串中删除尾部斜杠 我想检查字符串是否以 url 结尾 如果是 我想删除它 这是我所拥有的 String s http almaden ibm com s s replaceAll 和这个 String s http
  • 使用 jQuery 创建新的 html5 视频对象

    如何使用 jQuery 创建视频元素 并将其属性 例如 control 添加到 true
  • Python 和 MySQL:有 MySQLdb 的替代品吗?

    是否有一个纯粹用 Python 编写的模块允许脚本与 MySQL 数据库通信 我已经尝试过 MySQLdb 但没有成功 它需要太多 GCC zlib 和 openssl 我无法使用这些工具 即使我这样做了 我也不想浪费时间让他们一起工作 我
  • 使用Camel的spring-rabbitmq组件时如何自动声明交换?

    我正在尝试从 Camel 3 x 迁移到 Camel 4 x 版本 因此我需要从rabbitmq替换组件spring rabbitmq With rabbitmq我正在使用的组件declare https camel apache org
  • 如何自动滚动到网格视图的末尾?

    当我将项目添加到网格视图的末尾时 我希望用户看到已添加的内容 这是我的意思的一个例子 用户通过按 图标添加项目 问题是在第 14 项之后没有任何反馈表明已添加任何项目 当最后一项添加到列表中时 如何自动滚动到最后一项 奖励点 当第 n 个项
  • 允许使用 docker-compose 在两个 docker 桥接网络之间进行通信

    我正在使用 docker compose 创建相当复杂的 docker 容器基础设施 这些容器在 4 个不同的网络中运行 类似于我模仿的生产环境 Docker Compose 为我创建了这四个网络 并且一切正常 因为容器不会尝试与不同网络内
  • 数据切换和数据目标在引导程序中不起作用

    我正在使用 bootstrap 开发导航栏 该导航栏上有两个按钮 一个用于登录 另一个用于注册 我希望当用户单击 登录 时 会弹出一个模式弹出窗口 并且当单击 注册 时 用户将被重定向到另一个页面 下面是我的代码 但在我看来它不起作用 我尝
  • 保护 REST API 和 Slim 框架的安全

    我对 REST API 相当陌生 我意识到已经发布了很多问题 然而 仔细阅读这些实际上让我对如何处理这个问题更加困惑 我使用创建了一个 REST API纤薄的框架 http www slimframework com 我只是用它来传输数据
  • Rails 5.x:如何在运行时添加路由而不覆盖原始路由表?

    假设我有一个控制器操作 应该会导致将新路由添加到路由表中 def make route vanity url params vanity url vanity redirect params vanity redirect return r
  • odbc 驱动程序不支持请求的属性

    当我们在最后一行运行程序时 odbc 驱动程序不支持请求的属性 错误出现 任何人都可以给我一个想法 Dim conn As New ADODB Connection Dim rsRec As ADODB Recordset Dim cmd
  • 如何在张量流中使用非常大(>2M)的词嵌入?

    我正在运行一个具有非常大的词嵌入 gt 2M 词 的模型 当我使用 tf embedding lookup 时 它需要一个很大的矩阵 当我运行时 我随后出现了 GPU 内存错误 如果我减小嵌入的大小 一切都会正常 有没有办法处理更大的嵌入