RAY Python 框架内存不足

2024-04-18

我用 ray 创建了一个简单的远程函数，它占用的内存很少。然而，运行一小段时间后，内存稳步增加，并且出现 RayOutOfMemoryError 异常。

下面的代码是这个问题的一个非常简单的例子。 “result_transformed”numpy 数组被发送给工作人员，每个工作人员都可以对此进行处理。我的简化 calc_similarity 函数什么也不做，但它仍然耗尽内存。我在该方法中添加了更长的睡眠时间来模拟做更多的工作，但它最终会耗尽内存。

我正在 8 核 Intel 9900K、32GB RAM 和 Ubuntu 19.10 上运行 Python 是：英特尔 Python 发行版 3.7.4 numpy 是 1.17.4（使用 intel mkl）

import numpy as np
from time import sleep
import ray
import psutil

@ray.remote
def calc_similarity(sims, offset):
    # Fake some work for 100 ms.
    sleep(0.10)
    return True

if __name__ == "__main__":
    # Initialize RAY to use all of the processors.
    num_cpus = psutil.cpu_count(logical=False)
    ray.init(num_cpus=num_cpus)

    num_docs = 1000000
    num_dimensions = 300
    chunk_size = 128
    sim_pct = 0.82

    # Initialize the array
    index = np.random.random((num_docs, num_dimensions)).astype(dtype=np.float32)
    index_array = np.arange(num_docs).reshape(1, num_docs)
    index_array_id = ray.put(index_array)

    calc_results = []

    for count, start_doc_no in enumerate(range(0, num_docs, chunk_size)):
        size = min( chunk_size, num_docs - (start_doc_no) + 1 )
        # Get the query vector out of the index.
        query_vector = index[start_doc_no:start_doc_no+size]
        # Calculate the matrix multiplication.
        result_transformed = np.matmul(index, query_vector.T).T
        # Serialize the result matrix out for each client.
        result_id = ray.put(result_transformed)

        # Simulate multi-threading extracting the results of a cosine similarity calculation
        for offset in range(chunk_size):
            calc_results.append(calc_similarity.remote(sims=result_id, offset=offset ))
            # , index_array=index_array_id))
        res = ray.get(calc_results)
        calc_results.clear()

任何帮助/指导将不胜感激。

谢谢桑的回复。

问题是 gc 没有运行，因为在 32GB 系统上的内存耗尽之前尚未达到默认阈值。

对 ray.put(transformed_result) 的调用可能需要相当大的内存量（在示例中为 128 x 1,000,000），或者使用 float32 时大约需要 0.5 GB 内存。

为了解决这个问题，我创建了一个方法，该方法执行以下操作，我可以传入内存使用百分比阈值并强制调用垃圾收集：

def auto_garbage_collect(pct=80.0):
    if psutil.virtual_memory().percent >= pct:
        gc.collect()

在我的核心处理循环中频繁调用此方法可以解决内存不足的情况。

这种情况也可以通过修改垃圾收集中的阈值设置来解决。

gc.set_threshold()

这非常依赖于任务，并且取决于所使用的数据对象的大小，因此我认为第一种方法是更好的选择。

桑，感谢您的详细回复！这非常有帮助和启发。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

RAY Python 框架内存不足的相关文章

对每个元素使用条件的 Numpy 过滤器

我有一个过滤器表达式如下 feasible agents filter lambda agent agent gt cost task agent agents where agents是一个Python列表现在为了提高速度我尝试使用
C++ 相当于 std::vector 上的 numpy.unique，具有 return_index 和 return_inverse

numpy有一个实施unique返回的算法 the 排序的唯一元素一个 numpy 数组 i e 没有重复项此外 numpy unique https numpy org doc stable reference generated nu
根据随机选择的列生成随机天数

我有一个如下所示的数据框感谢 SO 社区在以下方面提供的帮助 df1 pd DataFrame person id 11 11 12 13 14 date birth 01 01 1961 12 30 1961 05 29 1967 01
多重处理：如何从子进程重定向标准输出？

注意我见过multiprocessing Process 的日志输出 https stackoverflow com questions 1501651 log output of multiprocessing process 不幸的是
Environment.WorkingSet 错误地报告内存使用情况

Environment WorkingSet 错误地报告在 Windows 2003 Server 上运行的网站的内存使用情况操作系统版本 Microsoft Windows NT 5 2 3790 Service Pack 2 NET
将嵌套循环计算转换为 Numpy 以加速

我的Python程序的一部分包含以下代码段其中一个新的网格是根据旧网格中找到的数据计算的网格是二维浮点数列表该代码使用了三个 for 循环 for t in xrange 0 t step for h in xrange 1 hei
有效地写入 pandas 中的多个相邻列

使用 numpy ndarray 可以一次写入多个列而无需先进行复制只要它们相邻如果我想写入数组的前三列我会写 a 0 0 3 1 2 3 this is very fast a is a numpy ndarray 我希望在 pa
Tkinter：通过多处理启动进程会创建不需要的新窗口

我计划围绕数值模拟编写一个小型 GUI 这就是我现在使用 Tkinter 的原因模拟应在单独的进程中从 GUI 启动为了玩一下我定义了一个函数 random process 来生成成对的 randn 数字这应该是一个真正的模拟过程
Python 错误：将 statsmodels 与一行数据一起使用时，对象的 len() 未调整大小

我可以使用 statsmodel 的 WLS 加权最小二乘回归 http statsmodels sourceforge net devel generated statsmodels regression linear model WLS
python：numpy 运行脚本两次

当我将 numpy 导入到 python 脚本中时该脚本会执行两次有人可以告诉我如何阻止这种情况因为我的脚本中的所有内容都需要两倍的时间这是一个例子 usr bin python2 from numpy import print t
统计Sweep算子的Python实现

我正在学习一些用书中缺失的数据进行统计的技术缺失数据的统计分析作者利特尔和鲁宾对于处理单调无响应数据来说一个特别有用的函数是扫频操作员详情见第 148 151 页我知道 R 模块gmm有swp函数可以做到这一点但我想知道是否有
查找矩阵内的匹配子矩阵

我有一个 100x200 2D 数组表示为由黑色 0 和白色 255 单元组成的 numpy 数组它是一个位图文件然后我有 2D 形状最容易将它们视为字母它们也是 2D 黑白单元格我知道我可以天真地迭代矩阵但这将是我的代码的
由于“环境错误：[错误 13]：权限被拒绝：'usr/local/bin/f2py'”而无法安装软件包

我正在尝试在 macOS X 上安装 numpy 但执行命令后pip install numpy我收到错误环境错误错误13 权限被拒绝 usr local bin f2py 我如何解决它这对我有用 pip3 install user
如何计算总和的平方和？

我有一笔款项需要加快处理速度在一种情况下是 S x y k l Fu ku Fv lv Fx kx Fy ly 另一种情况是 S x y S k l Fu ku Fv lv Fx kx Fy ly 2 注意 S indices 是这些索引
Java：为什么它使用固定数量的内存？或者它如何管理内存？

JVM 似乎使用了一些固定数量的内存至少我经常看到参数 Xmx 对于最大尺寸和 Xms 对于初始大小这表明我感觉 Java 应用程序不能很好地处理内存我注意到一些事情即使一些非常小的示例演示应用程序也会加载大量内存也许这是因为
多处理时如何获取每个进程ID

我有一些问题因为我是 Python 和 Pyside 的新手我有N个进程同时运行由于这些进程需要一些时间才能完成其工作因此最终用户可能想要取消特定进程因此我需要一种方法来了解进程的 ID 以便将此功能添加到程序中有一个answ
如何调试 numpy 掩码

这个问题与this one https stackoverflow com q 73672739 11004423 我有一个正在尝试矢量化的函数这是原来的函数 def aspect good angle float planet1 goo
为什么大多数平台上没有“aligned_realloc”？

MSVC有自己的非标准函数 aligned malloc aligned realloc and aligned free C 17和C11引入了 std aligned alloc 其结果可以是de分配有free or realloc B
弱变量中间为零

弱变量什么时候变为零 weak var backgroundNode SKSpriteNode texture SKTexture image initialBackgroundImage backgroundNode position C
在 HDF5 (PyTables) 中存储 numpy 稀疏矩阵

我在使用 PyTables 存储 numpy csr matrix 时遇到问题我收到此错误 TypeError objects of type csr matrix are not supported in this context so

随机推荐

Linq to NHibernate 生成到同一个表的多个联接

当我在 select 和 where 子句中引用同一个表时 linq to Nhibernate 会生成两个连接一个用于 select 一个用于 where IE from child in Session Query
比较 Django 中的日期和日期时间

我有一个带有日期时间字段的模型 class MyModel models Model created models DateTimeField auto now True 我想获取今天创建的所有记录我试过 MyModel objects
window.console 可以被覆盖吗？它是只读的吗？

我用consolejavascript 中的对象用于调试并希望覆盖它以便在移动浏览器中使用此类功能但是我无法理解以下 MDN 文档 Window console 只读属性返回对 Console 对象提供将信息记录到控制台的方法浏览
如何通过 SystemJs 在 Angular2 中使用时刻时区

我正在使用 Angular2 通过Angular2 种子 https github com mgechev angular2 seed 使用 SystemJS 并尝试加载时刻时区 http momentjs com timezone doc
使用片段共享过渡时返回过渡无法正常工作

我有2个碎片ListMovieFragment and DetailMovieFragment 我有一个界面ListMovieFragment是在MainActivity 我正在使用共享元素转换当我单击图像视图时ListMovieFrag
有效地构建具有给定汉明距离的单词图

我想从单词列表中构建一个图表汉明距离 https en wikipedia org wiki Hamming distance 比如说 1 或者换句话说如果两个单词仅与一个字母不同 lol 假设您将字典存储在set 以便查找是O 1 平均
在 Delphi 2009 中挂钩堆栈跟踪

Delphi 2009 中的 Exception 类获得了许多新功能其中许多与获取堆栈跟踪有关 property堆栈跟踪 string read获取堆栈跟踪 property堆栈信息指针readFStackInfo 类变量获取异常堆栈信
Windows 上的 unbuffer 程序相当于什么？

你好根据这个帖子 https unix stackexchange com a 25375 unbuffer通过伪终端 pty 连接到命令这使得系统将其视为交互式进程因此不使用任何 stdout 缓冲我想在 Windows 上使用这个
寻找 Maven 工件：Spring + Hibernate + JPA

我是 Maven 新手有以下 2 个关于 Maven 的问题我正在寻找一个包含 Spring Hibernate JPA 的 Maven 工件我发现的唯一一种是与 Flex 混合的现在我想保持简单并且不想处理 Flex 增加的复
范围过滤器不适用于“gt”运算符，但适用于“lt”

我正在使用弹性搜索来索引我的文档并希望根据特定属性过滤文档这是我的代码 filter push range audience ethnicity asian gt 50 它不适用于 gt 运算符发回不一致的结果但适用于 lt 运算符
ChromeDriver 的默认位置以及在 Windows 上安装 Chrome 的默认位置是什么

我需要安装chromedriver在 Windows 操作系统上他们在下面的文章中指定 https sites google com a chromium org chromedriver getting started https si
Xcode 8 控制台垃圾？ [复制]

这个问题在这里已经有答案了还有其他人遇到过 Xcode 8 控制台显示一堆随机内容的问题吗我不想让所有这些弄乱我的调试消息和日志有人知道如何关闭此功能吗编辑发行说明指定控制台可能会转储对 watchOS 无用的内容但不适用于 i
MySQL - 如何诊断警告“中止连接 - （读取通信数据包超时）”的原因

我在运行 MySQL 的相当繁忙的 Windows 2008 R2 Web 服务器上遇到了一些问题应用程序间歇性崩溃日志通常指向 MySQL 作为路由原因因为应用程序无法连接到 MySQL 这并不会影响所有用户只会影响一些不幸的用户
Oracle - 如何使用快速刷新和联接创建物化视图

所以我很确定 Oracle 支持这一点所以我不知道我做错了什么这段代码的工作原理 CREATE MATERIALIZED VIEW MV Test NOLOGGING CACHE BUILD IMMEDIATE REFRESH FAST
将svn迁移到git的子目录

我想用 git 替换我的 svn 存储库不幸的是我无法一次性完成此操作长话短说我需要将带有历史记录的 svn 存储库移动到预先存在的 git 存储库的子目录中所以我目前有 svn svn1 svn2 git git1 git gi
vscode jest 扩展无法正常工作

我正在与VSCode并安装了扩大 Jest 为了更好的笑话测试环境在扩展的指令中我看到我们得到了很好的智能感知支持对于杰斯特的命令问题我在底部栏上没有看到 Jest 图标这意味着文本无法正常工作我仍然没有得到对 jest 命令的智
为什么绑定参数不指向实际的函数参数

为什么 limit 是 20 而不是 el 20 因为在 isFullAge bind this 20 中 20 是最后一个参数所以它必须传递给 el 参数但为什么它被设置为 limit 参数 var years 1990 1965 1
如何在 iPhone 中不使用 NSDictionary/NSMutableDictionary 中的 Key 来获取值？

我有一个 Json 键和值方法格式的 Web 服务响应我解析并获取了最多的 Web 服务方法但是在一种网络服务方法中我无法从键中获取值我在这里附上示例响应 lessons ObjectiveC Book brief desc O
asp.net core 5.0 RequestSizeLimit 不起作用

我正在使用 ASP net core 5 0 看起来RequestSizeLimit不管用我有以下控制器 HttpPost addfile RequestSizeLimit 5 242 880 5MB public IActionResu
RAY Python 框架内存不足

我用 ray 创建了一个简单的远程函数它占用的内存很少然而运行一小段时间后内存稳步增加并且出现 RayOutOfMemoryError 异常下面的代码是这个问题的一个非常简单的例子 result transformed nump

RAY Python 框架内存不足

RAY Python 框架内存不足 的相关文章

随机推荐

热门标签

RAY Python 框架内存不足的相关文章