使用rest-client 将文件下载到磁盘，而不先将其全部加载到内存中

2024-04-09

我正在使用 Rest-client 下载大页面（大小约为 1.5 GB）。检索到的值存储在内存中，而不是保存到文件中。结果我的程序崩溃了failed to allocate memory (NoMemoryError).

但没有必要将这些数据保存在内存中，甚至可以直接保存到磁盘中。

我发现“您可以：（...）手动处理响应（例如，将其作为流进行操作，而不是将其全部读入内存）有关更多信息，请参阅 RestClient::Request 的文档。”在https://github.com/rest-client/rest-client https://github.com/rest-client/rest-client遗憾的是读完之后http://www.rubydoc.info/gems/rest-client/1.7.3/RestClient/Request http://www.rubydoc.info/gems/rest-client/1.7.3/RestClient/Request我不知道如何实现它。

我也知道我可能会使用其他库（使用 WWW:Mechanize 将文件下载到磁盘，而不先将其全部加载到内存中 https://stackoverflow.com/questions/4360043/using-wwwmechanize-to-download-a-file-to-disk-without-loading-it-all-in-memory）但我的程序已经在使用rest-client。

简化代码：

data = RestClient::Request.execute(:method => :get, :url => url, :timeout => 3600)
file = File.new(filename, 'w')
file.write data
file.close

Code - https://github.com/mkoniecz/CartoCSSHelper/blob/395deab626209bcdafd675c2d8e08d0e3dd0c7f9/downloader.rb#L126 https://github.com/mkoniecz/CartoCSSHelper/blob/395deab626209bcdafd675c2d8e08d0e3dd0c7f9/downloader.rb#L126

另一种方法是使用raw_response。这会直接保存到文件中，通常在/tmp并毫无问题地处理重定向。看流式响应 https://github.com/rest-client/rest-client#streaming-responses。这是他们的例子：

>> raw = RestClient::Request.execute(
           method: :get,
           url: 'http://releases.ubuntu.com/16.04.2/ubuntu-16.04.2-desktop-amd64.iso',
           raw_response: true)
=> <RestClient::RawResponse @code=200, @file=#<Tempfile:/tmp/rest-client.20170522-5346-1pptjm1>, @request=<RestClient::Request @method="get", @url="http://releases.ubuntu.com/16.04.2/ubuntu-16.04.2-desktop-amd64.iso">>
>> raw.file.size
=> 1554186240
>> raw.file.path
=> "/tmp/rest-client.20170522-5346-1pptjm1"

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用rest-client 将文件下载到磁盘，而不先将其全部加载到内存中的相关文章

有关 Linux 内存类型的问题

关于Linux内存我有以下问题我知道活动内存是最常访问的内存部分但是有人可以解释一下 linux 如何考虑将内存位置用于活动内存或非活动内存主动存储器由哪些部分组成磁盘文件缓存是否被视为活动内存的一部分有什么区别Buffers
Rails 和 Mysql 的毫秒数

使用 Rails Mysql 时存储时间以毫秒为单位的最佳方式是什么我将使用小数和composed of 以便能够将该值作为Ruby 时间进行操作有人有更好的主意吗自从提出这个问题以来已经过去了好几年了这是更新的解决方案 ht
如何在 Ruby 中将一个数组添加到另一个数组而不最终得到多维结果？

I tried somearray some thing anotherarray another thing somearray push anotherarray flatten 我期望 some thing another thing
安装 Sass 时出错（Ruby 2.5.0.1、MSYS2 20161025.0.0）

我尝试安装 Sass 我安装了Ruby and MSYS2在此之前来自所有人的最新消息巧克力味 https chocolatey org choco install ruby choco install msys2 看来它们已正确安装 r
FieldPath 字段名称不能包含“.”当尝试使用 AGGREGATE 时

我的查询有什么问题吗 db table aggregate match gt expr gt and gt eq gt size gt events 4 events 0 updated gt lt gt 2019 05 05 我越来越 M
Rails 应用程序中的持久 TCP 连接

我有一个在服务器上运行的第三方应用程序它对客户端进行身份验证并返回响应我的问题是对于我收到 Rails 应用程序的每个请求我都需要建立 TCP 连接并获取数据是否可以有一个持久连接以便我可以减少建立连接的开销我希望你使用的是
c++ 12位变量，我该怎么做？

我正在构建一个体素引擎所以我担心内存使用情况使用 12 位而不是 16 位块 ID 可以节省大量内存我有一个 3D 块 id 数组每个 id 都有一个静态配置我不确定实现这一目标的好方法是什么有没有一种方法可以获取一块原始内存并
在轮询器内异步运行代码

在我的 ruby 脚本中我使用 celluloid zmq gem 我尝试在轮询器内异步运行评估响应使用 async evaluate response socket read multipart 但是如果我从循环中删除睡眠不知何故
如何将命令行参数传递给 rake 任务

我有一个 rake 任务需要将一个值插入到多个数据库中我想从命令行或从another耙任务我怎样才能做到这一点您可以通过向任务调用添加符号参数来指定 rake 中的形式参数例如 require rake task my task a
如何在 Ruby 中使用循环输出所有可能的组合？

我刚刚开始学习编程并试图编写一个输出所有可能组合的函数到目前为止我已经能够找到尺寸 2 的所有可能组合但我不确定如何使代码保持开放式以处理更大尺寸的组合某种递归会有用吗我知道我可以使用内置的组合方法但我只是想弄清楚如何从头开始
按顺序重载每个方法

我有一个 erb 模板它为 httpd conf 生成配置文件重要的是最后写入特定位置它是包罗万象的目前代码看起来像 cluster apps each do app Render config end 我想重载应用程序对象上的每
Ruby 守护进程，用于使临时 Ruby 实例的对象保持活动状态

Ruby 是否提供了一种在不同运行的 Ruby 进程之间共享变量更重要的是类对象和我认为对此有用的任何其他数据抽象的机制例如如果我有一个类被实例化初始化并仔细调整到某种状态我希望该状态对我全天所有其他独立的 Ruby 和 Ir
Environment.WorkingSet 错误地报告内存使用情况

Environment WorkingSet 错误地报告在 Windows 2003 Server 上运行的网站的内存使用情况操作系统版本 Microsoft Windows NT 5 2 3790 Service Pack 2 NET
如何在 Rails 中制作动态下拉菜单？

我正在开发一个电子商务项目其中将有用于选择尺寸的单选按钮我有一个数量下拉菜单我想根据用户所选尺寸的可用库存使此下拉列表动态化谁能告诉我如何在 Rails 上做到这一点不会用大量的 javascript 扰乱我的视图文件如果您使用
Windows 中内存分配的限制+我计算得是否正确？

我正在编写一个需要大量内存的程序大型图形分析目前我的程序中有两个主要的数据结构占用了大部分内存这些都是 n n 类型的矩阵int 和长度为 n 的数组类型Node 在本例中节点是一个包含两个 int 的结构体 sizeof No
序列化对于对象大小估计可靠吗？

我使用序列化来估计对象使用的内存量我已经读过this https stackoverflow com questions 426396 how much memory does a c net object use and this ht
如何从 Ruby 2.0 中的字符串数组获取值

我有这个字符串数组 array nike air nike steam nike softy nike strength smooth sleeper adidas air addidas jogar adidas softy adidas
设置 MetaspaceSize 的指南 - java 8

64 位服务器的 MetaspaceSize 默认值是多少我在官方文档中没有找到它我观察到在服务器 JVM 进程中 GC 频率有时会变高并持续增长如果我重新启动服务几次它就会恢复稳定我认为这是由于 JRE 升级造成的 JVM 堆
“array.map”是否保留原始顺序？

我有一个User类has many Jobs 我使用以下代码映射作业 def ranges user jobs map u u start at u end at end 我有一个比较两个数组的规范 my array start1 end1
JVM内存段分配

好吧我有一个关于 JVM 内存段的问题我知道每个 JVM 都会选择稍微不同地实现这一点但这是一个总体概念在所有 JVM 中应该保持相同一个在运行时不使用虚拟机执行的标准C C 程序在运行时有四个内存段代码堆栈堆数据所有这

随机推荐

`std::sin` 最后一点是错误的

为了提高效率我正在将一些程序从 Matlab 移植到 C 两个程序的输出完全相同非常重要我面临着此操作的不同结果 std sin 0 497418836818383950 0 477158760259608410 C sin 0 497
Spring aop拦截来自同一服务类的调用

我有一个与中提到的相同的场景 Spring Transaction方法通过同一个类内的方法调用不起作用 https stackoverflow com questions 3423972 spring transaction method
Turbolinks 加载事件在页面加载时不起作用

我对当前默认 Turbolinks 推荐的加载事件有疑问 document addEventListener turbolinks load function 发生的情况是当页面加载时这不会在 Safari 上触发因此我附加了Turb
I18nManager.forceRTL 不会在首次应用程序加载中应用更改

我有一个由 Awesome 创建的应用程序React native我的布局设计为 RTL 模式我已经设置了一个强制布局为 RTL 的选项但我的选项在安装后的第一次应用程序加载中不起作用此功能适用于第二次运行我在我们的index js
嵌套查询过滤器_Django

我保持简单我有 3 个型号 class C models model some field models BooleanField default False class B models model b models ForeignKe
获取页面矩形区域内的 DOM 元素

给定网页上的两个点和一组 DOM 元素如何找出位于这两个点定义的矩形区域内的 DOM 元素的子集我正在开发一个基于网络的画廊其中每张照片都包含在li标签当用户用鼠标拖出一个矩形区域时所有li矩形内的元素被标记为已选择更喜欢 jQ
IE 9/10/11 声音文件限制

我正在制作一个浏览器游戏该游戏在同一场景中播放大约 60 个不同长度的音频文件因此无法卸载我想知道除了我之外是否有人面临这个问题 IE 对可以通过 HTML5 Audio load 方法加载的声音文件有硬件相关限制就我而言它恰
C++ 11：定期调用 C++ 函数

我已经整理了一个简单的 C 计时器类该类应该从各种示例中定期调用给定的函数如下所示 include
使用 MiniProfiler、EF 5 和 Autofac 分析 DbContext 的正确方法

The MiniProfiler 站点 http miniprofiler com 给出了用于生成实体框架的以下代码ObjectContext public static MyModel Get var conn new StackExch
使用最新的 gcc 生成库并使用较旧的 gcc 来使用它 - 尽管 C++ 版本相同，但为什么还会出现问题？

不要问我为什么要做我正在做的事情那将是一个很长的故事目前这篇文章的目的是学习并理解为什么事情没有按照我预期的方式进行也许我的期望是错误的因此最初我使用最近的编译器从源代码构建了自己的 SystemC 2 3 3 库例如海湾合作
如何将 NSInteger 或 NSString 转换为二进制（字符串）值

有人在 Objective C 中有一些代码可以将 NSInteger 或 NSString 转换为二进制字符串吗 example 56 gt 111000 stackoverflow 中有一些代码尝试执行此操作但不起作用 Thanks
如何选择全帧（未压缩）作为 VideoWriter 的编解码器

我想将设备中的未压缩帧存储为视频但我需要知道如何选择全帧未压缩作为 VideoWriter 在 emgu 中又名 openCV 的编解码器当我像这样传递 1 时我可以从下拉菜单中选择它 VideoWriter myVideoWr
如何在 Jenkins 脚本管道中设置多行参数化 cron 作业？

所以这工作正常 properties https stackoverflow com questions 35370810 how do i use jenkins pipeline properties step parameters n
使用其他 Const Struct 实例初始化 Const Struct

我很好奇为什么以下代码片段无法编译 typedef struct Foo int a int b Foo static const Foo FooZero 0 0 typedef struct Bar Foo foo int c Bar s
SimpleMembership 的 IsUserInRole 错误

我使用此代码在我的 ASP NET MVC 4 Internet 应用程序上进行角色授权 if Roles IsUserInRole RolunAdi a href Test a 它工作正常但有时我会出错它在这张图片上我脑子里有两件事
使用等待时 Monitor.Exit 上的 SynchronizationLockException

我正在创建一段代码从我们拥有的遗留系统中获取网页为了避免过多的查询我对获取到的URL进行了缓存我在用Monitor Enter Monitor Exit并双重检查以避免请求发出两次但在释放锁时Monitor Exit 我收到此异常
通过高延迟网络连接同步许多（小）文件的方法

我们通常使用 Subversion 将软件应用程序部署到客户端客户端上的 svn 更新单向目前我们的一位客户遇到了问题因为延迟很高大文件下载速度很好因为他们位于中国而我们的服务器位于加拿大 Subversion 在很长一段时
Thread.Sleep(300) 无法正常工作

我希望它执行代码的第一部分然后使图片框可见暂停 3 秒隐藏图片框并执行其余代码 first part of the code here pb elvisSherlock Visible true Thread Sleep 300 pb
用于解析包含逗号分隔值的命令行输入的批处理文件

我正在开发一个命令行实用程序它将一组输入参数作为命令然后根据预定义名称验证这些输入参数该实用程序以这种方式调用运行实用程序 cmd A B x y z C w 这里的参数是 A B 和 C 以开头的参数现在验证规则如下参数的名
使用rest-client 将文件下载到磁盘，而不先将其全部加载到内存中

我正在使用 Rest client 下载大页面大小约为 1 5 GB 检索到的值存储在内存中而不是保存到文件中结果我的程序崩溃了failed to allocate memory NoMemoryError 但没有必要将这些数据保存在

使用rest-client 将文件下载到磁盘，而不先将其全部加载到内存中

使用rest-client 将文件下载到磁盘，而不先将其全部加载到内存中 的相关文章

随机推荐

热门标签

使用rest-client 将文件下载到磁盘，而不先将其全部加载到内存中的相关文章