（R 错误）错误：cons 内存耗尽（达到限制？）

2024-05-09

我正在处理大数据，并且有一个 70GB 的 JSON 文件。我正在使用 jsonlite 库将文件加载到内存中。

我尝试过 AWS EC2 x1.16large 机器（976 GB RAM）来执行此负载，但 R 因错误而中断：Error: cons memory exhausted (limit reached?)加载 1,116,500 条记录后。考虑到我没有足够的 RAM，我尝试在具有 1.95TB RAM 的更大 EC2 机器上加载相同的 JSON。

加载 1,116,500 条记录后，该过程仍然中断。我正在使用 R 版本 3.1.1 并且我正在使用--vanilla选项。所有其他设置均为默认设置。

这是代码：

library(jsonlite)
data <- jsonlite::stream_in(file('one.json'))

有任何想法吗？

有一个handler论证stream_in可以处理大数据。因此，您可以将解析后的数据写入文件或过滤掉不需要的数据。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

Bigdata

（R 错误）错误：cons 内存耗尽（达到限制？）的相关文章

R：使用管道将单个参数传递到函数中的多个位置

我试图专门使用管道来重写以下代码使用babynames包中的babynames数据 library babynames library dplyr myDF lt babynames gt group by year gt summari
带有嵌套分组变量的多行轴标签，用于 - R 中的堆积条形图

我想使用 ggplot 制作一个包含多个类别的堆叠条形图并带有嵌套的标记 X 轴类似于我使用 Excel 制作的条形图如此处所示我尝试使用给出的例子here https stackoverflow com questions 181
R 中带有边缘箱线图的直方图

如何使直方图中的 X 轴与边缘箱线图匹配 data lt rnorm 1000 nf lt layout mat matrix c 1 2 2 1 byrow TRUE height c 1 3 layout show nf par mar
分割单个 SpatialPolygons 对象的多边形部分

在 R 中我有一个SpatialPolygons包含数百个多边形的对象即多个多边形我想分割这个SpatialPolygons对象放入列表中Polygons 即孔应保持连接到父多边形知道如何做到这一点吗 EDITED 使用以下提供的示
如何使用r中的dplyr在特定位置插入空白行

我想在数据框中的特定位置插入空白行我的数据框是这样的 dat lt data frame group c rep A 1 rep B 4 rep C 2 rep D 2 group 1 A 2 B 3 B 4 B 5 B 6 C 7 C
for 循环与 cor.test 在许多类别上

我正在尝试在 R 中编写一个循环它将循环遍历 3 个不同的物种以计算两个连续变量 Redness 和 VarNormAbund 之间的相关性我的循环正在运行但 3 个物种中每一个的输出都是相同的这让我认为循环卡在第一个物种上 co
通过 RCpp 返回 NA

新手 RCpp 问题在这里 How can I make a NumericVector returnNA到R 例如假设我有一个 RCpp 代码它分配NA到向量的第一个元素 RCpp export NumericVector myFun
求解非线性方程组

我正在尝试求解以下四个方程组我尝试过使用 rootSolve 包但似乎我无法通过这种方式找到解决方案我正在使用的代码如下 model lt function x F1 lt sqrt x 1 2 x 3 2 1 F2 lt sqrt
如何处理包内部的 R 数据？

我正在开发的 R 包需要多个 R 数据对象例如预先计算的模型和参数目前我将包的数据目录中的每个对象放在单独的 RData 文件中使用该包时用户可以使用数据功能将这些对象附加到他们的环境中我想要的行为是在加载包时数据对
DT数据表中的列对齐

In my shiny我正在使用的应用程序datatable函数来自DT库构建一个表格并希望将列居中对齐我可以用formatStyle column textAlign center 但它只影响列体而不影响标题我们必须设置columnD
单击 R Shiny 中的按钮后将输入字段重置为 null

我正在构建一个应用程序用户可以在其中按列输入表的数据值单击添加按钮后输入的值将按列附加到现有值例如如果输入 col1 2 3 并单击 ADD 我们将在显示屏中看到 col1 2 3 如果输入 col2 4 7 并单击 ADD
为什么“str_extract”只捕获其中一些值？

我有一个表其中有一个会员类型列其中包括我们多年来使用的无数不同的会员级别 example lt data frame membership c Legacy Payment ID 3564 Payment Record 0 Peri
R 中的线性模型 - 乘法表达式

我有 3 个数值变量A B and C 我正在尝试创建一个能够预测的线性模型A 我使用的表达式是B C为了预测A 然而当查看输出时我无法得到我的方程因为我得到了额外的变量但我不知道它是什么这是我的代码 MyData lt read
如何更新 R 中的包？

我想将一个 R 包升级到已经可用的新版本我试过 update packages c R2jags 但它什么也没做控制台上没有输出没有错误什么也没有我使用了相同的语法install packages但也许我做错了什么我一直在看 u
如何在 R 中为所有plot.default、plot 或lines 调用设置默认颜色

为了简化我的日常 R 交互我想为所有绘图设置默认颜色例如假设我想要用红线绘制所有绘图例如在 gnuplot 中到目前为止这是我的 Rprofile 的片段 setHook packageEvent grDevices onLoa
tidyr：将一列分成可变数量的列

我的数据框中有一个变量其中包含回答问卷中不同问题的长度数据结构如下 data lt data frame variables c q1 2 q2 3 q3 4 q4 10 q5 1 q2 3 q1 2 q3 2 q5 2 q4 9 q1
零膨胀泊松分布：无法估计参数，错误代码为 100

以下是我正在研究的一种数据集 data lt c 0 1 0 11 2 0 3 0 0 2 1 3 1 0 1 0 0 0 2 3 0 0 0 8 1 1 1 0 1 1 2 7 0 0 0 5 2 3 6 1 1 5 2 9 0 0 1
R：中断 for 循环

你能确认下一个break是否取消了内部for循环吗 for out in 1 n old id velho lt old table df id out for in in 1 n id novo lt new table df ID in
R 中的 ddply：对于每个组，查找特定变量的出现百分比

我有一个数据集其中包含两列 user type 和滞后响应时间以天为单位 user type imp date lag Consumer 20130613 1 Consumer 20130612 2 Consumer 20130611
为什么在 data.frame 中预先指定类型会比较慢？

我预先分配了一个大 data frame 以便稍后填写我通常这样做NA是这样的 n lt 1e6 a lt data frame c1 1 n c2 NA c3 NA 我想知道如果我预先指定数据类型是否会让事情变得更快所以我测试了 f1

随机推荐

如何从 SonarQube api 获取超过 500 个问题

我在 java 工具中使用 SonarQube API 来处理问题并向其添加注释更改问题状态例如不会修复 api issues search 功能的页面大小限制为最多 500 个我有超过 500 个问题需要阅读此内容我想过执行多个
双击事件 - 多个范围

我正在寻找为双击事件在多个范围内进行编码的最佳方法 Private Sub Worksheet BeforeDoubleClick ByVal Target As Range Cancel As Boolean If Not Interse
如何为背景图像添加内边距

我有一个LinearLayout其中有一个背景图像一个 9 修补的 png 文件如何向左和右添加填充以使背景图像不占据整个宽度我努力了android paddingLeft and android paddingRight 但这并没
vue：转义并渲染 HTML 字符串？

我正在尝试在模板中渲染一些 HTML 字符串但我希望它们是字符串我不想渲染富文本我开始于
g++ C++0x 枚举类编译器警告

我一直在将可怕的 C 类型安全伪枚举重构为新的 C 0x 类型安全枚举因为它们是way更具可读性不管怎样我在导出的类中使用它们所以我明确地将它们标记为导出 enum class attribute visibility defaul
如何使用 SVN/Tortoise 从 Google Code 下载代码？

我刚刚看到一个非常酷的 WPF Twitter 客户端我认为它是由 Herding Code 播客开发的畜牧法 http www herdingcode com called Witty http code google com p wi
科学规划中的可重复性

除了产生不正确的结果之外科学编程中最令人担忧的事情之一就是无法重现生成的结果哪些最佳实践有助于确保您的分析具有可重复性在线发布原始原始数据并免费提供下载使代码库开源并可在线下载如果在优化中使用随机化则重复优化多次选择结果的最佳
在 React Native 中集成 Stack、Drawer 和 Tab Navigator

我尝试在一个项目中一起实现 Stack Drawer 和 Tab Navigator 但它没有达到我的预期首先创建选项卡导航器一个是主页另一个是职业接下来创建 Stack Navigator 并将抽屉集成到 Navigati
如何在 where 子句中使用别名？ [复制]

这个问题在这里已经有答案了可能的重复在 WHERE 子句中引用列别名 https stackoverflow com questions 8370114 referring to a column alias in a where cl
使用 System.Security.Cryptography 将 Win32 Crypto API 调用转换为 C#

我接到一项任务要删除我们产品的一个 dll 并将其替换为纯 C 的 dll 旧的 DLL 是 NET 2 0 托管 C C CLI 它包装了对 Win32 本机加密 API 的调用新的 DLL 应公开具有相同名称和方法的新对象但应使用
Safari 的 Javascript 与 document.write 的问题

我的问题只发生在 Safari 上 IE FF Chrome 和 Opera 都可以完美运行我正在向 DOM 添加一个对象与 YouTube 的方式完全相同具体取决于 ActiveX 或 NPAPI 因此在确定写入对象类型后我通过以
JavaScript 数组中的负索引是否会影响数组长度？

在javascript中我定义了一个像这样的数组 var arr 1 2 3 我也可以做 arr 1 4 现在如果我这样做 arr undefined 我也失去了对值的引用arr 1 所以对我来说从逻辑上来说 arr 1 也是arr 但是
如何在对话框中配置自定义按钮？

这里我有一个自定义对话框里面有背景 2 ImageButton 问题是当我尝试为该按钮设置 onclick 侦听器时程序将返回 NullPointerException 我不知道为什么会发生这种情况无论如何如何将操作分配给对话框内的
资源注入不适用于 glassfish 4，而查找可以工作

我在应用程序范围托管 bean 中使用 glassfish 4 进行资源注入但 glassfish 无法工作而是使用默认的 derby 数据库这是我的代码 Named value dbManager ApplicationScoped
Docker 构建器构建与 docker 构建

在 Docker 的文档页面上有一个条目码头工人建造者 https docs docker com engine reference commandline builder 这是父命令docker 构建器构建 https docs doc
Redis、会话过期和反向查找

我目前正在构建一个网络应用程序并想使用 Redis 来存储会话登录时会话会使用相应的用户 ID 插入到 Redis 中并且过期时间设置为 15 分钟我现在想实现会话的反向查找获取具有特定用户 ID 的会话这里的问题是由于我无
Emacs-Lisp：如何将emacs-lisp程序打包为PC应用程序？

只是想知道是否可以将 emacs 和 Lisp 程序打包和部署为 PC 应用程序这样一旦下载并运行 setup exe 某种程度用户就可以启动应用程序以使 emacs 运行特定的 Lisp 程序就像应用程序已实现一样通过其他语言和平台
buildnumber-maven-plugin 属性 ${buildNumber} 的可见性

我正在尝试使用buildnumber maven plugin http www mojohaus org buildnumber maven plugin将 SCM 内部版本号附加到 WAR 工件名称然后使用tomcat7 maven
如何逐步绘制矢量路径？（拉斐尔.js）

如何逐步动画化矢量路径就像它被绘制一样换句话说慢慢地逐像素地显示路径我在用着Rapha l js but如果您的答案不是特定于库的例如可能有一些通用的编程模式可以完成此类事情我对矢量动画相当陌生欢迎使用直线路径很容易做到就
（R 错误）错误：cons 内存耗尽（达到限制？）

我正在处理大数据并且有一个 70GB 的 JSON 文件我正在使用 jsonlite 库将文件加载到内存中我尝试过 AWS EC2 x1 16large 机器 976 GB RAM 来执行此负载但 R 因错误而中断 Error co

（R 错误）错误：cons 内存耗尽（达到限制？）

（R 错误）错误：cons 内存耗尽（达到限制？） 的相关文章

随机推荐

热门标签

（R 错误）错误：cons 内存耗尽（达到限制？）的相关文章