plyr

download.file 中的错误：不支持方案

我需要从下载一些 csv 文件http www elections state md us http www elections state md us 这是我的代码 url lt http www elections state md

r URL plyr

R plyr，data.table，应用data.frame的某些列

我正在寻找加速我的代码的方法我正在调查apply ply方法以及data table 不幸的是我遇到了问题这里有一个small样本数据 ids1 lt c 1 1 1 1 2 2 2 2 ids2 lt c 1 2 3 4 1 2 3

r dataTable plyr apply

错误：仅在包含所有数值变量的数据框上定义，并在大型数据集上使用 ddply

我正在尝试按月年调查 ID 和网格 ID 在一个非常大的数据集 22000 条记录上计算多个参数例如 Er Count Mn Count 的总和和平均值我最初尝试使用此代码来获取总和 dlply Effort All c Er C

r plyr

R：加速“group by”操作

我有一个模拟中间有一个巨大的聚合和组合步骤我使用 plyr 的 ddply 函数对这个过程进行了原型设计它可以很好地满足我的大部分需求但我需要更快的聚合步骤因为我必须运行 10K 次模拟我已经在并行扩展模拟但如果这一步骤更快

performance r plyr

在 Sparklyr 中创建虚拟变量？

我正在尝试扩展我的一些 ML 管道我喜欢 Sparklyr 打开的 rstudio spark 和 h2o 的组合 http spark rstudio com http spark rstudio com 我试图弄清楚的一件事是如何使用

r apachespark dplyr plyr sparklyr

Demean R 数据框

我想贬低 R 中的多列data frame 使用来自的示例这个问题 https stats stackexchange com questions 46978 fixed effects using demeaned data why di

r plyr

需要更快的滚动应用函数以及开始停止索引

下面是一段代码它给出滚动 15 分钟历史窗口的交易价格水平的百分位如果长度为 500 或 1000 它运行得很快但正如您所看到的有 45K 个观测值对于整个数据来说它的运行速度非常慢我可以应用任何 plyr 功能吗欢迎任

r performance plyr

R 中的条件交叉表

寻找使用 expss 包实现以下任务的最快方法有了一个很棒的 expss 包我们可以轻松地进行交叉表它具有其他优点和交叉表的有用功能我们可以轻松地对多个变量进行交叉表如下所示 install packages expss libr

r dplyr plyr tidyr expss

选择分组数据的最小数据 - 保留所有列[重复]

这个问题在这里已经有答案了我在这里碰壁了我有一个dataframe 很多行这是示意性示例 myDf ID c1 c2 myDate A 1 1 01 01 2015 A 2 2 02 02 2014 A 3 3 03 01 2014

r dplyr plyr

从数据框列表中将选定的数据框添加在一起

当我尝试将微观解决方案应用于宏观尺度时我遇到了大问题我想编写一个函数使我能够自动将特定数据帧的所有值添加在一起首先我创建了所有数据框的列表 gt lst data001 A B C D E X 10 30 50 70 Y 20 4

r loops plyr

将日期与 data.table 包一起使用

我最近发现了 data table 包现在想知道是否应该替换我的一些 plyr 代码总而言之我真的很喜欢plyr 并且我基本上实现了我想要的一切然而我的代码运行了一段时间并且加快速度的前景足以让我运行一些测试这些测试很快就结束

r datetime dataTable plyr

如何使用 geom_boxplot(stat = "identity") 模拟带有异常值的 geom_boxplot()

我想预先计算数据的变量摘要使用plyr并通过一个quantile函数然后用geom boxplot stat identity 这非常有效除了它 a 不将异常值绘制为点以及 b 将胡须扩展到所绘制数据的最大值和最小值 Exampl

r ggplot2 plyr dplyr

计算经过的“时间”，其中参考时间取决于一个因素

我正在尝试计算数据框中的经过时间其中经过时间的开始值取决于数据框中因子列的值简单来说我将把时间值视为数字而不是时间对象我的问题是关于分割应用组合而不是时间对象我的数据框如下所示 df lt data frame id g

r plyr

按降序按组连接值[重复]

这个问题在这里已经有答案了我想要一个数据我的数据 A 看起来像 author id paper id prob 731 24943 1 731 24943 1 731 688974 1 731 964345 8 731 1201905

r dataTable plyr

R 中多个变量的分组

我是一名强大的 excel 数据透视表用户正在强迫自己学习 R 我确切地知道如何在 excel 中进行此分析但无法找出在 R 中进行编码的正确方法我试图按两个不同的变量对用户数据进行分组同时将变量分组到范围或箱中然后汇总其他变

Excel r pivottable plyr

为r中的每个变量按组汇总表中的数据

我有一些数据我想用 R 中的一些汇总值正确格式化我已经玩过aggregate和其他事情例如summaryBy 但没有一个产生我想要的结果这是数据 data lt data frame id c 1 2 3 4 5 6 7 8 9 1

r dplyr Aggregate plyr

如何对一组多列进行透视？以及如何从长格式恢复到原始宽格式？

如果我有以下数据 D tibble tribble firm ind var1 1 var1 2 op2 1 op2 2 A 1 10 11 11 12 A 2 12 13 13 14 B 1 14 15 15 16 B 2 16 17 1

r dplyr plyr

将数据帧拆分为固定大小的行

我有一堆长度不同的数据帧范围从大约到 15 000 至 500 000 对于每个数据帧我想将它们分成更小的数据帧每个数据帧有 300 行我将对其进行进一步处理我怎样才能做到这一点 This 按行数拆分数据框 https stack

r split DataFrame plyr

R：按数字而不是按字典顺序对 dcast 输出中的列重新排序

这是关于对包含数字和文本的列名称进行排序我有一个数据框其结果是dcast有 200 行我的订购有问题列名称采用以下格式 names DF lt c Testname1 1 Testname1 100 Testname1 11 Tes

r plyr

我用的plyr对吗？我似乎使用了太多内存

我有以下有点大的数据集 gt dim dset 1 422105 25 gt class dset 1 data frame gt 在不执行任何操作的情况下 R 进程似乎占用了大约 1GB 的 RAM 我正在尝试运行以下代码 dset lt

r plyr dataTable