Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
download.file 中的错误:不支持方案
我需要从 下载一些 csv 文件http www elections state md us http www elections state md us 这是我的代码 url lt http www elections state md
r
URL
plyr
R plyr,data.table,应用data.frame的某些列
我正在寻找加速我的代码的方法 我正在调查apply ply方法以及data table 不幸的是 我遇到了问题 这里有一个small样本数据 ids1 lt c 1 1 1 1 2 2 2 2 ids2 lt c 1 2 3 4 1 2 3
r
dataTable
plyr
apply
错误:仅在包含所有数值变量的数据框上定义,并在大型数据集上使用 ddply
我正在尝试按月 年 调查 ID 和网格 ID 在一个非常大的数据集 22000 条记录 上计算多个参数 例如 Er Count Mn Count 的总和和平均值 我最初尝试使用此代码来获取总和 dlply Effort All c Er C
r
plyr
R:加速“group by”操作
我有一个模拟 中间有一个巨大的聚合和组合步骤 我使用 plyr 的 ddply 函数对这个过程进行了原型设计 它可以很好地满足我的大部分需求 但我需要更快的聚合步骤 因为我必须运行 10K 次模拟 我已经在并行扩展模拟 但如果这一步骤更快
performance
r
plyr
在 Sparklyr 中创建虚拟变量?
我正在尝试扩展我的一些 ML 管道 我喜欢 Sparklyr 打开的 rstudio spark 和 h2o 的组合 http spark rstudio com http spark rstudio com 我试图弄清楚的一件事是如何使用
r
apachespark
dplyr
plyr
sparklyr
Demean R 数据框
我想贬低 R 中的多列data frame 使用来自的示例这个问题 https stats stackexchange com questions 46978 fixed effects using demeaned data why di
r
plyr
需要更快的滚动应用函数以及开始停止索引
下面是一段代码 它给出滚动 15 分钟 历史 窗口的交易价格水平的百分位 如果长度为 500 或 1000 它运行得很快 但正如您所看到的 有 45K 个观测值 对于整个数据来说 它的运行速度非常慢 我可以应用任何 plyr 功能吗 欢迎任
r
performance
plyr
R 中的条件交叉表
寻找使用 expss 包实现以下任务的最快方法 有了一个很棒的 expss 包 我们可以轻松地进行交叉表 它具有其他优点和交叉表的有用功能 我们可以轻松地对多个变量进行交叉表 如下所示 install packages expss libr
r
dplyr
plyr
tidyr
expss
选择分组数据的最小数据 - 保留所有列[重复]
这个问题在这里已经有答案了 我在这里碰壁了 我有一个dataframe 很多行 这是示意性示例 myDf ID c1 c2 myDate A 1 1 01 01 2015 A 2 2 02 02 2014 A 3 3 03 01 2014
r
dplyr
plyr
从数据框列表中将选定的数据框添加在一起
当我尝试将微观解决方案应用于宏观尺度时 我遇到了大问题 我想编写一个函数 使我能够自动将特定数据帧的所有值添加在一起 首先 我创建了所有数据框的列表 gt lst data001 A B C D E X 10 30 50 70 Y 20 4
r
loops
plyr
将日期与 data.table 包一起使用
我最近发现了 data table 包 现在想知道是否应该替换我的一些 plyr 代码 总而言之 我真的很喜欢plyr 并且我基本上实现了我想要的一切 然而 我的代码运行了一段时间 并且加快速度的前景足以让我运行一些测试 这些测试很快就结束
r
datetime
dataTable
plyr
如何使用 geom_boxplot(stat = "identity") 模拟带有异常值的 geom_boxplot()
我想预先计算数据的变量摘要 使用plyr并通过一个quantile函数 然后用geom boxplot stat identity 这非常有效 除了它 a 不将异常值绘制为点以及 b 将 胡须 扩展到所绘制数据的最大值和最小值 Exampl
r
ggplot2
plyr
dplyr
计算经过的“时间”,其中参考时间取决于一个因素
我正在尝试计算数据框中的经过时间 其中经过时间的 开始 值取决于数据框中因子列的值 简单来说 我将把时间值视为数字而不是时间对象 我的问题是关于分割 应用 组合 而不是时间对象 我的数据框如下所示 df lt data frame id g
r
plyr
按降序按组连接值[重复]
这个问题在这里已经有答案了 我想要一个数据 我的数据 A 看起来像 author id paper id prob 731 24943 1 731 24943 1 731 688974 1 731 964345 8 731 1201905
r
dataTable
plyr
R 中多个变量的分组
我是一名强大的 excel 数据透视表用户 正在强迫自己学习 R 我确切地知道如何在 excel 中进行此分析 但无法找出在 R 中进行编码的正确方法 我试图按两个不同的变量对用户数据进行分组 同时将变量分组到范围 或箱 中 然后汇总其他变
Excel
r
pivottable
plyr
为r中的每个变量按组汇总表中的数据
我有一些数据 我想用 R 中的一些汇总值正确格式化 我已经玩过aggregate和其他事情 例如summaryBy 但没有一个产生我想要的结果 这是数据 data lt data frame id c 1 2 3 4 5 6 7 8 9 1
r
dplyr
Aggregate
plyr
如何对一组多列进行透视?以及如何从长格式恢复到原始宽格式?
如果我有以下数据 D tibble tribble firm ind var1 1 var1 2 op2 1 op2 2 A 1 10 11 11 12 A 2 12 13 13 14 B 1 14 15 15 16 B 2 16 17 1
r
dplyr
plyr
将数据帧拆分为固定大小的行
我有一堆长度不同的数据帧 范围从大约到 15 000 至 500 000 对于每个数据帧 我想将它们分成更小的数据帧 每个数据帧有 300 行 我将对其进行进一步处理 我怎样才能做到这一点 This 按行数拆分数据框 https stack
r
split
DataFrame
plyr
R:按数字而不是按字典顺序对 dcast 输出中的列重新排序
这是关于对包含数字和文本的列名称进行排序 我有一个数据框 其结果是dcast有 200 行 我的订购有问题 列名称采用以下格式 names DF lt c Testname1 1 Testname1 100 Testname1 11 Tes
r
plyr
我用的plyr对吗?我似乎使用了太多内存
我有以下有点大的数据集 gt dim dset 1 422105 25 gt class dset 1 data frame gt 在不执行任何操作的情况下 R 进程似乎占用了大约 1GB 的 RAM 我正在尝试运行以下代码 dset lt
r
plyr
dataTable
«
1
2
3
4
5
6
»