R 中更快的模数或相等检查（或矢量化的好方法）

2024-03-04

我一直在运行欧拉项目，试图编写计算效率高的程序。考虑问题1：http://projecteuler.net/problem=1 http://projecteuler.net/problem=1。我将范围从 1000 提高到 10,000,000 以突出效率低下的情况。

这是我的解决方案：

system.time({
    x <- 1:1E7
    a <- sum(as.numeric(x[x%%3 ==0 | x%%5==0]))
})
 user  system elapsed 
0.980   0.041   1.011

这是朋友编写的一些 C++ 代码，用于执行相同的操作。

#include <iostream>
using namespace std;

int main(int argc, char** argv)
{
 long x = 0;
 for (int i = 1; i < 10000000; i++)
 {
   if (i % 3 == 0)
     x += i;
   else if (i % 5 == 0)
     x += i;
 }
 cout << x;
 return 0;
}
cbaden$ time ./a.out
23333331666668
real    0m0.044s
user    0m0.042s
sys     0m0.001s

我知道 C++ 应该比 R 更快，但是this快多了？ Rprof 指出，我将近 60% 的时间花在模运算符上，13% 的时间花在“==”运算上。有没有矢量化的方法可以更快地做到这一点？

第二个担心是我会耗尽内存——随着范围变大，这种方法的可扩展性不太好。有没有一种好方法可以保留可矢量化性，但不会尝试将子集保留在内存中？

模数运行时速度更快integer是而不是numerics:

f1 <- function() {
   x <- 1:1E7
   a <- sum(as.numeric(x[x%%3 ==0 | x%%5==0]))
}

f2 <- function() {
   x <- 1:1E7
   a <- sum(as.numeric(x[x %% 3L == 0L | x %% 5L == 0L]))
}

library(rbenchmark)
benchmark(f1(), f2(), replications = 5)
#   test replications elapsed relative user.self sys.self user.child sys.child
# 1 f1()            5   14.78 4.976431     13.95     0.67         NA        NA
# 2 f2()            5    2.97 1.000000      2.37     0.50         NA        NA

这距离 C++ 的性能还很远，但这是朝着正确方向迈出的一步。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

R 中更快的模数或相等检查（或矢量化的好方法）的相关文章

如何使用 R 将每个文件的数据添加为附加行，从而将不同的 .csv 文件合并为一个完整的文件？

我有几个不同的文件夹它们都包含一个 csv 文件所有这些 csv 文件都有一个单独的列其中包含实验的一种条件的数据我想以将每个文件的数据添加为新列的方式合并这些 csv 文件目前它看起来像这样 C1 csv 102 106 15
dplyr 返回每个组的全局平均值，而不是每个组的平均值

有人可以解释一下我在这里做错了什么 library dplyr temp lt data frame a c 1 2 3 1 2 3 1 2 3 b c 1 2 3 1 2 3 1 2 3 temp gt group by temp 1 g
一段 R 代码会影响 foreach 输出中的随机数吗？

我使用运行模拟foreach and doParallel并与随机数名为random在代码中简而言之我模拟一个足球联赛随机生成所有比赛的获胜者以及相应的结果在dt base没有比赛进行在dt ex1 and dt ex24场比赛
randomForest 包在删除一个预测类时的奇怪行为

我正在运行一个随机森林模型它产生的结果从统计角度来看对我来说完全没有意义因此我确信有些东西mustrandomForest 包的代码出现错误至少在模型的本次迭代中预测左侧变量是具有 3 种可能结果的政党 ID 民主党独立党共和
如何在 R 中合并同名列表中的数据框？

我有一个包含很多数据框的列表如果它们具有相同的名称我想合并它们即合并所有具有相同名称 a 和 b 的数据框像这样 a lt aaaaa b lt bbbbb c lt ccccc g lt list df1 lt data fram
将字符串列拆分为多个虚拟变量

作为 R 中 data table 包的相对缺乏经验的用户我一直在尝试将一个文本列处理为大量指示符列虚拟变量每列中的 1 表示特定的子字符串是在字符串列中找到例如我想处理这个 ID String 1 a b 2 b c 3 c 进入
将 ftransform 与折叠 R 包中的 fgroup_by 一起使用

我正在尝试重现以下输出dplyr代码与R包裹collapse dplyr Code library tidyverse starwars gt select name mass species gt group by species gt
使用 R 下载压缩数据文件、提取和导入数据

EZGraphs 在 Twitter 上写道很多在线 csv 都被压缩了有没有办法下载解压缩存档并使用 R 将数据加载到 data frame Rstats 我今天也尝试这样做但最终只是手动下载 zip 文件我尝试过类似的东西 f
R中的重叠矩阵

我有以下数据框 id channel 1 a 1 b 1 c 2 a 2 c 3 a 我想创建并重叠矩阵它基本上是一个方阵行和列标签为 a b c 表中的每个条目显示每个通道共有多少个 id 例如在上面的例子中矩阵看起来像 a b
访问或解析 R 中的 summary() 中的元素

我运行以下 R 命令来进行 Dunnett 测试并获取摘要如何访问下面线性假设的每一行这是摘要输出的一部分基本上我不知道摘要的结构我尝试使用名称但它似乎不起作用因为我没有看到任何命名属性来提供这一点 library multco
如何按时间间隔匹配数据帧？

这是我从数据记录器导入原始数据时经常出现的问题温度记录仪设置为每十分钟记录一次温度单独的气体记录仪设置为记录最后十分钟间隔内使用的气体我想将这两个记录器的数据合并到一个数据框中进行绘图和分析但时间并不完全一致我希望每十分钟的时间段
如何纠正 data.frame 上的字符编码

我有一个像这样的数据框 data names lt data frame DATA c 1 5 rownames data names lt c IV xc1N JOS xc9 LUC xcdA RAM xd3N TO xd1O data
如何在 R 中执行近似（模糊）名称匹配

我有一个专门用于生物学期刊的大型数据集该数据集是由不同的人长时间编写的因此数据不采用单一格式例如在作者栏中我可以找到John Smith Smith John Smith J等但它们是同一个人我连最简单的动作都做不了例如
为什么 sapply 的缩放速度比样本大小的 for 循环慢？

假设我想采用向量 X 2 1 N 并将 e 计算为每个元素的指数是的我认识到最好的方法就是通过向量化 exp X 但这样做的目的是将 for 循环与 sapply 进行比较我通过逐步尝试三种方法一种使用 for 循环两种以不同方
如何在 R 中的 for 循环内将值存储在向量中

我正在开始使用 R 但我对以下问题感到非常沮丧我试图将 for 循环内完成的某些计算的值存储到我之前定义的向量中问题是如何进行索引因为for循环迭代代码的次数取决于用户的输入所以变量i不一定要从1开始它可以从80开始 for举个例
`as.matrix` 和 `as.data.frame` S3 方法与 S4 方法

我注意到定义as matrix or as data frame作为 S4 类的 S3 方法使例如lm formula objS4 and prcomp object 开箱即用如果它们被定义为 S4 方法则这不起作用为什么将方法定义
如何声明包含 M 个元素的列表对象

我想声明一个包含 M 3 x 3 矩阵的列表如果我事先知道数字 M 那么我可以通过以下方式声明这样的列表 elm lt matrix NA 3 3 Say M 7 myList lt list elm elm elm elm elm el
如何为自定义 S3 类实现提取/取子集 ([ [<-, [[ [[<-)] 函数？

我有一个自定义的 S3 类foo 它在正常的基础上添加了一些自定义行为data frame foo object lt data frame class foo object lt c foo data frame 对于这个类还应该有一个
需要在R中跳过不同数量的行

我正在使用以下代码来处理我的数据但最近我意识到使用skip 27 在数据开始之前跳过存储在我的文件中的信息不是一个好的选择因为每个文件中要跳过的行数不同我的目标是读取存储在多个文件夹中的各种txt文件并非所有文件都有相同的列数列的
case_when 与部分字符串匹配和 contains()

我正在使用一个数据集其中有许多名为 status1 status2 等的列在这些列中它表示某人是否豁免完整注册等不幸的是豁免投入并不一致这是一个示例 library dplyr problem lt tibble perso

随机推荐

Html画布1600x1200屏幕撕裂

我见过几个关于这个问题的问题但它们都已经存在了三年多了通常最后都会说还没有太多解决办法所以我想知道是否有什么改变我目前正在开发一款游戏该游戏使用每秒发生 60 次的间隔在画布上进行绘制它在我的 iPhone 和 PC 上运行得很
Pandas - 保持至少有两个不同代码的组

我正在使用具有以下结构的 DataFrame import pandas as pd df pd DataFrame group 1 1 1 2 2 2 2 3 3 3 4 4 brand A B X A B C X B C X A B c
Symfony2 Crawler - 将 UTF-8 与 XPATH 结合使用

我正在使用 Symfony2 Crawler Bundle 来使用 XPath 除了编码之外一切正常我想使用 UTF 8 编码但 Crawler 不知何故没有使用它我注意到因为 nbsp 被转换为 nbsp 这是一个已知问题 UTF
尝试为银行应用程序调用名为 addAccount 的方法，但它一直给出 .class is Expected 错误

当我尝试调用时这给了我错误addAccount方法说 class 应该出现在我尝试调用它的行上我正在尝试做一项作业我应该创建一个名为的方法addAccount接受两个参数 accountName and accountBalance并
如何在 Microsoft Word 字段中显示下个月？

我需要在 Word 2003 文档中显示当前月份之后的月份名称显示当前月份相当容易 DATE MMMM 在撰写本文时显示九月我想要展示的是十月而我一生都无法弄清楚需要做什么我一直在尝试遵循以下建议添加余额 http addbal
为什么静态方法不被视为良好的面向对象实践？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我正在阅读斯卡拉编程 https rads stackoverflow com amzn click com 193435631X 在第 4 章
在 7.3/9/2+ Swift 中，当设备旋转时如何禁用旋转动画？

这个问题严格来说是关于iOS9 的假设您有一个普通的现代应用程序自动布局故事板通用它允许所有四个旋转位置您希望它以正常方式自动旋转因此当用户将设备从横向旋转为纵向时它将更改为新的基于约束的布局但您只是希望在用户旋转设备期间
通过 VPN 在 Android 上创建 WebAPK 失败

我的公司 VPN 阻止来自 Android 设备的所有外部流量我正在尝试测试内部托管的 PWA 防火墙内的所有资源我观察到尽管通过了 Lighthouse 审核但我的 PWA 在设备上的 WebAPK 创建过程中失败了具体来说安
LINQ to XML 获取 XElement 值

我在从 LINQ to XML 查询获取一些值时遇到问题我从 SOAP Web 服务获取了 XML 并将其传递并解析为 XDocument 进行查询 The XML
在按单个列上的多个值进行内部联接查询过滤时选择“不同”？

所以我不得不说 SQL 是迄今为止我作为开发人员最薄弱的一面也许我想要完成的事情很简单我有这样的东西这不是真正的模型但为了使其易于理解而不浪费太多时间解释它我想出了一个完全模仿我必须使用的表关系的示例一方面有一个表我们称之
放置在自定义指令中的 ui-codemirror 失败且没有错误

我正在尝试使用 ui codemirror 角度指令代码镜像角度库 http angular ui github io ui codemirror build ui codemirror js用例是我必须将其放在自定义指令中但是当我将它放
Shell 脚本无法识别heredoc分隔符

我正在尝试在 Linux 中编写一个非常简单的 shell 脚本我想要实现的场景是创建用户帐户并在内部为其指定密码不允许与用户交互一旦成功只需向用户显示一条成功消息其余的都不应显示在 RHEL 上这非常简单因为 passw
Redis IOException：使用 ServiceStack C# 客户端“现有连接被远程主机强制关闭”

我们有以下设置 RackspaceCloud 8GB 实例上 Ubuntu Linux 12 04LTE 上的 Redis 2 6 具有以下设置 daemonize yes pidfile var run redis 6379 pid po
LogCat 和控制台停止与 Eclipse Android 模拟器一起使用

控制台和 LogCat 打印输出在带有 Android 模拟器的 Eclipse 中停止工作我在控制台中收到以下异常 2011 11 10 11 04 58 启动 logcat 时出现意外错误尝试重新选择设备未找到设备 com and
如何在 Netbeans 中配置 Java 导入的组织

目前 Netbeans 我使用的是 7 3 1 版本具有通过菜单组织 Java 文件中导入的内置功能来源组织进口但我需要更改默认的导入顺序例如在共享环境中工作时软件开发人员必须使用相同的导入设置有什么办法可以做到吗 Try C
在 MySQL 和 Python 中以可重复的方式处理 1970 年之前的日期

在我的 MySQL 数据库中我的日期可以追溯到 1700 年代中期我需要以某种方式将其转换为类似于 Unix 时间的格式的整数 int 的值并不重要只要我可以从数据库或用户输入中获取日期并生成相同的 int 即可我需要使用 MySQ
使用 OWIN 将 Web API 作为 Windows 服务托管

我正在尝试使用 OWIN 将 Web API 应用程序作为 Windows 服务运行但是在尝试启动服务时我收到以下消息本地计算机上的 ServiceName 服务启动然后停止如果其他服务或程序未使用某些服务则会自动停止由于某种
timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP 在一台机器上可以为空，但在另一台机器上不能为空？

我有一个 MySql 表其字段定义为 created timestamp NOT NULL DEFAULT CURRENT TIMESTAMP 在我的本地计算机上我可以运行 INSERT INTO mytbl id user id cr
Javafx连接多个StringProperty

有没有一种简单的方法来绑定 StringProperty 对象的串联这是我想做的 TextField t1 new TextField TextField t2 new TextField StringProperty s1 new Si
R 中更快的模数或相等检查（或矢量化的好方法）

我一直在运行欧拉项目试图编写计算效率高的程序考虑问题1 http projecteuler net problem 1 http projecteuler net problem 1 我将范围从 1000 提高到 10 000 000

R 中更快的模数或相等检查（或矢量化的好方法）

R 中更快的模数或相等检查（或矢量化的好方法） 的相关文章

随机推荐

热门标签

R 中更快的模数或相等检查（或矢量化的好方法）的相关文章