我的 S4 类有一个被调用多次的方法。我注意到执行时间比独立调用类似函数要慢得多。因此,我在类中添加了一个类型为“function”的槽,并使用该函数而不是该方法。下面的示例显示了执行此操作的两种方法,并且它们的运行速度都比相应的方法快得多。此外,该示例表明该方法的速度较低并不是因为方法必须从类中检索数据,因为即使函数也这样做,它们也会更快。
当然,这种做事方式并不理想。我想知道是否有一种方法可以加速方法调度。有什么建议么?
setClass(Class = "SpeedTest",
representation = representation(
x = "numeric",
foo1 = "function",
foo2 = "function"
)
)
speedTest <- function(n) {
new("SpeedTest",
x = rnorm(n),
foo1 = function(z) sqrt(abs(z)),
foo2 = function() {}
)
}
setGeneric(
name = "method.foo",
def = function(object) {standardGeneric("method.foo")}
)
setMethod(
f = "method.foo",
signature = "SpeedTest",
definition = function(object) {
sqrt(abs(object@x))
}
)
setGeneric(
name = "create.foo2",
def = function(object) {standardGeneric("create.foo2")}
)
setMethod(
f = "create.foo2",
signature = "SpeedTest",
definition = function(object) {
z <- object@x
object@foo2 <- function() sqrt(abs(z))
object
}
)
> st <- speedTest(1000)
> st <- create.foo2(st)
>
> iters <- 100000
>
> system.time(for (i in seq(iters)) method.foo(st)) # slowest by far
user system elapsed
3.26 0.00 3.27
> # much faster
> system.time({foo1 <- st@foo1; x <- st@x; for (i in seq(iters)) foo1(x)})
user system elapsed
1.47 0.00 1.46
> # retrieving st@x instead of x does not affect speed
> system.time({foo1 <- st@foo1; for (i in seq(iters)) foo1(st@x)})
user system elapsed
1.47 0.00 1.49
> # same speed as foo1 although no explicit argument
> system.time({foo2 <- st@foo2; for (i in seq(iters)) foo2()})
user system elapsed
1.44 0.00 1.45
# Cannot increase speed by using a lambda to "eliminate" the argument of method.foo
> system.time({foo <- function() method.foo(st); for (i in seq(iters)) foo()})
user system elapsed
3.28 0.00 3.29
成本在于方法查找,它在每次迭代中从头开始。这可以通过计算一次方法分派来短路
METHOD <- selectMethod(method.foo, class(st))
for (i in seq(iters)) METHOD(st)
这(更好的方法查找)将是一个非常有趣且有价值的项目;在其他动态语言中可以学到宝贵的经验教训,例如维基百科上提到的内联缓存动态调度 page.
我想知道您进行许多方法调用的原因是否是因为数据表示和方法的矢量化不完整?
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)