我有以下排序向量:
> v
[1] -1 0 1 2 4 5 2 3 4 5 7 8 5 6 7 8 10 11
如何删除 -1、0 和 11 条目无需循环整个向量,使用用户循环还是隐式使用语言关键字?也就是说,我想修剪每个向量edge并且仅在每个边缘处,以便排序序列在我的最小、最大参数 1 和 10 内。该解决方案应假设向量已排序以避免检查每个元素。
当我们想要将向量中的项用作另一个对象中的索引时,这种解决方案可以在非常大的向量的向量化操作中派上用场。对于一个应用程序,请参阅这个线程 https://stackoverflow.com/questions/16200667/how-can-i-vectorize-access-to-neighbour-vector-elements-in-r.
要按索引将元素包含在向量中:
v [2:10]
排除某些元素
v [-c (1, 11) ]
仅包含特定范围:
v <- v [v>=1 & v <=10]
如果允许我假设,就像在您的示例中一样,要修剪的元素数量
> n<-1e8
> v<--3:(n+3)
>
> min <- 1
> max <- length(v)
>
> calcMin <- function(v, minVal){
+ while(v[min] < minVal){
+ min <- min + 1
+ }
+ min
+ }
>
> calcMax <- function(v, maxVal){
+ while(v[max] > maxVal){
+ max <- max - 1
+ }
+ max
+ }
>
> #Compute the min and max indices and create a sequence
> system.time(a <- v[calcMin(v, 1):calcMax(v,n)])
user system elapsed
1.030 0.269 1.298
>
> #do a binary search to find the elements (as suggested by @nograpes)
> system.time(b <- v[do.call(seq,as.list(findInterval(c(1,n),v)))])
user system elapsed
2.208 0.631 2.842
>
> #use negative indexing to remove elements
> system.time(c <- v[-c(1:(calcMin(v, 1)-1), (calcMax(v,n)+1):length(v))])
user system elapsed
1.449 0.256 1.704
>
> #use head and tail to trim the vector
> system.time(d <- tail(head(v, n=(calcMax(v,n)-length(v))), n=-calcMin(v, 1)+1))
user system elapsed
2.994 0.877 3.871
>
> identical(a, b)
[1] TRUE
> identical(a, c)
[1] TRUE
> identical(a, d)
[1] TRUE
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)