优化运行时间：改变igraph中边的权重需要很长时间。有没有办法优化它？

2023-12-20

我正在从 osmar 对象构建的 igraph 中搜索一组边，并希望更改这些边的权重。由于我的图表很大，因此这项任务需要很长时间。由于我在循环中运行此函数，因此运行时间变得更大。

有什么办法可以优化这个吗？

这是代码：

library(osmar)
library(igraph)
library(tidyr)
library(dplyr)

### Get data ----
src <- osmsource_api(url = "https://api.openstreetmap.org/api/0.6/")
muc_bbox <- center_bbox(11.575278, 48.137222, 1000, 1000)
muc <- get_osm(muc_bbox, src)

### Reduce to highways: ----
hways <- subset(muc, way_ids = find(muc, way(tags(k == "highway"))))
hways <- find(hways, way(tags(k == "name")))
hways <- find_down(muc, way(hways))
hways <- subset(muc, ids = hways)

#### Plot data ----
## Plot complete data and highways on top:
plot(muc)
plot_ways(muc, col = "lightgrey")
plot_ways(hways, col = "coral", add = TRUE)

### Define route start and end nodes: ----
id<-find(muc, node(tags(v %agrep% "Sendlinger Tor")))[1]
hway_start_node <-find_nearest_node(muc, id, way(tags(k == "highway"))) 
hway_start <- subset(muc, node(hway_start_node))

id <- find(muc, node(attrs(lon > 11.58 & lat > 48.15)))[1]
hway_end_node <- find_nearest_node(muc, id, way(tags(k == "highway")))
hway_end <- subset(muc, node(hway_end_node))

## Add the route start and and nodes to the plot:
plot_nodes(hway_start, add = TRUE, col = "red", pch = 19, cex = 2)
plot_nodes(hway_end, add = TRUE, col = "red", pch = 19, cex = 2)

### Create street graph ----
gr <- as.undirected(as_igraph(hways))

### Compute shortest route: ----
# Calculate route
route <- function(start_node,end_node) {
  get.shortest.paths(gr,
                     from = as.character(start_node),
                     to = as.character(end_node), 
                     mode = "all")[[1]][[1]]}
# Plot route
plot.route <- function(r,color) {
  r.nodes.names <- as.numeric(V(gr)[r]$name)
  r.ways <- subset(hways, ids = osmar::find_up(hways, node(r.nodes.names)))
  plot_ways(r.ways, add = TRUE, col = color, lwd = 2)
}
nways <-  1
numway <- 1
r <- route(hway_start_node,hway_end_node)

# Plot route

color <- colorRampPalette(c("springgreen","royalblue"))(nways)[numway]
plot.route(r,color)


## Route details ----
# Construct a new osmar object containing only elements 
# related to the nodes defining the route:
route_nodes <- as.numeric(V(gr)[r]$name)
route_ids <- find_up(hways, node(route_nodes))

osmar.route <- subset(hways, ids = route_ids)
osmar.nodes.ids <- osmar.route$nodes$attrs$id

# Extract the nodes’ coordinates,
osmar.nodes.coords <- osmar.route$nodes$attrs[, c("lon", "lat")]
osmar.nodes <- cbind(data.frame(ids = osmar.nodes.ids),
                     data.frame(ids_igraph = as.numeric(V(gr)[r]) ),
                     osmar.nodes.coords) 


## Find edges ids containing points of interest ----
wished.coords <- data.frame(wlon = c(11.57631),
                            wlat = c(48.14016)) 


# Calculate all distances
distances <- crossing(osmar.nodes,wished.coords) %>%
             mutate(dist = geosphere::distHaversine(cbind(lon,lat),cbind(wlon,wlat)))


# Select nodes below maximum distance :
mindist <- 50 #m

wished.nodes <- distances %>% filter(dist < mindist)

# Select edges incident to these nodes :
selected.edges <- unlist(incident_edges(gr,V(gr)[wished.nodes$ids_igraph]))

This is where the slowdown occurs: Weight of selected edges, change it by multiplying it with 10
E(gr)[selected.edges]$weight<-E(gr)[selected.edges]$weight*10

这就是减速发生的地方：所选边的权重，通过乘以 10 来更改它

E(gr)[selected.edges]$weight<-E(gr)[selected.edges]$weight*10

也许我可以使用哈希图？

UPDATE

hashmap

单位：秒

Hashmap:

expr           min       lq     mean   median      uq      max     neval 

Hashmap      3.248543 3.289474 3.472038 3.324417 3.734050 4.188924   100 

Without      3.267549 3.333012 3.557179 3.367015 3.776429 5.643784   100

Sadly it does not seemt to bring a lot of improvement.


library(hashmap) 
#https://github.com/nathan-russell/hashmap
         H <- hashmap(E(gr)[selected.edges],E(gr)[selected.edges]$weight)
         sapply(H$find(E(grr)[selected.edges]), function(x) x * 10)

UPDATE:根据 igraph 文档，igraph 是线程安全的，所以我可以使用并行。

我目前正在尝试这个：

no_cores <- detectCores(logical = FALSE) 
 data <- split(selected.edges,factor(sort(rank(selected.edges)%%no_cores)))
 c_result <- mclapply(1:no_cores, function(x) {
 E(gr)[unlist(data[[x]])]$weight * 1000 / mean_value }, mc.cores = no_cores) 
   
     E(gr)[unlist(data)]$weight<-unlist(c_result)

我想知道为什么我必须在并行循环之外执行“写入步骤”。当我试图在循环内将权重写回 igraph 时，它不起作用，即权重没有更新。

先感谢您！ BR

如所示高级R http://adv-r.had.co.nz/Performance.html，R 中的实现性能可能因语法而有很大差异。

E(gr)[selected.edges]$weight<-E(gr)[selected.edges]$weight*10

是一个有效的语法，但也可以用其他方式表述：

set.edge.attribute(graph=gr,name="weight",index=selected.edges,value=10*get.edge.attribute(graph=gr,name="weight",index=selected.edges))

那么让我们比较一下这两种解决方案：

microbenchmark::microbenchmark(
  ref={E(gr)[selected.edges]$weight<-E(gr)[selected.edges]$weight*10},
  new={set.edge.attribute(graph=gr,name="weight",index=selected.edges,value=10*get.edge.attribute(graph=gr,name="weight",index=selected.edges))})

Unit: microseconds
 expr       min        lq       mean    median        uq       max neval cld
  ref 15920.404 16567.788 17793.4412 17111.583 18491.685 25867.477   100   b
  new   246.974   266.462   296.5088   278.769   292.718   662.974   100  a

@Andreas，如果这可以解决您的问题，您可以检查更大的数据集吗？

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

dplyr

igraph

tidyr

osmar

优化运行时间：改变igraph中边的权重需要很长时间。有没有办法优化它？的相关文章

R 中的闭包类似于 Python

首先考虑以下 Python 代码该代码计算函数被调用的次数 def counter fn count 0 def inner args kwargs nonlocal count count 1 print Function 0 was
如何将管道链 (magrittr) 的结果提供给对象

这是一个相当简单的问题但我无法通过 google stackexchange 找到答案并查看 magrittr 的文档如何提供通过 gt 连接的函数链的结果来创建向量我看到大多数人做的是 a lt data frame x c 1 3
如何在Shiny中默认选择verbatimTextOutput中的文本？

这是与我之前的问题相关的问题是否可以有固定宽度的 verbatimTextOutput 并让文本在 Shiny 中换行 https stackoverflow com q 58516071 7669809 我有以下闪亮的应用程序 http
Rstudio 更有意义的窗口标题

我在 Ubuntu 16 04 下使用 R studio 版本 1 0 143 窗口标题仅显示一个非常无信息的 RStudio 我希望至少有当前选项卡的名称或者最好是与此选项卡对应的文件的完整路径在 Windows 下完整路径似乎出现
R 因子变量之间的相关性

我想知道是否有一种简单的方法来识别与另一个变量 100 相关的特征因子变量因此在示例中该过程将匹配颜色和车辆以及植物和高度 color lt c black black blue blue yellow vehicle
在 R 中将列表列表转换为数据帧：Tidyverse 方式

我正在寻找将列表列表转换为 R 中的数据帧的 Tidyverse 方法 Create a list of lists a lt seq 1 10 1 b lt seq 1 20 2 Function to calculate the sum
如何调整ggplot2中的标题位置

这是代码 require ggplot2 require grid pdf a pdf png a png a lt qplot date unemploy data economics geom line opts title A b l
在字符串中每个字母后面添加数字

我有几个具有固定格式的字符串格式为一个字母后跟一个数字例如 A3B1C7D1 但是如果字母后面的数字为 1 则字符串将写为 A3BC7D 我想做的是插入数字 1 然后将字符串转换为A3BC7D to A3B1C7D1 我的示例数据是
重用 R 中内置的模型

在 R 中构建模型时如何保存模型规范以便可以在新数据上重用它假设我根据历史数据建立逻辑回归但直到下个月才会有新的观察结果最好的方法是什么我考虑过的事情保存模型对象并在新会话中加载我知道某些模型可以使用 PMML 导出但还没有
使用 RSQLite 在 R 中加载 SQLite 表

我有这个函数用来加载 SQLite 表 sqLiteConnect lt function database table library DBI library RSQLite con lt dbConnect SQLite dbname
rpy2 在从 R 到 Python 的数据帧中处理 NA/缺失值时出现问题

我在使用rpy2包进行转换时遇到问题dataframe将 R 中的内容保存到 Python 中 import os os environ R HOME Library Frameworks R framework Resources imp
在 ggplot2 中，如何将堆叠直方图中的小值条形组合在一起？

示例数据 tmp df lt data frame a rnorm 100 0 1 b rnorm 100 0 5 1 c rnorm 100 0 5 1 d rnorm 100 1 1 e rnorm 100 1 1 gt tidyr g
如何在 sqlSave() 命令中跳过主键？

我正在尝试使用 RODBC 在 MySQL 数据库中插入 data frame 我正在使用的命令如下 sqlSave channel dbData tablename table name append TRUE safer TRUE fa
ggplot：按组自动化的百分位线

我找到了dplyr gt 运算符有助于简单的 ggplot2 转换无需求助于ggproto 这是必需的ggplot2 扩展 http docs ggplot2 org dev vignettes extending ggplot2 htm
profvis() 何时以及为何显示“源不可用”？

我经常分析 R 代码并大量使用 profvis 对于某些函数浏览器窗口的上半部分会显示源代码有时则不会我不知道什么时候会出现这种情况对我来说这似乎是随机的有谁知道 profvis 何时以及为什么无法在顶部窗口中显示代码发生这种
readRDS() 加载额外的包

什么情况下会出现readRDS R 中的函数尝试加载包命名空间我很惊讶地在新的 R 会话中看到以下内容 gt loadedNamespaces 1 base datasets graphics grDevices methods sta
Dplyr 多重滞后整齐评估？

我试图在 dplyr 中使用尽可能少的代码来实现多个滞后同时坚持整洁的评估以下标准评估 SE 代码有效 if require dplyr install packages dplyr library dplyr a as tibble
如何判断某个软件包是否已经安装？

当我安装 yaml 包时如果之前已经安装过 RStudio 则会弹出一条烦人的错误消息如何判断该软件包是否已安装以便我可以在代码中决定是否安装该软件包该消息位于弹出窗口中内容如下此安装将更新的一个或多个软件包当前已加载在更新
R 条形图中的 X 轴

我想问一个关于 barplot 轴的问题首先请看我的数据 SerNo DOY Rain 1 350 0 2 351 0 3 352 0 4 353 0 5 354 0 6 355 0 7 356 0 8 357 0 9 358 0 10
使用 SparkR 1.5 从 RStudio 中的 hdfs 读取大文件（纯文本、xml、json、csv）的选项

我是 Spark 新手想知道除了下面的选项之外是否还有其他选项可以使用 SparkR 从 RStudio 读取存储在 hdfs 中的数据或者我是否正确使用它们数据可以是任何类型纯文本 csv json xml 或任何包含关系表的数据

随机推荐

代表自由团体的好方法是什么？

很容易表示自由岩浆二叉叶树自由半群非空列表和自由幺半群列表并且不难证明它们实际上就是它们所声称的那样但自由团体似乎要棘手得多似乎至少有两种方法可以使用通常的方法List Either a 表示将要求编码为类型如果您有Le
Krajee Bootstrap 文件输入，捕获 AJAX 成功响应

我正在使用 Krajee Bootstrap 文件输入插件通过 AJAX 调用执行上传以下是 Krajee 插件 AJAX 部分的链接 Krajee 插件 AJAX http plugins krajee com file input d
使用 Hilt 将存储库注入 Android 中的服务

我有一个带有 Hilt 依赖注入的 Android 项目我已经定义了MyApplication and MyModule如下 HiltAndroidApp class MyApplication Application Module In
使用 Javascript 打开 vCard

使用二维码电子名片用户用手机扫描该代码然后手机上会弹出添加到联系人对话框例如下面的代码我怎样才能做到同样的事情但我希望它通过单击按钮来完成相同的操作而不是扫描二维码我已经尝试过以下方法 var btn document g
如何在 Alpine Docker 镜像上安装 gdbserver 包？

我一直在尝试在 Alpine Docker 映像上安装 gdbserver 包 https hub docker com alpine https hub docker com alpine apk添加gdbserver 给了我这个错误
Kotlin 如何创建动态对象

在 javascript 中我们可以做这样的事情 function putritanjungsari data console log data name let data name putri div m4th putritanjungs
选择不具有特定类的元素的最后一个子元素

我尝试选择没有特定类别的子元素的最后一个元素我已经设置了一个js fiddle http jsfiddle net VATaj 2
在 Woocommerce 3 中通过 ajax 提交并创建结帐订单

我在结账表单中添加了一个按钮
为什么引入新的 JSLint 错误“使用空格，而不是制表符”和“不安全字符”？

我使用 JSLint 验证 JavaScript 已经有大约 2 年了偶尔会有一些规则发生变化一般来说当 JSLint 引入新规则时会有一个复选框可以在解析时忽略此规则或者如果您选择不忽略它则使您的代码符合它然而当我今天运行
android LiveData 或协程通道

让应用程序使用 LiveData 和 ViewModel for UI 来观察存储库中的数据更新它运行良好现在有人提出 LiveData还没有被很好地采用也许应该改用协程的通道首先不确定关于LiveData的说法是否准确我确信使用
Python远程过程调用（不带远程部分）

我有一个不以 root 身份运行的 Python 服务器它面向我正在开发的应用程序然而有一些应用程序功能需要访问 RAW 套接字这意味着 root 权限显然我不想以 root 身份运行主服务器因此我的解决方案是创建一个守护进程
SQL Server + 实体框架基础知识

我的任务是用 C 创建一个程序来管理公司的员工仅简要概述每个员工的所有信息都存储在 MS SQL 数据库中作为表示层我必须使用 WPF 并作为与数据库的通信 LINQ to Entities 问题是我设法自学了 WPF 但 SQL
制作一个 24/7 运行并从命名管道读取的 Perl 守护进程

我正在尝试使用 perl 制作一个日志分析器分析器将在 AIX 服务器上的后台全天候 24 7 运行并从系统日志将日志定向到的管道从整个网络读取基本上 logs from network gt named pipe A gt pe
TDD：您为单元测试公开了哪些方法？

TDD 有一个方面我从未完全理解假设有人要求您实现一个简单的 Stack 对象如果您的设计正确您将得到一个非常最小且干净的 API 认为 push pop and isEmpty 除此之外任何事情都会过度抑制需求并让用户有太多的空
导出和导入 IndexedDB 数据

我正在制作一个供我自己使用的工具需要一个简单的数据库这似乎是学习 HTML5 IndexedDB API 的好机会但重要的是我在任何时候都不会丢失数据我想备份浏览器的配置文件目录就可以进行备份但我也希望可能使用不同的计算机因此导
从github导入ADT Eclipse中的android项目

我正在尝试将 android 项目从 github 导入到 ADT Eclipse 中但当我克隆它时它在存储库中找不到任何项目该仓库显然是一个android应用程序项目从源代码来看但没有找到可以导入的项目我的步骤如下在包资源
在函数重载中将右值引用实现为参数

我已经询问过有关代码审查和软件工程的问题但该主题不适合该网站因此我在这里询问希望这不是基于意见的我是一名老派 C 开发人员我已经停留在 C 2003 但现在我已经阅读了一些有关现代 C 11 17 的书籍并且正在重写我的一些库
Python3.10源码venv已经改变

我在个人仓库上做了一些 python leetcode 在我将 Kubuntu 升级到 22 04 后我意识到当前的 venv 不起作用我想我需要重新创建 venv 安装了 python3 10 venv 但我无法获取并激活它事实上
Apache Spark：map、flatMap、mapPartitions、mapPartitionsWithIndex 的比较

Apache Spark map flatMap mapPartitions mapPartitionsWithIndex 的比较欢迎提出建议以提高我们的知识地图函数它有什么作用通过提供的函数传递 RDD 的每个元素即功能平
优化运行时间：改变igraph中边的权重需要很长时间。有没有办法优化它？

我正在从 osmar 对象构建的 igraph 中搜索一组边并希望更改这些边的权重由于我的图表很大因此这项任务需要很长时间由于我在循环中运行此函数因此运行时间变得更大有什么办法可以优化这个吗这是代码 library osmar

优化运行时间：改变igraph中边的权重需要很长时间。有没有办法优化它？

优化运行时间：改变igraph中边的权重需要很长时间。有没有办法优化它？ 的相关文章

随机推荐

热门标签

优化运行时间：改变igraph中边的权重需要很长时间。有没有办法优化它？的相关文章