在 NetworkX 中合并两个加权图

2024-01-01

我使用 python 多重处理来创建多个不同的 NetworkX 图，然后使用下面的函数来组合这些图。然而，虽然这个函数对于小图工作得很好，但对于较大的图，它会使用大量内存，并且会挂在我的系统和内存密集型 AWS 系统上（仅使用系统中总内存的大约三分之一）。有没有更有效的方法来执行以下功能？

def combine_graphs(graph1, graph2, graph2_weight = 1):
    '''
    Given two graphs of different edge (but same node) structure (and the same type),
    combine the two graphs, summing all edge attributes and multiplying the second one's
    attributes by the desired weights. 

    E.g. if graph1.edge[a][b] = {'a': 1, 'b':2} and 
    graph2.edge[a][b] = {'a': 3, 'c': 4}, 
    with a weight of 1 the final graph edge should be 
    final_graph.edge[a][b] = {'a': 4, 'b': 2, 'c': 4} and with a weight 
    of .5 the final graph edge should be {'a': 2.5, 'b': 2, 'c': 2}.

    Inputs: Two graphs to be combined and a weight to give to the second graph
    '''

    if type(graph1) != type(graph2) or len(set(graph2.nodes()) - set(graph1.nodes())) > 0:
        raise Exception('Graphs must have the same type and graph 2 cannot have nodes that graph 1 does not have.')

    # make a copy of the new graph to ensure that it doesn't change
    new_graph = graph1.copy()

    # iterate over graph2's edges, adding them to graph1
    for node1, node2 in graph2.edges():
        # if that edge already exists, now iterate over the attributes
        if new_graph.has_edge(node1, node2):
            for attr in graph2.edge[node1][node2]:
                # if that attribute exists, sum the values, otherwise, simply copy attrs
                if new_graph.edge[node1][node2].get(attr) is not None:
                    # try adding weighted value: if it fails, it's probably not numeric so add the full value (the only other option is a list)
                    try:
                        new_graph.edge[node1][node2][attr] += graph2.edge[node1][node2][attr] * graph2_weight
                    except:
                        new_graph.edge[node1][node2][attr] += graph2.edge[node1][node2][attr]
                else:
                    try:
                        new_graph.edge[node1][node2][attr] = graph2.edge[node1][node2][attr] * graph2_weight
                    except:
                        new_graph.edge[node1][node2][attr] = graph2.edge[node1][node2][attr]

        # otherwise, add the new edge with all its atributes -- first, iterate through those attributes to weight them
        else:
            attr_dict = graph2.edge[node1][node2]
            for item in attr_dict:
                try:
                    attr_dict[item] = attr_dict[item] * graph2_weight
                except:
                    continue
            new_graph.add_edge(node1, node2, attr_dict = attr_dict)

    return new_graph

代码中有两个地方会扩展内存：

1）复制graph1（也许你需要保留一份副本）

2）使用graph2.edges()创建内存中所有边的列表，graph2.edges_iter()迭代边而不创建新列表

您也可以通过以不同方式处理边缘数据来使其更快。您可以在迭代边缘时获取数据对象，而不必执行字典查找：

def combined_graphs_edges(G, H, weight = 1.0):
    for u,v,hdata in H.edges_iter(data=True):
        # multply attributes of H by weight
        attr = dict( (key, value*weight) for key,value in hdata.items())
        # get data from G or use empty dict if no edge in G
        gdata = G[u].get(v,{})
        # add data from g
        # sum shared items
        shared = set(gdata) & set(hdata)
        attr.update(dict((key, attr[key] + gdata[key]) for key in shared))
        # non shared items
        non_shared = set(gdata) - set(hdata)
        attr.update(dict((key, gdata[key]) for key in non_shared))
        yield u,v,attr
    return


if __name__ == '__main__':
    import networkx as nx
    G = nx.Graph([('a','b', {'a': 1, 'b':2})])
    H = nx.Graph([('a','b', {'a': 3, 'c':4})])
    print list(combined_graphs_edges(G,H,weight=0.5))
    # or to make a new graph 
    graph = G.copy()
    graph.add_edges_from(combined_graphs_edges(G,H,weight=0.5))

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

networkx

在 NetworkX 中合并两个加权图的相关文章

阻止 TensorFlow 访问 GPU？ [复制]

这个问题在这里已经有答案了有没有一种方法可以纯粹在CPU上运行TensorFlow 我机器上的所有内存都被运行 TensorFlow 的单独进程占用我尝试将 per process memory fraction 设置为 0 但未成功
上传时的 Google Drive API——这些额外的空行从何而来？

总结一下该程序我从我的 Google 云端硬盘下载一个文件然后在本地计算机中打开并读取一个文件 file a txt 然后在我的计算机中打开另一个文件 file b txt 处于附加模式并且在使用这个新的 file b 更新我的 Go
嵌套字典中的 Django 模板

我正在使用 Django 模板并且遇到了嵌套字典的一个问题 Dict result dict type 0 file name abc count 0 type 1 file name xyz count 50 我的 HTML 文件中的模
如何在 Jupyter Notebook 中运行 Python 异步代码？

我有一些 asyncio 代码在 Python 解释器 CPython 3 6 2 中运行良好我现在想在具有 IPython 内核的 Jupyter 笔记本中运行它我可以运行它 import asyncio asyncio get ev
如何使用 colorchecker 在 opencv 中进行颜色校准？

我有数码相机获取的色彩检查器图像我如何使用它来使用 opencv 校准图像按照以下颜色检查器图像操作您是想问如何进行颜色校准或如何使用 OpenCV 进行校准为了进行颜色校准您可以使用校准板的最后一行灰色调以下是您应该逐步进行
在Python中如何获取字典的部分视图？

是否有可能获得部分视图dict在Python中类似于pandasdf tail df head 说你有很长一段时间dict 而您只想检查某些元素开头结尾等 dict 就像是 dict head 3 To see the first 3
cv2.drawContours() - 取消填充字符内的圆圈（Python，OpenCV）

根据 Silencer的建议我使用了他发布的代码here https stackoverflow com questions 48244328 copy shape to blank canvas opencv python 482465
“一旦获取切片就无法更新查询”。最佳实践？

由于我的项目的性质我发现自己不断地从查询集中取出切片如下所示 Thread objects filter board requested board id order by updatedate 10 但这给我带来了实际对我选择的元素进
更改 x 轴比例

我使用 Matlab 创建了这个图使用 matplotlib x 轴绘制大数字例如 100000 200000 300000 我想要 1 2 3 和 10 5 之类的值来指示它实际上是 100000 200000 300000 有没有一
CNTK 抱怨 LSTM 中的动态轴

我正在尝试在 CNTK 中实现 LSTM 使用 Python 来对序列进行分类 Input 特征是固定长度的数字序列时间序列标签是 one hot 值的向量 Network input input variable input dim
Alembic：如何迁移模型中的自定义类型？

My User模型是 class User UserMixin db Model tablename users noinspection PyShadowingBuiltins uuid Column uuid GUID default
设置 verify_certs=False 但 elasticsearch.Elasticsearch 因证书验证失败而引发 SSL 错误

self host KibanaProxy 自我端口 443 self user 测试 self password 测试我需要禁止证书验证使用选项时它与curl一起使用 k在命令行上但是在使用 Elasticsearch pytho
如何使用 Bokeh 动态隐藏字形和图例项

我正在尝试在散景中实现复选框其中每个复选框应显示隐藏与其关联的行我知道可以通过图例来实现这一点但我希望这种效果同时在两个图中发生此外图例也应该更新在下面的示例中出现了复选框但不执行任何操作我显然不明白如何更新用作源的数据
Python Pandas：如何对组中的所有项目进行分组并为其分配 id？

我有 df domain orgid csyunshu com 108299 dshu com 108299 bbbdshu com 108299 cwakwakmrg com 121303 ckonkatsunet com 121303
迭代列表的奇怪速度差异

我创建了两个重复两个不同值的长列表在第一个列表中值交替出现在第二个列表中一个值出现在另一个值之前 a1 object object 10 6 a2 a1 2 a1 1 2 然后我迭代它们不对它们执行任何操作 for in a1 p
Werkzeug 中的线程和本地代理。用法

首先我想确保我正确理解了功能的分配分配本地代理功能以通过线程内的模块包共享变量对象我对吗其次用法对我来说仍然不清楚也许是因为我误解了作业我用烧瓶如果我有两个或更多模块 A B 我想将对象C从模块A导入到模块B 但我
Flask 应用程序的测试覆盖率不起作用

您好想在终端的 Flask 应用程序中测试删除路由我可以看到测试已经过去它说 test user delete test app LayoutTestCase ok 但是当我打开封面时它仍然是红色的这意味着没有覆盖它请有人向我
Python对象初始化性能

我只是做了一些快速的性能测试我注意到一般情况下初始化列表比显式初始化列表慢大约四到六倍这些可能是错误的术语我不确定这里的行话例如 gt gt gt import timeit gt gt gt print timeit timeit
从列表python的单个列表中删除子列表

我已经经历过从列表列表中删除子列表 https stackoverflow com questions 47209786 removing sublists from a list of lists 但当我为我的数据集扩展它时它不适用于我
通过 Web 界面执行 python 单元测试

是否可以通过 Web 界面执行单元测试如果可以如何执行 EDIT 现在我想要结果对于测试我希望它们是自动化的可能每次我对代码进行更改时抱歉我忘了说得更清楚 EDIT 这个答案此时已经过时了 Use Jenkins https j

随机推荐

在整个解决方案的调试版本中禁用 Postsharp

我有一个包含许多项目的解决方案我想禁用 Postsharp 进行调试构建以减少本地开发人员的构建时间有没有办法在不编辑每个项目文件的情况下做到这一点我知道这听起来可能是一个坏主意但我们仅使用 Postsharp 进行异常日志记录
Spring Boot REST API/Spring Security：身份验证失败时返回自定义消息

我有一个 Spring Boot 应用程序使用 Jersey 作为 JAX RS 实现这是我的安全配置 Configuration EnableGlobalMethodSecurity prePostEnabled true Enabl
有没有可能使用 PHP 获取 Google 网站管理员工具 (GET) 数据？

我正在尝试从中获取一些数据谷歌网站管理员工具 GWT 我搜索了一些 API 文档和实现但它们仅从 GWT 返回了一些数据我的需求我搜索了一些 API 文档和实现我在 PHP 中为此 GWT API 使用了两个文件我是您引用的代码
Dagger 2 - 缺少构造函数注入示例

我花了几个小时进行搜索但仍然没有找到任何关于 Dagger 2 构造函数注入的明确示例假设我有以下声明如何使用 Dagger 2 注入在某处创建 B 类的实例 Module public class ClassA Provides p
从 master 重新启动 Jenkins Slave

我使用 jenkins 主从配置来捕获产品的性能指标我们观察到 jenkins slave 倾向于积累内存从而影响捕获的性能指标为了确保捕获的指标的一致性我们正在考虑每天在从站上没有运行作业时从主站重新启动 jenkins 从站这
允许匿名访问单个 WCF 服务方法

我有一个具有消息安全性和用户名凭据的 WCF 服务我的大多数方法都是从 PrincipalPermission SecurityAction Demand Role ConstStrings Roles Admin 并且这些方法应该仅由经
Crashlytics 报告 TextView.makeSingleLayout 的多个问题

我收到多个关于同一错误的崩溃报告但我不知道是什么原因导致的抛出的异常是ArrayIndexOutOfBoundsException in android widget TextView makeSingleLayout 我知道这与 An
如何在不调用rs.initiate()的情况下初始化mongodb复制集？

我尝试使用 replSet 1 启动 mongod 如下所示 mongod dbpath x y replSet 1 但我不断收到诸如您需要通过调用 rs initiate 来初始化复制集之类的错误然后我启动 mongo shell
委托人（用户或服务帐户）缺少资源的 IAM 权限“cloudtasks.tasks.create”

当我尝试将任务添加到队列时会抛出上述错误消息这是我的设置和有关此问题的信息项目编号 my project 服务帐户 ID my service account 任务队列名称 my queue 任务队列位置 asia northeast
如何在 Docker Alpine 中设置语言环境？

我可以使用 CentOS 映像设置区域设置 FROM centos ENV LANG en US UTF 8 ENV LC ALL en US UTF 8 但它似乎不适用于 Alpine 图像如何使用 Alpine 图像设置区域设置它对
在 ASP.NET MVC 中显示另一个控制器的视图

是否可以显示另一个控制器的视图比如说我有一个CategoriesController and a Category NotFound aspx看法当在CategoriesController 我可以轻松返回View NotFound 现
在 WooCommerce 中显示每个购物车商品的重量

我正在使用 Woocommerce 并尝试在购物车页面上显示每个产品的产品重量我用过这个 add action woocommerce cart collaterals myprefix cart extra info function
通过重写URL访问Couchdb数据库URL，带有查询参数

我的网站用完了 Couch DB 实例因此我将我的虚拟主机配置为指向 dbname design app rewrite 我希望能够从 Web 浏览器访问索引页面同时仍然通过 Ajax 访问 Couch DB API 因此我在我的文件中
单击 UISegmentedControl 的一段后显示多行文本，但最初不是 - 更新代码

我需要在每个段中设置多行文本UISegmentedControl 我尝试了下面的代码它工作正常但问题是当第一次加载页面时第一次显示分段控件时它不显示多行文本但是当我单击其中一段文本以多行显示如何解决这个问题这是代码 voi
实例方法中的静态变量

假设我有这个程序 class Foo public unsigned int bar static unsigned int counter 0 return counter int main Foo a Foo b 当然这个例子没有任何意
python中access数据库表的读写

我有一个访问数据库里面是我创建的几张桌子我想使用 python 读取其中一个表并列出一列中的所有内容我想将该列表与程序中已创建的另一个列表进行比较如果该数字与列表中的数字匹配则在我制作的访问电子表格的同一行新列中输出是同样如
MySQL 查询 - 每组最近的条目

我正在尝试选择表中每组的最新条目假设我有一个表 blog posts 其中有一列 id 全部唯一自动递增 post cat 可以是值 category1 或 category2 或 category3 以及一个 publish stat
如何提高 ASP.NET MVC 中从 SQL Server 数据库获取数据的速度 [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我是 ASP NET MVC5 的新手我有一个模型Shipping and my dbo Shippings sql是这样的 CRE
检查函数是否被调用为装饰器

在下面的最小示例中decorate被调用两次第一次使用 decorate 第二个通过正常函数调用decorate bar def decorate func print func name return func decorate def
在 NetworkX 中合并两个加权图

我使用 python 多重处理来创建多个不同的 NetworkX 图然后使用下面的函数来组合这些图然而虽然这个函数对于小图工作得很好但对于较大的图它会使用大量内存并且会挂在我的系统和内存密集型 AWS 系统上仅使用系统中总内存

在 NetworkX 中合并两个加权图

在 NetworkX 中合并两个加权图 的相关文章

随机推荐

热门标签

在 NetworkX 中合并两个加权图的相关文章