neo4j 导入速度减慢

2024-01-23

我正在尝试使用 cypher 将大约 500,000 个节点的中等数据集导入到 neo4j 中。我在配备 SSD 的 3.4 GHz i7 iMac 上本地运行 neo4j-community-2.0.0-M05。

我将密码传输到 neo4j shell，将每 40k 行包装到一个事务中。

我正在使用标签，在开始之前，我为每个标记节点的一个属性创建了索引。

当我昨晚离开时，MATCH CREATE UNIQUE 每个花费了大约 15 毫秒。今天早上他们花了大约 6000 毫秒。

缓慢的查询看起来像这样

MATCH n:Artifact WHERE n.pathId = 'ZZZ' CREATE UNIQUE n-[r:DEPENDS_ON]->(a:Artifact {pathId: 'YYY'}) RETURN a
1 row
5719 ms

pathId 已建立索引。

我知道这是一个里程碑式的构建，可能没有优化性能。但我的导入进度还不到三分之一，而且速度越来越慢。

我应该考虑除 cypher 之外的其他方法来导入此数据吗？

我只想回答我自己的问题，以防其他人发现这个问题。感谢 Peter 建议批量导入项目。我用的是2.0 tree https://github.com/jexp/batch-import/tree/20.

我的工作流程最终是 (1) 将所有数据加载到关系数据库中，(2) 清理重复项，然后 (3) 编写脚本将数据导出到 CSV 文件中。

使用 cypher，我让导入运行了 24 小时，然后才终止它。使用java导入工具，neo4j-community-2.0.0-M06的整个导入花费了11秒。

底线：不必费心尝试编写密码来导入大块数据。如有必要，请花一个小时清理数据，然后导出为 CSV 并使用 java 批量导入工具。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

neo4j

Cypher

neo4j 导入速度减慢的相关文章

Python networkx 和持久性（可能在 neo4j 中）[关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我有一个每秒在内存中创建数千个图形的应用程序我希望找到一种方法来保存这些以供后续查询它们并不是特别
如何从 py2neo 获取自动节点 ID？

我正在使用 py2neo 3 1 2 版本和 Neo4j 3 2 0 我有一个问题在 Neo4J 的 Web 界面上我可以运行以下查询来获取节点 id MATCH n Person RETURN ID n 我想知道 py2neo API
sudoers 是世界可写错误[关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案我更改了 Ubuntu 12 10 上的 ect 文件权限以便我可以编辑 bash bashrc 以便 Neo4j 可以看到 JVM 但现在当我尝试
如何检索 Neo4j 图形数据库中的关系

请耐心等待我对此很陌生我目前正在使用 Net neo4jClient 目前我有一个Share节点和一个Customer节点我正在建立一种关系客户拥有分享他们之间并坚持下去这是我的关系课程 public class CustomerO
Neo4j聚合函数

我正在尝试使用SUM函数并将其结果存储为关系的新属性但它不起作用我使用的查询是 MATCH a Employee r CorporateMessage gt b WHERE a Eid 6001 AND b Eid IN 6002 60
使用 py2neo 将 python 连接到 neo4j 时出错

我使用 py2neo 将以下 python 代码写入 neo4j from py2neo import Graph from py2neo import neo4j Node Relationship sgraph Graph alice
如何删除neo4j中的所有索引？

我想使用 cypher 批量删除所有存在的索引可以吗我正在使用 neo4j 3 4 7 DROP INDEX ON Label attributename 如果我在稍后阶段创建相同的索引它会替换现有索引吗删除所有索引和约束的快速方法
Neo4JClient：如何创建关系？

我看到了一篇具有相同标题的帖子但不幸的是无法通过查看给定的示例找到解决方案我通过以下方式创建了节点 private static void createExampleNetwork GraphClient client try Cyph
Cypher - 匹配两个不同的可能路径并返回两者

我有一个数据集我在这里作为示例表示 http console neo4j org id 3dq78v http console neo4j org id 3dq78v 我想要做的是对于图表中的每个 Z 节点该示例只有一个但我有很多我
使用cypher删除neo4j中的所有节点和关系超出堆空间

我一直在尝试按照 neo4j google 组和其他在线来源的建议运行此查询开始 n 节点匹配 n r 其中 ID n gt 0 删除n r 为了删除测试之间的所有节点和关系当我从控制台执行此操作时我用完了 java 堆空间当我从
Neo4j 的 Cypher 查询语言是开源的吗？

Neo4j的语言Cypher的现状如何我真的很喜欢它但我想避免 Neo4j 锁定是否还有像 Gremlin 中那样的其他 Cypher 界面 Regards Cypher 完全是 OSS 请参阅https github com neo
Neo4j：插入 7k 节点很慢（Spring Data Neo4j / SpringRestGraphDatabase）

我正在构建一个应用程序我的用户可以在其中管理字典其中一项功能是上传文件以初始化或更新词典的内容我首先关注的结构部分是Dictionary CONTAINS gt Word 从一个空数据库 Neo4j 1 9 4 但也尝试过 2 0 0
通过 awselb 使用 ssl 时的 neo4j java 驱动程序问题

I am using neo4j community version 3 1 1 and enterprise edition version 3 0 1 with ssl configured through awselb To conn
在巨大的数据集上创建独特的节点和关系 NEO4J

我的问题与这个非常相似如何通过neo4j中导入的csv文件创建独特的节点和关系 https stackoverflow com questions 25090255 how to create unique nodes and relat
如何在ubuntu中从源代码安装postgresql的AGE扩展？ [关闭]

Closed 这个问题是与编程或软件开发无关 help closed questions 目前不接受答案由于我想尝试一下 Apache Age of postgresql 所以在阅读文档时我迷失了方向有什么简单的解决方案吗这是有关如何
有没有办法从密码结果中删除 _id _type

我使用 apoc convert toTree 过程将查询结果转换为树然后过滤结果以仅获取几个属性但是在生成的有效负载中我得到了两个无法删除的属性 id 和 type 这是我的查询我应该只获取 prefLabel 和 uri MA
Neo4j - 根据关系属性查找两个节点之间的最短路径

我试图弄清楚是否有某种方法可以根据关系总和获得两个节点之间的最短距离给出以下示例 neo4j 图像示例 https i stack imgur com fiJe1 png 上图代码 CREATE some point 1 Point ti
Cypher：从集合中提取唯一值

I have MATCH x rels gt y RETURN extract r in rels r property as collected where collected是路径上所有关系的属性的集合例如 null 4 null 4
如何在 Gremlin 中查找公共顶点数并对结果进行排序？

我的架构有两种类型的节点 node1 学生 id为主键节点2 技能技能名称为主键他们之间的关系是HAS SKILL 我的用例对于给定的学生 Id 我需要获取技能最匹配的相似用户技能计数和常用技能列表我尝试过的查询 g V has
如何结识有相同兴趣的朋友的朋友？

交朋友的朋友很容易我得到了这个看起来效果很好 g v 1 in FRIEND in FRIEND filter it g v 1 但我想做的只是结交有相同兴趣的朋友的朋友下面我希望 Joe 被推荐为 Moe 而不是 Noe 因为他们没

随机推荐

Python 中使用哪种正则表达式风格？

我想知道 Python 使用哪种 RegEx 风格它是 PCRE Perl 兼容的还是 ICU 或其他什么是兼容的enoughw Perl 这意味着大多数 Perl 表达式无需修改即可工作它的目标是与 Perl 兼容但当然也有一些
内联 Bootstrap 表单布局，标签位于输入上方

我想使用 Bootstrap 3 创建具有以下布局的表单我在这里尝试了一个jsfiddle http jsfiddle net quyB6 http jsfiddle net quyB6 我尝试过的标记
如何更改工作表选项卡的颜色

我有一个 python 脚本它从外部资源中提取数据并将数据添加到 Google 表格中在大多数情况下我一切正常除了我想更改选项卡的颜色以表示脚本状态整个过程首先复制工作表中的现有选项卡默认情况下模板选项卡具有黑色突出显示然后
System.out.printLn() 错误？ [关闭]

Closed 这个问题是无法重现或由拼写错误引起 help closed questions 目前不接受答案我对 Java 编程非常陌生而且还不擅长我只是想编译这个小程序这样我以后就可以用它来解决继承和多态性问题我正在使用 JGr
JINI 还活跃吗？

与我交谈过的每个知道它的人都声称这是自切片面包以来最伟大的事情为什么失败了或者如果它没有失败现在谁在使用它查看千兆空间 http www gigaspaces com 这是一个相当成功的 Jini Javaspaces 实现我认
在 Spark 数据框中插入记录

我在 pyspark 中有一个数据框这是它的样子 timestamp price 670098928 50 670098930 53 670098934 55 我想填补时间戳与之前状态之间的空白这样我就可以获得一个完美的集合来计算时间加
设计软电子邮件确认

我有一个使用 Devise 和可确认模块的 Rails 3 应用程序然而阻止新注册用户在确认其电子邮件之前访问该网站会导致保留问题相反我们希望立即授予用户访问权限and仍然向他们发送确认电子邮件然后我们将运行后台任务来锁定在固定
C# Graphics.RotateTransform 适用于本地主机，但不适用于远程服务器

它可以在我的机器上运行我在 ASP NET Web 主机上使用 C 图形方法时遇到问题我将两个地图图钉组合成一个图像我加载一个空的图钉图像并在其顶部写一个数字然后我将其中两个组合起来其中一个旋转 15 度另一个旋转 15 度通
在 Perl 中，散列的键和值是否具有相同的“顺序”？

我知道 Perl 中的哈希值没有排序我担心的是我是否可以依赖索引关系中出现的键和值假设我有这个哈希值 my h a gt 1 b gt 2 c gt 3 d gt 4 If I do keys h 我可能会得到 b a d c 我能保证
KERAS model.summary 中的“None”是什么意思？

输出形状中的 None 100 是什么意思这是无样本数还是隐藏维度 None意味着这个维度是可变的 keras 模型中的第一个维度始终是批量大小您不需要固定的批量大小除非在非常特殊的情况下例如当使用stateful TrueL
设置操作栏项目文本颜色？

我正在尝试使用自定义设置我的操作栏项目的文本颜色style 但没有任何效果我尝试过设置
如何使用 jQuery 和 AJAX 将 PHP 页面加载到 div 中？

我正在尝试编写一个函数来调用getproduct php id xxx当点击时我可以得到innerHTML部分出现但我又如何调用php实际起作用的页面 var id id document getElementById digital
如何将 UIColor 转换为十六进制（网页颜色文本字符串）？

有没有简单的方法可以转换UIColor为十六进制值或者我们是否必须使用以下方法获取 RGB 分量CGColorGetComponents然后从那里解决 e g CGColorGetComponents color CGColor 0 25
Python：BeautifulSoup - 从类的名称中获取属性值

我正在从网页上抓取项目其中有多个 a class iusc style height 160px width 233px a
为什么改变原型不会影响之前创建的对象？

我有以下代码 var A function var a new A var b new A A prototype member1 10 A prototype var c new A console log a member1 conso
滚动条内容步长公式

如下图所示找出content step值正比于thumb height and thumb step content step是通过垂直位置的像素滚动量这里的公式可能是什么拇指高度的计算公式 var arrowHeight 25 va
计算两个日期之间的时间？

有人可以帮我完成这项工作吗我想计算 VB NET 中两个日期之间的时间如下所示 startdate 2011 12 30 enddate 2011 12 31 计算小时分钟秒你可以试试这个 DateTime startTime
使用 cURL 重定向？

我正在尝试使用 cURL 执行重定向我可以很好地加载页面这不是问题但如果我加载 google com 则不会加载图像并且该网站无法工作显然因为它只是打印 HTML 而不是实际执行重定向有没有办法使用 cURL 执行重定向有点类
使用较新版本的 Bouncy Castle 时，接收器无法验证 SMIME

我正在使用 BC 来加密和签署 SMIME 消息以便与 AS2 一起使用我们的代码可以很好地与绝对古老的充气城堡版本配合使用 bcmail 1 4 125 升级到较新的版本会导致消息的接收者不是太古老的 Cyclone 服务器无法验
neo4j 导入速度减慢

我正在尝试使用 cypher 将大约 500 000 个节点的中等数据集导入到 neo4j 中我在配备 SSD 的 3 4 GHz i7 iMac 上本地运行 neo4j community 2 0 0 M05 我将密码传输到 neo4j

neo4j 导入速度减慢

neo4j 导入速度减慢 的相关文章

随机推荐

热门标签

neo4j 导入速度减慢的相关文章