将大量节点插入 Neo4J

2023-12-02

我有一个表存储在一个典型的 MySQL 数据库中，并且我使用 java 构建了一个小型解析器工具，用于解析并构建 neo4j 数据库。该数据库将有约 4000 万个节点，每个节点都有一个或多个边（最多可能有 10 个边）。问题来自我必须创建某些节点的方式。有一个用户节点、评论节点和主题标签节点。用户节点和主题标签节点必须是唯一的。我使用以下示例中的代码来确保唯一性：

public Node getOrCreateUserWithUniqueFactory( String username, GraphDatabaseService graphDb )
{
    UniqueFactory<Node> factory = new UniqueFactory.UniqueNodeFactory( graphDb, "users" )
    {
    @Override
    protected void initialize( Node created, Map<String, Object> properties )
    {
        created.setProperty( "name", properties.get( "name" ) );
    }
};

return factory.getOrCreate( "name", username );

}

我考虑过使用批量插入器，但我还没有找到一种方法来检查执行批量插入时节点是否唯一。所以我的问题是插入所有这些节点同时仍然确保它们保留其唯一性的最快方法是什么。任何帮助将一如既往地受到高度赞赏。

万一这里的其他人遇到这个问题，我想记录一下我自己和同事能够弄清楚的内容，以提高速度。首先，关于数据的一两个注释：

用户数量较多，约占节点的30%
还有大量的主题标签，因为人们倾向于散列任何东西
这两者都必须保证唯一

现在这已经不妨碍优化了。首先，您需要确保每次插入节点时插入循环都完成。没有真正的例子供我们查看，所以最初的代码看起来像这样（伪代码）

Transaction begin
While(record.next()){
   parse record
   create unique user
   create unique hashtag
   create comment
   insert into graph
}
Transaction success
Transaction finish

虽然这对于小型数据集来说工作正常并且完成得相对较快，但它的扩展性不佳。因此，我们查看了每个函数的用途并将代码重构为如下所示：

While(record.next()){
   Transaction begin

   parse record
   create unique user
   create unique hashtag
   create comment
   insert into graph

   Transaction success
   Transaction finish
}

这极大地加快了速度，但对我的同事来说还不够。所以他发现Lucene索引可以在节点属性上创建，并且我们可以引用Unique Node工厂中的索引。这给我们带来了另一个显着的速度提升。以至于我们可以在大约 10 秒内插入 1,000,000 个节点，而无需使用批处理加载器。感谢大家的帮助。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

将大量节点插入 Neo4J 的相关文章

将 jar 作为 Linux 服务运行 - init.d 脚本在启动应用程序时卡住

我目前正在致力于在 Linux VM 上实现一个可运行的 jar 作为后台服务我已经使用了找到的例子here https gist github com shirish4you 5089019作为工作的基础并将 start 方法修改为
使用 GWT CellTableBuilder 构建树表

Is it possible to build a tree table like this http www sencha com examples ExamplePlace basictreegrid with the new Cell
Android 2.2 SDK - Droid X 相机活动无法正常完成

我注意到我在 Droid X 上调用的默认相机活动与我的 Droid 和 Nexus One 上的默认相机活动看起来不同在 Droid 和 Nexus One 上选择确定后活动将完成 Droid X 有一个完成按钮它将带您返回
使用cameltestsupport进行Camel单元测试，模板始终为空

我正在用 Camel 做一个简单的单元测试我想做的就是从文件在资源下读取 JSON 内容将其发送到 Java 类进行验证这是我试图测试的路线无论我做什么模板我用来发送正文 json 始终为空这是我的代码 public cl
对话框上的 EditText 不返回任何文本

我太累了找不到错误我没有发现任何错误但我没有从 editText 收到任何文本请看下面的代码活动密码 xml
Java：使用 HttpURLConnection 的 HTTP PUT

如何执行 HTTP PUT 我正在使用的类似乎认为它正在执行 PUT 但端点将其视为我执行了 GET 我做错了什么吗 URL url new URL https HttpURLConnection conn HttpURLConnectio
使用 RecyclerView 适配器在运行时更改布局屏幕

我有两个布局文件如下所示如果列表中存在数据则我显示此布局当列表为空时我会显示此布局现在我想在运行时更改布局当用户从列表中删除最后一项时我想将布局更改为第二张图片中显示的空购物车布局 In getItemCount Recy
Java套接字：在连接被拒绝异常时重试的最佳方法？

现在我正在这样做 while true try SocketAddress sockaddr new InetSocketAddress ivDestIP ivDestPort downloadSock new Socket downloa
无法在 Spring Boot 测试中模拟 persistenceContext

我正在使用带有 Mockito 框架的 spring boot 测试来测试我的应用程序存储库类 EntityManager 之一作为参考我的班级如下所示 Repository Transactional Slf4j public cla
内存一致性 - Java 中的happens-before关系[重复]

这个问题在这里已经有答案了在阅读有关内存一致性错误的 Java 文档时我发现与创建发生之前关系的两个操作相关的点当语句调用时Thread start 每个具有与该语句发生之前的关系也有一个与 new 执行的每个语句之间发生的
在java中实现你自己的阻塞队列

我知道这个问题之前已经被问过并回答过很多次了但我只是无法根据互联网上找到的示例找出窍门例如this http tutorials jenkov com java concurrency blocking queues html or t
Java 8 中函数式接口的使用

这是来自的后续问题Java 8 中的双冒号运算符 https stackoverflow com questions 20001427 double colon operator in java 8其中 Java 允许您使用以下方式引用
RSA OAEP、Golang 加密、Java 解密 -BadPaddingException：解密错误

我正在尝试解密使用 RSA OAEP 在 Golang 中加密的字符串但出现 BadPaddingException 解密错误很难弄清楚我错过了什么这是Golang加密方法 func encryptString rootPEM io
如何将 Jfreechart（饼图）添加到 netbeans 的面板中

我正在使用 netbeans gui 编辑器并且正在尝试添加一个本身位于内部框架中的 Jfreechart 并且这个内部框架我想将其添加到面板中正如您在此图中看到的那样抱歉我无法直接发布图像因为我新手 http www flick
Java - 返回值是否会中断循环？

我正在编写一些基本上遵循以下格式的代码 public static boolean isIncluded E element Node
在 Spring Boot Actuator 健康检查 API 中启用日志记录

我正在使用 Spring boot Actuator APIproject https imobilenumbertracker com 拥有一个健康检查端点并通过以下方式启用它 management endpoints web base
对象锁定私有类成员 - 最佳实践？（爪哇）

I asked 类似的问题 https stackoverflow com questions 10548066 multiple object locks in java前几天但对回复不满意主要是因为我提供的代码存在一些人们关注的问题
解决错误javax.mail.AuthenticationFailedException

我不熟悉java中发送邮件的这个功能我在发送电子邮件重置密码时遇到错误希望你能给我一个解决方案下面是我的代码 public synchronized static boolean sendMailAdvance String emai
如何在Java中正确删除数组[重复]

这个问题在这里已经有答案了我刚接触 Java 4 天从我搜索过的教程来看讲师们花费了大量精力来解释如何分配二维数组例如如下所示 Foo fooArray new Foo 2 3 但我还没有找到任何解释如何删除它们的信息从内存的情
Java &= 运算符应用 & 或 && 吗？

Assuming boolean a false 我想知道是否这样做 a b 相当于 a a b logical AND a is false hence b is not evaluated 或者另一方面这意味着 a a b Bitwi

随机推荐

WPF 中的用户控件位置

我是 WPF 新手我创建了一个新的 UserControl MyUserControl 现在我很惊讶 UserContol 没有位置我如何读取通过代码 myUserControl1 Location在父容器中我解释我有一些点用户
Docusign 代表发送 (SOBO)

如果有人有我欢迎提供有关如何使用 Docusign 的代表发送 SOBO 功能的示例我正在使用带有 XML 的 SOAP API 甚至 Docusign 的 III 级支持也无法提供示例 Thanks 2021 年 4 月更新新的 R
java.rmi.ConnectException：连接拒绝主机：127.0.1.1；

java rmi ConnectException Connection refused to host 127 0 1 1 nested exception is java net ConnectException Connection
如何将 JPA 字段持久化为 clob？

我有一个类不能很好地序列化为关系实体因此我想使用 JPA 作为 CLOB 来持久化它我可以将它序列化为字符串我该如何使用 JPA 来做到这一点示例实体 Entity Table name MY TABLE public class
如何使用 const getter 对 std::set 进行排序

我有一个 std set 容器其元素是以下类的对象 class LaneConnector public const Lane getLaneFrom const return From const Lane getLaneTo cons
上午 12 点和下午 12 点的时间正则表达式

我做了这个正则表达式 00 0 0 9 1 012 0 5 0 9 a p m A P M 但问题是它正在接受 00 00 am 我不想这样如何忽略我希望时间采用这种格式上午 12 12 它不应该在这个上午 00 21 我正在使用此
Spring Boot 触发完全重启，而不是在静态文件发生更改时重新加载

In my Spring Boot项目我有以下结构 src main java resources static css js img webapp WEB INF views 根据文档排除资源里面的资源static 应该触发一个relo
Woocommerce 产品自定义字段：检查输入是否已存在

我安装了这个 WC Fields Factory 插件来向产品添加新字段但我需要检查这个新文本框的值是否已存在于数据库中举个例子比如在注册时您不能使用已在使用的电子邮件我必须像屏幕上一样添加文本字段 Update 2 处理字段验证
在视频中跳转到数组中的时间

沿着以下路线控制 HTML5 视频中的开始位置和播放时长我试图在每个片段播放完毕后自动从一个片段跳转到下一个片段每个分段将具有相同的持续时间并且每个分段的开始时间将位于一个数组中我似乎无法弄清楚如何在 addEventListene
读取访问冲突 0xCDCCDCCD

我不断遇到读取访问冲突这是我的代码 class List public List List const List copy List List operator const List rhs Record headPtr const vo
活动更改的翻转动画

我想在两个活动之间切换就像 iPhone 一样我尝试使用 overridePendingTransition int EnterAnim int exitAnim 方法但没有成功有人实现过这样的动画吗 fesp 当您必须更改 Act
Java 原生数组长度

我在 Java 中有一个二维双精度数组它基本上是一个值表我想知道它有多少行它在其他地方声明并分配如下 double table 然后传递给一个函数 private void doSomething double table 在我的
Java 和 SQL：返回 null 还是抛出异常？

这是另一个有争议的主题但这次我只寻找简单且有记录的答案场景我们假设以下方法我会避免以下情况 sql append SELECT FROM append dogs table sql append WHERE append colNa
将 C++20 模板化 Lambda 传递给函数然后调用它

我试图将模板化 lambda 传递给函数然后使用模板参数调用它以启用该函数针对自定义类型的专门化但是当我尝试调用 lambda 时出现此错误 error invalid operands to binary expression 对
使用“or”的基本 Python If 语句

我正在遵循一个学习 python 的初学者计划我正在努力寻找一种更好的方法来使用具有多种可能性的 if 语句我正在编写一个基于文本的基本游戏用户可以选择三种不同的难度级别简单中等困难我只是想编写接受 1 2 或 3 的代码来告
不允许我将编辑保存到 appsscript.json

我想访问与用户 Google 帐户关联的名称来解决GoogleJsonResponseException API call to people people get failed with error The caller does not
发送 GuzzleHttp\Psr7\Request 时 Guzzle6 错误资源类型无效：数组

我试图使用 GuzzleHttp Psr7 Request 发送代码不知何故我收到错误 Invalid resources type array 以下是我的代码 params name gt myName id gt myId clien
为什么 JavaScript 中的“假”是真的？

我知道在 javascript 中空字符串是假的非空字符串在 javascript 中是真的然而为什么是 false javascript中的真相规范中有什么明确的内容吗这是性能问题还是在某些情况下您需要字符串 false 代表t
Aeson 合并对象编码

我想解析和编写具有一些共同基本属性和一些附加单独属性的 JSON 对象例如假设我们有两种类型的对象User and Email 两种类型共享相同的基本属性foo and bar 但它们具有特定于其类型的附加属性 User foo foo
将大量节点插入 Neo4J

我有一个表存储在一个典型的 MySQL 数据库中并且我使用 java 构建了一个小型解析器工具用于解析并构建 neo4j 数据库该数据库将有约 4000 万个节点每个节点都有一个或多个边最多可能有 10 个边问题来自我必须创建某

将大量节点插入 Neo4J

将大量节点插入 Neo4J 的相关文章

随机推荐

热门标签