【neo4j】win10上利用neo4j-admin导入csv

2023-11-15

原因

我需要导入CN-DBpedia到Neo4j中,包含900万+的百科实体以及6700万+的三元组关系,普通逐条插入可能速度太慢,所以要使用neo4j-admin命令来进行导入。

CN-DBpedia原始数据直提供了txt格式的三元组数据,需要进行数据预处理,形成node.csv和relation.csv两个文件,代码见GitHub CN-DBpedia-To-Neo4j。关于数据预处理和neo4j-admin的命令解释可以参考这个教程

我本来是用neo4j desktop导入的,会莫名其妙地断开连接,据说desktop版本没有压缩版本好。本文会介绍两种neo4j版本的导入方法,建议选择压缩版。

一、压缩版步骤

1. 解压

解压后会看到这个文件夹,将node.csv和relation.csv放到import文件夹下,用cmd管理员模式进入bin目录

2. 试运行数据库

输入命令neo4j.bat console,应该可以看到启动的反馈。

输入地址http://localhost:7474/,输入默认用户名和密码都是neo4j,更改新密码,可以看到数据库正常启动,目前没有数据。

3. 导入数据

在cmd中CTRL+C关闭数据库,输入命令。关于数据预处理和neo4j-admin的命令解释可以参考这个教程

neo4j-admin import --database=neo4j --nodes="../import/node.csv" --relationships="../import/relation.csv" --multiline-fields=true

最后可以看到导入成功的输出,耗时7分钟。

4. 启动数据库

根据第2步的方法启动即可。可以看到数据已导入。数据量较大的时候,还需要手动创建索引,加快查询速度。

二、Desktop版步骤

1. 在neo4j desktop中建立项目

首先点击Projects旁的New建立项目,再在项目中新建一个数据库。

同时建议再设置里修改data的存储位置,本数据集将占用较大的存储空间。

点击新建数据库的Manage

这是一个空数据库,名称默认为neo4j。

2. 利用neo4j-admin导入csv

在neo4j desktop中打开cmd,进入bin文件夹。

输入以下命令并执行,其中node.csv和relation.csv需要根据真实路径填写,导入数据到这个空数据库neo4j里。关于数据预处理和neo4j-admin的命令解释可以参考这个教程。这里我导入的数据和压缩版导入的数据不一样,所以用时和显示结果也不一样,但过程是类似的。

neo4j-admin import --database=neo4j --nodes="../import/node.csv" --relationships="../import/relation.csv" --multiline-fields=true

然后就开始导入数据了,结果显示花了13分钟。

3. 查看数据

启动数据库,这一步可能需要你安装Java11。

按照给出的地址就可点击localhost以打开browser。做一个简单查询,可以看到数据已导入。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【neo4j】win10上利用neo4j-admin导入csv 的相关文章

随机推荐

  • FDR计算

    FDR计算 FDR的计算很简单 我折腾了一上午主要是因为遇到了以下几个问题 问题 FDR是什么 有什么用 怎么计算 我把几个模型的P值都合并成一个表了 所以每次运算FDR时 我需挑选特定的对象 我有多个模型 所以我想着要如何构建循环 FDR
  • 机器学习-人为设置函数方法和神经网络方法解决智能五子棋问题

    2 智能决策 2 1 博弈树模型算法 2 1 1 全局估算函数 此次项目中评估函数有两种 1 人为设定函数方法 更具人的经验 对一些特定的棋形在棋盘上进行检索 并且计数 最后赋予相应权值求和得到对棋盘的评价值 典型的棋形有 活一 活二 活三
  • 集成学习-理论概述

    1 集成学习概述 集成学习 ensemble learning 本身不是一个单独的机器学习算法 而是通过构建并结合多个机器学习器来完成学习任务 集成学习的特点 集成方法是一种将几种机器学习技术组合成一个预测模型的元算法 以减小方差 bagg
  • IDEA中如何导入module并成功运行

    在写Java项目的时候我们通常需要导入module 需要注意的是导入过程需要以下两大步骤 否则会出现无法运行的情况 以下我以导入 service edu 模块为例 一 将module文件拷贝到工程目录下 直接将需要导入的module文件 s
  • 李宏毅深度学习——优化方法

    记录了关于梯度的历史 SGD SGD with Momentum 防止gradient为0 SGD停止不动了 sgd with momentum 前面的移动会累加到下一步 sgd with momentum 前面的移动会累加到下一步 所以小
  • 【07节】Python3+Selenium4自动化 unittest 测试框架详解

    文章目录 1 unittest 框架介绍 2 创建单元测试步骤 3 unittest 模块介绍 3 1 TestCase 类 3 1 1 TestCase 类常用方法 3 1 2 TestCase 类其他方法 3 2 setUp 与 tea
  • 【cpu or gpu】【tensorflow】怎么查看用的是CPU还是GPU

    方法1 from tensorflow python client import device lib print device lib list local devices 参考博客 可用设备为 name device CPU 0 dev
  • 设计模式之桥接模式

    文章目录 一 手机操作问题 1 传统方案解决手机操作问题 2 传统方案解决手机操作问题分析 二 桥接模式 1 基本介绍 2 原理类图 三 桥接模式解决手机操作的问题 1 类图 2 代码 2 抽象类 抽象类子类 行为类接口 接口实现类 客户端
  • 关于api-ms-win-crt-runtimel1-1-0.dll缺失问题的解决方法

    1 问题描述 在win7系统中安装一个截图软件Snipaste时 出现api ms win crt runtimel1 1 0 dll缺失问题 如下图 2 问题原因 在网上查找资料 发现说是在C window system 或者C wind
  • 八十六.快速排序与归并排序(查找与排序(二))——JAVA

    查找与排序 一 查找与排序 三 查找与排序 四 一 分治法 分治法 将原问题划分成若干个规模较小而结构与原问题一致的子问题 递归地解决这些子问题 然后再合并其结果 就得到原问题的解 容易确定运行时间 是分支算法的优点之一 分治模式在每一层递
  • UE TSubclassOf

    定义 TSubclassOf
  • opencv中Mat矩阵的合并与拼接

    opencv如何将两个矩阵按行或者按列合并 在Matlab中将两个矩阵合并非常方便 按行合并 如A B C 按列合并如A B C 其实opencv有自带函数 vconcat和hconcat函数 用于矩阵的合并与图像的拼接 vconcat B
  • React中获取元素(ref获取方式)

    受控组件 在react中 input标签的部分属性受到react控制 如onChange是基于input 和change 事件进行封装 非受控组件 对于没有经历过封装的一些属性或者方法 可以通过ref去获取这个dom元素 再去获取或触发其自
  • 快速学会linux上的chrony服务

    文章目录 chrony服务 1 安装与配置 2 同步网络时间服务器 3 配置时间服务器 将本机作为服务器 4 chronyc命令 5 强制时区 chrony服务 Chrony 是一个开源自由的网络时间协议 NTP 的客户端和服务器软软件 它
  • 智慧井盖监测管理系统解决方案

    一 方案概述 近年来 随着城市化的不断发展 城市地下管道设施的一步步完善 井盖作为城市基础设施中必不可少的一部分 其重要性也逐渐凸显 然而 在实际应用中 井盖监测和管理并不容易 如井盖地理位置分散 数量庞大 传统的巡检方式成本高 效率低 不
  • java定时器Timer的使用

    在JDK库中Timer类主要负责计划任务的功能 也就是在指定的时间开始执行某一个任务 Timer类的主要作用就是设置计划任务 但是封装任务的类的是TimerTask类 下面展示几个例子 在指定的日期执行一次某一任务 import java
  • C语言常用math函数

    算法笔记 第2章 fabs double x 对double型变量取绝对值 floor double x 和ceil double x 对double型变量进行向下取整和向上取整 pow double r double p 计算 r p r
  • 几种集中式管理框架比较

    最近因为项目管理上的需要 调研集中式管理工具 百度Disconf 携程Apollo 阿里ACM 三者都可以满足集中式配置 并提供监听 实时改变配置 关于3个框架的使用以及搭建请自行参考官方API文档 不再叙述 对比了3个框架的配置 如下 d
  • 精确时钟同步协议ptp/IEEE-1588v2协议-------(1)简介

    本文目录 1 从角色的角度来区分 2 从时钟类型的角度来区分 2 1 在IEEE 1588 2002中定义了普通时钟 OC ordinary clock 和边界时钟 BC boundary clock 这二种类型的时钟 2 2 在IEEE
  • 【neo4j】win10上利用neo4j-admin导入csv

    原因 我需要导入CN DBpedia到Neo4j中 包含900万 的百科实体以及6700万 的三元组关系 普通逐条插入可能速度太慢 所以要使用neo4j admin命令来进行导入 CN DBpedia原始数据直提供了txt格式的三元组数据