Neo4j-import导入CSV的数据

2023-05-16

本文共1215个字，预计阅读时间需要4分钟。
在这里插入图片描述
最近有个上亿个关系/节点的数据需要导入到Neo4j，有以下几个工具可以导入：

Cypher CREATE 语句，为每一条数据写一个CREATE
Cypher LOAD CSV 语句，将数据转成CSV格式，通过LOAD CSV读取数据。
官方提供的Java API —— Batch Inserter
Batch Import 工具
neo4j-import 工具（Neo4j自带）

于是乎，毫不犹豫选择了最后一种。

Neo4j-import可用的参数命令：

在这里插入图片描述

遇到的坑

这个工具一般来说是放在Neo4j安装目录的bin文件夹下，也有可能在C盘用户的隐藏文件夹.Neo4jDesktop中的数据库文件下（比较隐蔽）
在CSV文件中需要提前编写好header，例如：
一般形式为名称:类型，用逗号分开，名称和类型必须要有一个，ID也是一个类型，它的名称可以忽略。包含的类型有：int、long、float、double、boolean、byte、short、char、string、point、date、localtime、time、localdatetime、datetime和duration中的一个来指定属性的数据类型。如果没有提供数据类型，则默认为string。若要定义数组类型，请将[]附加到该类型。

在这里插入图片描述

如果有多张实体表，他们可能有不同的ID，因此必须要在CSV文件中的头中增加名称空间，否则导入会报错。ID空间使用语法ID(<ID空间标识符>)在节点文件的ID字段中定义。要在关系文件中引用ID空间的ID，我们使用语法START_ID(<ID空间标识符>)和END_ID(<ID空间标识符>)。
例如我有两张表需要导入，需要在ID后面指定实体的名称空间。

movieId:ID(Movie-ID),title,year:int,:LABEL
personId:ID(Actor-ID),name,:LABEL

4.如果出现下面的问题：
Neo4j批量导入“neo4j-admin导入”OutOfMemoryError：Java堆空间和OutOfMemoryError：超出GC开销限制（Neo4j bulk import “neo4j-admin import” OutOfMemoryError: Java heap space and OutOfMemoryError: GC overhead limit exceeded）
说明分配的内存不够了，需要修改neo4j.conf的配置，这个文件可以从neo4j-import的上级文件夹中的某个子文件夹找到。
需要修改两个值

dbms.memory.heap.initial_size=4096m
dbms.memory.heap.max_size=16384m

最后我的电脑卡在了出现的第四个问题上，没办法电脑内存不够，于是我选择了使用CYPHER的LOAD语句导入CSV，可以采用USING periodic commit 10000这样的语法提高导入效率。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Neo4j-import导入CSV的数据的相关文章

sqlite通过命令行导入csv时出错

sqlite3 test sql SQLite version 3 6 12 Enter help for instructions Enter SQL statements terminated with a sqlite gt crea
Neo4j - 计算带有标签的节点

我想要一个查询来计算数据集中有多少个节点具有每个标签例如标签A 100 标签B 200 我可以为每个单独的标签执行此操作例如 MATCH n LabelA return count n 但是我想在一个命令中为每个标签执行此操作尝试
导入时记录器命名与日志记录配置之间不兼容

我正在通过读取文件并使用来在 main py 中设置 Python 日志记录文件配置 http docs python org library logging config html选项我希望能够在测试和实时日志记录配置之间切换因此我想
使用 scala 检索与给定节点相关的 neo4j 节点

我有 2 个名为 User node 和 Article node 的节点它们通过关系相关联文章节点 gt Written By gt 用户节点如何获取给定用户节点写入的所有文章节点我假设您正在使用嵌入式 neo4j 因此有一个类型
读取列标题中具有多个分隔符的文件并在末尾跳过一些行

我是新来的Python我想用pandas用于读取数据我已经做了一些搜索和努力来解决我的问题但我仍然在挣扎提前感谢您的帮助我有一个如下所示的 txt 文件 skip1 A1 A2 A3 A4 A5 A6 A7 A8 A9 1 2 3
AttributeError：“Int64Index”对象没有属性“month”

我有一些时间序列数据包含三个独立的列日期时间千瓦如下所示 Date Time kW 3 1 2011 12 15 00 AM 171 36 3 1 2011 12 30 00 AM 181 44 3 1 2011 12 45 00
在 Neo4j 中可视化连接的组件

我可以使用下面的代码找到图中最密集连接的组件 CALL algo unionFind stream pnHours YIELD nodeId setId groupBy setId storing all node ids of the s
将 .xls/.csv 文件中的数据读取到 iOS 中

我是 iOS 新手正在尝试将电子表格的内容读入 iOS 数组我使用的电子表格是一个简单的 3 x 2 数组第一列为数字第二列为文本我尝试在 xls xlsx cdv txt unicode 和分隔符但没有成功该文件称为资金
如何在 MS Access 中填充字段描述

当通过 ODBC 尤其是 AS 400 链接到外部数据源时我经常会在另一端遇到神秘的字段名称而数据字典不可用在极少数情况下我能够从其他数据库获取字段描述我希望能够一次导入它们而不是一次将每个描述复制粘贴到表设计表单中我无法在
重新格式化 csv 文件

我有这个 csv 文件其中只有两个条目这里是 Meat One Abattoirs Exporters Food Delivery Butchers Retail Meat Dealers Retail Meat Freezer Mea
CSV 字段中引号前的空格

从 CSV 规范 RFC 4180 https www rfc editor org rfc rfc4180 Spaces are considered part of a field and should not be ignored 显
通过php在csv单元格中创建回车符

我正在尝试动态生成一个 csv 文件其中包含一些包含多行的单元格例如地址字段需要分组为单个地址单元格而不是地址城市州等一切进展顺利但在过去的两天里我尝试在代码中插入 r r n n chr 10 chr 13 以及回车
导入后属性未添加到模块中

我做了以下实验室 vagrant ubuntu xenial test tree pack1 init py mod1 py pack2 init py mod2 py mod3 py test py 2 directories 6 fil
让 csv.Sniffer 使用带引号的值

我正在尝试使用python 的 CSV 嗅探工具 https docs python org 3 library csv html csv Sniffer正如许多 StackOverflow 答案中所建议的那样猜测给定的 CSV 文件是否
如何解决：使用 .csv Dictreader 导入文件的 Python 因未定义字符而失败

首先我发现下列 https stackoverflow com questions 38019379 python unicodedecodeerror utf8 codec cant decode byte 0x91这与我的问题基本相同
Neo4j：插入 7k 节点很慢（Spring Data Neo4j / SpringRestGraphDatabase）

我正在构建一个应用程序我的用户可以在其中管理字典其中一项功能是上传文件以初始化或更新词典的内容我首先关注的结构部分是Dictionary CONTAINS gt Word 从一个空数据库 Neo4j 1 9 4 但也尝试过 2 0 0
CSV 损坏，如何修复？

我正在尝试解析 CSV 我想将它放入数据库或只是用 JavaScript 解析它但由于语法损坏任何一种方法都会失败我的整个 CSV 文件在这里 https gist github com 1023560 https gist gith
读取 CSV 文件单列的更快方法

我正在尝试阅读一个列CSV文件至R尽快我希望将标准方法将列放入 RAM 所需的时间减少 10 倍我的动机是什么我有两个文件一个叫Main csv这是 300000 行和 500 列其中一个称为Second csv即 300000
如何导入名称与我的包中的模块冲突的模块？

我的目录中有几个 python 模块在同一目录下我有一个包tests 我很想将模块命名为tests与它们包含测试的模块相同尽管这当然并不重要 So in tests foo我天真地写着import foo 这不太好用它是导入的tes
如何在python中查找csv文档中的特定行

我想要做的是读入 csv 文档并找到 SN 列 gt 20 中的所有值然后创建一个仅包含 SN gt 20 行的新文件我知道我需要做阅读原始文件打开一个新文件迭代原始文件的行我能够做的是找到 SN gt 20 的行 import

随机推荐

迭代器模式C++实现

简介提供一种方法顺序访问一个聚合对象中各个元素 xff0c 而又不暴露该对象的内部表示动机一个聚合对象 xff0c 如列表 xff08 List xff09 应提供一种方法来让别人可以访问它的元素 xff0c 而又不需要暴露它的内部结
macOS Catalina常见问题汇总

本文共535个字 xff0c 预计阅读时间需要2分钟作为一个伪程序员 xff0c 我来说说macOS Catalina的一些软件兼容性和注意点 macOS Catalina 正式版无法使用的APP 有道词典闪退 brew版本过低的加载错误
Failed to import pydot. You must install pydot and graphviz for `pydotprint` to work.

Graphviz的可执行文件 http www graphviz org Download windows PHP 参考 xff1a http blog csdn net u014749291 article details 5489108
计算机保研-中科院计算所霸面（笔试面试）

基本情况 xff1a 学校 xff1a 末流211 排名 xff1a 1 70 绩点 xff1a 4 33 5 0 竞赛 xff1a 无ACM xff0c 有某水赛国奖 xff08 中国人工智能学会主办 xff09 科研 xff1a 一篇水
计算机保研-中科大计算机

Abstract 2019年中科大计算机夏令营比往年增加了不少难度 xff0c 统一增加了机试环节 xff0c 面试难度提高 xff08 陈恩红实验室和李向阳实验室向来包含机试 xff09 xff0c 最终录取率在60 左右 xff08 往
NSGA-II资料合集

关于NSGA II的一些资料 NSGA II中文翻译 MATLAB代码 NSGA II的解释简介关于演化计算生物系统中 xff0c 进化被认为是一种成功的自适应方法 xff0c 具有很好的健壮性基本思想 xff1a 达尔文进化论是一
简单区块链Python实现

什么是区块链区块链是一种数据结构 xff0c 也是一个分布式数据库从技术上来看 xff1a 区块是一种记录交易的数据结构 xff0c 反映了一笔交易的资金流向系统中已经达成的交易的区块连接在一起形成了一条主链 xff0c 所有参与计算
复旦大学计算机保研夏令营

Abstract 复旦的夏令营 xff1a 自由而无用 xff0c 一期招了200人入营 xff0c 不提供住宿 xff08 导致我租了个旅馆每天要骑单车来学校 xff0c 不过沿途环境不错 xff0c 有很多吃的地方 xff09 xff0
计算机保研夏令营预推免

夏令营与预推免个人情况学校 xff1a 末流211 xff08 安徽大学 xff09 排名 xff1a 1 70绩点 xff1a 4 33 5 0竞赛 xff1a 无ACM xff0c 有某水赛国奖 xff08 中国人工智能学会主办 xf
知识图谱嵌入的应用场景

In KG应用 xff08 在 KG 范围内的应用 xff09 链接预测 xff08 Link prediction xff09 链接预测任务有时也称为实体预测或实体排序 xff0c 用来预测两个实体之间是否有特定的关系即已知头实体h和关
Neo4j数据导入与可视化

本文共1262个字 xff0c 预计阅读时间需要5分钟简介 Neo4j是一个高性能的NoSQL图形数据库 xff0c 它将结构化数据存储在网络上而不是表中它是一个嵌入式的基于磁盘的具备完全的事务特性的Java持久化引擎 xff0c
用户身份链接方法——DeepLink

论文 xff1a DeepLink A Deep Learning Approach for User Identity Linkage UIL xff08 User Identity Linkage xff09 xff1a 用户身份链接
可视化图布局算法简介

Fruchterman Reingold FR FR算法将所有的结点看做是电子 xff0c 每个结点收到两个力的作用 xff1a 其他结点的库伦力 xff08 斥力 xff09 f a d
Windows无法连接到打印机怎么办？快收藏这些正确做法！

案例 xff1a Windows无法连接到打印机怎么办 xff1f 朋友们朋友们 xff0c 最近为了备考国考 xff0c 我特地买了个打印机回来打印资料 xff0c 但是我的Windows无法连接到打印机 xff0c 这是为什么呢 xff
Python爬虫Scrapy入门

Scrapy组成 Scrapy是Python开发的一个快速高层次的屏幕抓取和web抓取框架 xff0c 用于抓取web站点并从页面中提取结构化的数据引擎 xff08 Scrapy xff09 xff1a 用来处理整个系统的数据流 xff
Mac下终端pip与pip3配置（软链接）

缘起今日Mac上的Python环境绝对是个asshole 系统自带一个Python2 7我官网下载一个3 6homebrew悄悄下了个3 xanaconda自带了一个3 x前天更新了一下Xcode命令行工具 xff0c 竟然给我偷偷下了个
推荐系统摘要

作为一个推荐系统的门外汉 xff0c 或者说是用户 xff0c 我觉得推荐系统有以下几个特性推荐系统的真实目的并不是做到让用户满意 xff0c 而是提高销售能力 xff0c 业务水平和收益一个好的推荐系统并不是推荐用户最喜爱想要的东西
数据分析岗位面试必备

业务逻辑数据分析遵循一定的流程 xff0c 不仅可以保证数据分析每一个阶段的工作内容有章可循 xff0c 而且还可以让分析最终的结果更加准确 xff0c 更加有说服力一般情况下 xff0c 数据分析分为以下几个步骤 xff1a 业务理解
基于LDA的文本主题聚类Python实现

LDA简介 LDA xff08 Latent Dirichlet Allocation xff09 是一种文档主题生成模型 xff0c 也称为一个三层贝叶斯概率模型 xff0c 包含词主题和文档三层结构所谓生成模型 xff0c 就是说
Neo4j-import导入CSV的数据

本文共1215个字 xff0c 预计阅读时间需要4分钟最近有个上亿个关系节点的数据需要导入到Neo4j xff0c 有以下几个工具可以导入 xff1a Cypher CREATE 语句 xff0c 为每一条数据写一个CREATECyph

Neo4j-import导入CSV的数据

Neo4j-import导入CSV的数据 的相关文章

随机推荐

热门标签

Neo4j-import导入CSV的数据的相关文章