neo4j+python知识图谱构建(基于豆瓣TOP250电影)

2023-11-03

爬取内容网站:https://movie.douban.com/top250?start=0&filter=

第一步:明确节点nodes和关系relations。

针对本文,有4个节点,4个关系。一个节点就相当于一个实体。

【注明:因为一部电影可以属于很多种类型,比如《肖申克的救赎》可以属于犯罪,也可以属于剧情,因此把type(类型)也作为一个节点。】

因此,一共需要生成八个文件,包括四个节点文件和四个关系文件。

文件类型规定:本文使用csv文件。

节点文件(以director.csv为例):第一列为index:ID,最后一列为:LABEL(实体的标签),中间列为实体属性。注意实体属性最好用英文表示。

关系文件(以directed.csv为例):第一列为:START_ID(相当于关系的实施者的index:ID),此处为director的index:ID;第二列为:END_ID(相当于关系的实施对象的index:ID),此处为film的index:ID;第三列为relation(关系),此处为directed;第四列为:TYPE(关系类型),此处为directed。一般来说,关系和关系类型区别不是很大,可以一致。

                      

第二步,将八个csv文件导入neo4j。

节点路径和关系路径可以根据自己需要指定。文件路径的根目录默认为neo4j/bin。

另外,在执行此语句前要确保没有movie.db这个数据库,并且conf文件中注释这句dbms.active_database=movie.db(如果存在的话),不然会报数据库存在的错误。

导入成功后,再在conf文件中添加语句dbms.active_database=movie.db或取消注释。

第三步,打开neo4j数据库,进行查看。(以下为关系acted_in的其中一小部分截图)

第四步,用cypher语句对此数据库进行查询、增加节点或关系等操作。

知识存储-cypher查询语句基础:https://blog.csdn.net/amao1998/article/details/80999423

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

neo4j+python知识图谱构建(基于豆瓣TOP250电影) 的相关文章

随机推荐

  • 英语学习(为什么标题至少5个字?)

    1 痘痘护理 Band Aid 邦迪创可贴 acne kni 粉刺 痤疮 patch 小块 补丁 acne patch 痘痘贴 pimple 青春痘 over the counter medicine 非处方药 dermatologist
  • Win7安装64位CentOS 6.4双系统详细过程

    本文是在两篇文章整合而成 分别是 Mr Johness的 最清晰细致的教程 一步步教你打造Win7 CentOS双系统 和 cjh326419411的 Win7上安装centos6 4 双系统 前者安装centos过程详细 后者考虑了Cen
  • 一文详解RabbitMQ,RocketMQ和Kafka的异同

  • 【华为OD统一考试B卷

    在线OJ 本题通过率100 已购买本专栏用户 请私信博主开通账号 在线刷题 运行出现 Runtime Error 0Aborted 请忽略 华为OD统一考试A卷 B卷 新题库说明 2023年5月份 华为官方已经将的 2022 0223Q 1
  • Android——Intent.addflags的使用

    activity的启动模式 4种 在manifest里面对应的activity中增加android launchMode 属性指定启动模式 和在activity中增加 Intent intent2 new Intent intent2 se
  • react项目axios网络请求封装(包含取消请求不报错)

    搭建项目过程中有一个封装网络请求的步骤 现在已react vite项目详细描述一下 api文件夹 包含path文件夹 请求接口地址 index ts 统一导出接口调用点 server ts api请求通用操作 tool ts 处理serve
  • JMETER分布式压测(精讲教程)

    第一步 关闭防火墙 第二步 在负载机上要安装JMeter 并确保其中一台机器作为主的controller 其它的机器作为agent 注意事项 Jmeter的版本要求一致 Jmeter都能正常的运行 安装JDK1 8并配置JDK环境变量与Jm
  • 网络编程之IO复用机制(多路IO转接)之epoll_create,epoll_ctl,epoll_wait函数06

    1 epoll create函数 epoll create是创建一个epoll句柄 参数size用来告诉内核监听的文件描述符的个数 跟内存大小有关 include
  • 17、java.lang.UnsatisfiedLinkError: No implementation 处理方法

    一 问题现象 在使用第三方生成的 so 库时 遇到下面的bug UnsatisfiedLinkError No implementation found for java lang UnsatisfiedLinkError No imple
  • Python调用,爬虫JS逆向——动态数据,数据加密获取步骤和方法。

    Python调用 爬虫JS逆向 ajax类型数据 JS逆向 加密数据 加密数据是无法通过在后台找到接口进行请求来获取数据 目标网站 https www qimingpian com finosda project pinvestment 1
  • recycleView GridLayoutManager 列 左右贴边,中间居中

    适配 recycleView GridLayoutManager 列 左右贴边 中间居中 mGridView setLayoutManager new GridLayoutManager getActivity 4 int screenWi
  • C语言中fork和vfork创建进程的区别

    fork 和vfork 是在操作系统中用于创建新进程的两个系统调用 它们有以下区别 创建新进程的方式 fork 会创建一个新的子进程 该子进程与父进程几乎完全相同 包括程序代码 数据和进程上下文等 而vfork 则创建一个新的子进程 但与父
  • ElasticSearch基本概念

    1 重要特性 分布式的实时文件存储 每个字段都被索引并可被搜索 实时分析的分布式搜索引擎 可以扩展到上百台服务器 处理PB级结构化或者非结构化数据 2 基本概念 索引 indices Database 数据库 类型 type Table 文
  • 华为HCIA(三)

    链路本地地址接口标识64bit 当STP端口到了Forwarding状态后 会转发流量 也处理报文 在TCP IP模型中 会话层 表示层和应用层 都规划成了应用层 路由表包含目的地址和掩码 优先级 cost 下一跳和出接口 Destinat
  • Python初学者必看学习路线图!!!

    python应该是近几年比较火的语言之一 很多人刚学python不知道该如何学习 尤其是没有编程基础想要从事程序员工作的小白 想必应该都会有此疑惑 包括我刚学python的时候也是通过从网上查找相关资料以及从学校课程学习才确定python学
  • IPD流程中,TR2评审的内容、评审要素和评审标准

    在IPD流程中 TR2评审是项目开发过程中的一个重要里程碑评审 旨在评估项目的技术进展和实施情况 以下是TR2评审的详细内容 评审标准和评审要素的说明 评审内容 1 项目概述 项目背景 介绍项目的起源 目的和重要性 项目目标 阐明项目的具体
  • centos服务器Mongodb下载及相关操作

    要在 CentOS 上安装 MongoDB 请按照以下步骤操作 1 打开终端或 SSH 连接到 CentOS 服务器 2 添加 MongoDB 的 YUM 源 运行以下命令以创建一个名为 mongodb org repo 的新文件 sudo
  • 会些java知识,然后要学习spring boot大概需要多长时间?

    Spring boot要学什么 要学到什么程度 以及相关的学习方法是什么 学习spring boot大概需要多长时间 每个人的学习能力 每天能花费时间来学习的时间也是不确定的 这些很难量化 但极好形容 需要学到能帮你找到一份工作的程度 任何
  • QT谷歌输入法纯widget方式没有qml

    谷歌拼音输入法移植至QT 样式 移植方法 第一种直接带入源码编译 第二种链接方式 修改相关参数 修改输入法界面尺寸大小 使用方式 初始化部分 调用键盘 互动 THE END 最近看了输入法部分的实现方式 也看了不少文章 qml实现 不太了解
  • neo4j+python知识图谱构建(基于豆瓣TOP250电影)

    爬取内容网站 https movie douban com top250 start 0 filter 第一步 明确节点nodes和关系relations 针对本文 有4个节点 4个关系 一个节点就相当于一个实体 注明 因为一部电影可以属于