Freebase 中所有标题/主题标题的文本文件

2024-02-11

我需要一个文本文件来包含 .txt 文件中每个标题/每个主题的标题/每个项目的标题,每个标题都占一行。

如果我已经下载了 freebase rdf 转储,我该如何执行此操作或进行此操作?

如果可能,我还需要一个单独的文本文件,其中每个主题/项目的描述位于一行,每个描述位于其自己的行上。

我怎样才能做到这一点?

如果有人能帮助我从 Freebase rdf 转储中制作这些文件,我将不胜感激。

提前致谢!


根据谓词/属性过滤 RDF 转储ns:type.object.name。如果您只想要一种特定的语言,也可以按该语言进行过滤,例如@en.

编辑:我也错过了关于所需描述的第二部分。这是一个由三部分组成的正则表达式,它将为您提供所有行:

  1. 英文名
  2. 英文说明
  3. /common/topic 的一种类型

将三者结合起来作为读者的练习。

zegrep $'\tns:(((type\\.object\\.name|common\\.topic\\.description)\t.*@en)|type\\.object\\.type\tns:common\\.topic)\\.$' freebase-rdf-2013-06-30-00-00.gz | gzip > freebase-rdf-2013-06-30-00-00-names-descriptions.gz

似乎有一个性能问题,我必须考虑一下。在我的笔记本电脑上对整个文件进行简单的 grep 大约需要 11 分钟,但它已经运行了好几次。不过我稍后还要看看...

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Freebase 中所有标题/主题标题的文本文件 的相关文章

随机推荐

  • nasm 汇编linux定时器或睡眠

    我正在尝试找到一种方法让我的代码在继续之前等待两秒钟 我在保护模式下使用Linux的nasm 所以我只能使用int 80h 我找到了一个syscall称为 alarm 27 另一个叫 pause 29 但是 当我尝试使用这些时 程序会等待并
  • Android Fabric - 以自定义间隔发送捕获的异常

    根据 Fabric 文档面料文档 https docs fabric io android crashlytics caught exceptions html为了减少用户流量 仅在应用程序启动时发送捕获的异常 Crashlytics 在专
  • 如何使用 JTidy 从解析的 HTML 中获取错误/警告消息?

    我能够解析 HTML 但我想从解析的 HTML 中提取警告消息并将其显示给用户 这是我的代码 Tidy tidy new Tidy StringBuffer StringBuffer1 new StringBuffer b Hello u
  • java中的抽象和接口[重复]

    这个问题在这里已经有答案了 可能的重复 接口与抽象类 一般面向对象 https stackoverflow com questions 761194 interface vs abstract class general oo 什么时候使用
  • ALT-TAB 应用程序图标像素化

    When a child window of my application is opened and I view the ALT TAB menu the application icon looks pixellated I assu
  • 在 JodaTime 中生成日期范围

    我需要检查数组列表中是否存在日期 字符串 我有两个日期 首先我需要生成这两个日期之间的日期范围并将它们存储在数组中 这就是我正在做的事情 DateTimeFormatter dateFromatter DateTimeFormat forP
  • cabal 无法使用 http 代理

    我的Linux redhat6 服务器必须使用http代理来连接到外界 虽然它适用于 wget 等其他东西 但它不适用于 cabal cabal update v3 显示这样的错误 407 需要代理身份验证阴谋 下载失败http hacka
  • phpMyAdmin 错误 1932 - 引擎中不存在表

    Windows 7 xampp 我有一个有 14 个表的数据库 这几天我和他们所有人一起工作 直到今天早上都没有出现任何问题 除了桌子外 所有桌子都可以posts 当我单击它的名称 phpMyAdmin 中的左侧菜单 时 我收到一条消息 1
  • Dagger:定义可注入类的正确方法,该类在其构造函数中采用上下文

    我想使用 dagger Square 的 dagger v1 创建一个单例类 其构造函数需要上下文作为参数 然后我想将这个单例类注入到我的 MainActivity 中 定义这一点的正确步骤是什么 我尝试这样做 单例类 Module inj
  • 如何检查 Android 上是否启用 USB 连接模式?

    我在 Android 市场上有一个应用程序 用户经常将他们的设备连接到计算机以将音乐添加到应用程序文件夹中 我在说明中特别指出 当启用 USB 连接模式时 Android 应用程序无法与 SD 卡通信 显然这还不够愚蠢的证据 有没有办法在j
  • 站点包位于 Conda 环境中的什么位置?

    在 Conda 环境中安装软件包后 我想对该软件包中的代码进行一些更改 我在哪里可以找到site packages包含已安装软件包的目录 我有一个 Anaconda Python 2 7base分发 但我没有找到目录 Users usern
  • 如何在 VueJS Webpack 项目中使用 Modernizr

    有人有在 VueJs Webpack 项目中捆绑和使用 Modernizr 的简单教程吗 我使用带有单文件组件的 VueJS 默认 Webpack 项目 我想要全部捆绑起来 为了精确起见 我想在大多数表单中使用 inputtypes dat
  • mongodb数据库与Java play 2.0

    有教程如何在 Java play 2 0 中使用 mongodb 数据库吗 在官方网站 playframework org 上似乎只有NoSql示例 在 github 上查看这个演示 https github com czihong pla
  • 绘制抗锯齿圆的算法?

    绘制抗锯齿圆的好算法是什么 已填充和未填充 Bresenham 因直线算法而闻名 也有一个圆形算法 吴晓林对直线算法进行了抗锯齿处理 对圆算法也进行了同样的处理 http en wikipedia org wiki Xiaoolin Wu
  • opencv 库的双链表损坏

    嗨 我写了这个简单的程序 Main cpp std vector
  • 使用 countplot() 进行标准化

    下面的代码显示了一个图表 其中包含我的列表中的值的数量 import seaborn as sns sns countplot 0 1 2 3 1 2 1 3 2 1 2 1 3 plt show 我想要带有百分比的相同图 seaborn
  • PHP 中的静态变量

    我发现了有关 PHP 中静态变量的不同信息 但没有任何信息能够真正解释它是什么以及它是如何工作的 我读过 在类中使用静态属性时 该类实例化的任何对象都不能使用静态属性 而该类实例化的对象可以使用静态方法吗 但是 我一直在尝试研究静态变量在不
  • Alpine 3.18 Docker 镜像在使用 & 运行后台命令后不遵守 `sleep` shell 命令

    我一直在使用一个简单的脚本 其中包含一个 while 循环作为 Docker 容器的入口点 每分钟运行一个命令 可以说是一种简单的定时任务 while 循环如下所示 bin sh while true do php script php s
  • T-SQL 舍入与 C# 舍入

    我正在使用微软SQL Server Express https en wikipedia org wiki SQL Server Express2016年写一篇存储过程 https en wikipedia org wiki Stored
  • Freebase 中所有标题/主题标题的文本文件

    我需要一个文本文件来包含 txt 文件中每个标题 每个主题的标题 每个项目的标题 每个标题都占一行 如果我已经下载了 freebase rdf 转储 我该如何执行此操作或进行此操作 如果可能 我还需要一个单独的文本文件 其中每个主题 项目的