Freebase 中所有标题/主题标题的文本文件

2024-02-11

我需要一个文本文件来包含 .txt 文件中每个标题/每个主题的标题/每个项目的标题,每个标题都占一行。

如果我已经下载了 freebase rdf 转储,我该如何执行此操作或进行此操作?

如果可能,我还需要一个单独的文本文件,其中每个主题/项目的描述位于一行,每个描述位于其自己的行上。

我怎样才能做到这一点?

如果有人能帮助我从 Freebase rdf 转储中制作这些文件,我将不胜感激。

提前致谢!


根据谓词/属性过滤 RDF 转储ns:type.object.name。如果您只想要一种特定的语言,也可以按该语言进行过滤,例如@en.

编辑:我也错过了关于所需描述的第二部分。这是一个由三部分组成的正则表达式,它将为您提供所有行:

  1. 英文名
  2. 英文说明
  3. /common/topic 的一种类型

将三者结合起来作为读者的练习。

zegrep $'\tns:(((type\\.object\\.name|common\\.topic\\.description)\t.*@en)|type\\.object\\.type\tns:common\\.topic)\\.$' freebase-rdf-2013-06-30-00-00.gz | gzip > freebase-rdf-2013-06-30-00-00-names-descriptions.gz

似乎有一个性能问题,我必须考虑一下。在我的笔记本电脑上对整个文件进行简单的 grep 大约需要 11 分钟,但它已经运行了好几次。不过我稍后还要看看...

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Freebase 中所有标题/主题标题的文本文件 的相关文章

  • 加载配置文件时发生错误:访问路径 c:\Program Files (x86)\... 被拒绝

    我有一个在 Windows 7 上使用 Visual Studio 2010 中的安装程序部署的应用程序 该程序在 Windows 7 和 XP 上部署并运行良好 但当我在 Windows 8 系统上部署它时 出现有关访问配置文件的错误 该
  • 我可以使用 javascript 生成 JSON 文件吗?

    我想在域 example1 com 上创建一个页面 并获取 解析另一个域 example2 com json json 上的 JSON 文件 可以使用 javascript 生成 json 文件 在 example2 com 上 吗 我认为
  • 如何从 JavaScript 中的 URL 中提取主机?

    捕获域直到结束字符 我需要一个捕获的正则表达式example com在所有这些中 example com 3000 example com pass gas example com example com 如果您确实有有效的 URL 那么这
  • CSS word-wrap:break-word不会包装标签,除非你将它包装在div中并在那里添加规则

    为什么CSS统治 a word wrap break word with div a href verylongurlherewithnospaces a div 不换行并导致窗口显示滚动条 而 div word wrap break wo
  • 有没有办法删除 FILE_FLAG_DELETE_ON_CLOSE?

    在我的应用程序中 我想使用 FILE FLAG DELETE ON CLOSE 打开一个临时文件 然而 在某些情况下 临时文件需要保留并且非常大 我想删除打开的句柄上的 FILE FLAG DELETE ON CLOSE 属性 这可能吗 复
  • WPF - 普通 [标签:输入] 控制的最佳实践

    我想知道 这是在 WPF 中获取众所周知的标签输入 或输出 无关紧要 组合的最佳和最快的方法 这是一个简单的任务 只需考虑 对象 ME 的快速输出 名字 克里斯蒂安 年龄 28 心情 好 我知道 我可以使用带有文本块的网格 但说实话 这个
  • 解析未完全加载 VBA 的网站

    尝试进行简单的网络解析 我的问题是页面在向下滚动之前无法完全加载 谷歌搜索已经提出可能使用硒 但由于我不知道如何使用它 我想我会在这里问 我使用的代码 Sub gfquote Dim oHttp As MSXML2 XMLHTTP Dim
  • 使用 OpenNLP 获取句子的解析树。陷入困境。

    OpenNLP 是一个关于自然语言处理的 Apache 项目 NLP 程序的目标之一是解析一个句子 并给出其语法结构的树 例如 天空是蓝色的 这句话 可能会被解析为 S NP VP The sky is blue where S是句子 NP
  • 使用 SPARQL 查询的 UNION 和交集

    我正在将用户定义的查询转换为 SPARQL 例如 当用户说 abc 时 这意味着给我给定类型的所有具有名为 abc 属性的节点 作为其扩展 如果用户说 abc 或 pqr 和 lmn 我需要查找给定类型的某些属性为 abc 或 pqr 和
  • python 中的文件输出给我垃圾

    当我编写以下代码时 我得到的输出是垃圾 这只是一个寻找素数的简单程序 当第一个 for 循环范围仅达到 1000 时 它会起作用 但一旦范围变大 程序将无法输出有意义的数据 output open output dat w for i in
  • 当前平台不支持桌面 API

    我遇到过这个错误 java lang UnsupportedOperationException 当前平台不支持桌面 API 我将从我的 java 应用程序中打开一个文件 我用这个方法 Desktop getDesktop open new
  • ruby CSV重复行解析

    我有一些需要处理的 CSV 数据 但无法找到匹配重复项的方法 数据看起来有点像这样 line id name item 1 item 2 item 3 item 4 1 251 john foo foo foo foo 2 251 john
  • 使用 JSONKit 解析 JSON 文件

    我正在构建一个音叉应用程序 货叉应允许最多 12 个预设节距 此外 我希望允许用户选择一个主题 每个主题都会加载一组预设 不必使用所有预设 我的配置文件看起来像这样 theme A3 comment An octave below conc
  • 按扩展名过滤搜索文件返回太多结果

    我正在开发一个 C 控制台应用程序 它必须管理 Windows 操作系统上的文件 我需要获取具有特定扩展名的文件名 列表 我找到了很多解决方案 最建议的是以下一种 HANDLE hFind WIN32 FIND DATA data hFin
  • 处理大文件的最快方法?

    我有多个 3 GB 制表符分隔文件 每个文件中有 2000 万行 所有行都必须独立处理 任何两行之间没有关系 我的问题是 什么会更快 逐行阅读 with open as infile for line in infile 将文件分块读入内存
  • XAMPP 不解析 PHP

    我刚刚安装了 XAMPP 1 8 1 并重新启动了计算机 开始运行 Apache 和 MySQL 并在 XAMPP 下的 htdocs 目录中的测试文件夹中创建了一个测试文件 当我访问 xampp index php 时 他们的页面显示正常
  • Plotly:如何设置文本格式(下划线、粗体、斜体)

    使用注释时 我尝试在绘图中为文本添加下划线 我使用添加注释 import plotly graph objects as go g go FigureWidget make subplots rows 1 cols 1 g update l
  • 如何只读取文件的第一行

    我已经用谷歌搜索了一段时间 但我找不到只读取文件第一行的函数 我需要读取文本文件的第一行并从中提取日期 Perl 新手 open my file lt filename txt my firstLine lt file gt close f
  • 计算机AI算法写句子?

    我正在寻找有关处理文本句子或在创建在正常人类语言 例如英语 中有效的句子时遵循结构的算法的信息 我想知道这个领域是否有我可以学习或开始使用的项目 例如 如果我给一个程序一个名词 为其提供同义词库 相关单词 和词性 以便它理解每个单词在句子中
  • Django 1.6 的静态文件

    我花了一整天但没有任何作用 我在这里看到了至少 20 篇关于同一主题的帖子 它们各不相同 有不同的建议 但没有一个对我有用 使用 Python 2 7 运行 Django 1 6 我正在尝试从 django 教程加载民意调查应用程序的 cs

随机推荐

  • nasm 汇编linux定时器或睡眠

    我正在尝试找到一种方法让我的代码在继续之前等待两秒钟 我在保护模式下使用Linux的nasm 所以我只能使用int 80h 我找到了一个syscall称为 alarm 27 另一个叫 pause 29 但是 当我尝试使用这些时 程序会等待并
  • Android Fabric - 以自定义间隔发送捕获的异常

    根据 Fabric 文档面料文档 https docs fabric io android crashlytics caught exceptions html为了减少用户流量 仅在应用程序启动时发送捕获的异常 Crashlytics 在专
  • 如何使用 JTidy 从解析的 HTML 中获取错误/警告消息?

    我能够解析 HTML 但我想从解析的 HTML 中提取警告消息并将其显示给用户 这是我的代码 Tidy tidy new Tidy StringBuffer StringBuffer1 new StringBuffer b Hello u
  • java中的抽象和接口[重复]

    这个问题在这里已经有答案了 可能的重复 接口与抽象类 一般面向对象 https stackoverflow com questions 761194 interface vs abstract class general oo 什么时候使用
  • ALT-TAB 应用程序图标像素化

    When a child window of my application is opened and I view the ALT TAB menu the application icon looks pixellated I assu
  • 在 JodaTime 中生成日期范围

    我需要检查数组列表中是否存在日期 字符串 我有两个日期 首先我需要生成这两个日期之间的日期范围并将它们存储在数组中 这就是我正在做的事情 DateTimeFormatter dateFromatter DateTimeFormat forP
  • cabal 无法使用 http 代理

    我的Linux redhat6 服务器必须使用http代理来连接到外界 虽然它适用于 wget 等其他东西 但它不适用于 cabal cabal update v3 显示这样的错误 407 需要代理身份验证阴谋 下载失败http hacka
  • phpMyAdmin 错误 1932 - 引擎中不存在表

    Windows 7 xampp 我有一个有 14 个表的数据库 这几天我和他们所有人一起工作 直到今天早上都没有出现任何问题 除了桌子外 所有桌子都可以posts 当我单击它的名称 phpMyAdmin 中的左侧菜单 时 我收到一条消息 1
  • Dagger:定义可注入类的正确方法,该类在其构造函数中采用上下文

    我想使用 dagger Square 的 dagger v1 创建一个单例类 其构造函数需要上下文作为参数 然后我想将这个单例类注入到我的 MainActivity 中 定义这一点的正确步骤是什么 我尝试这样做 单例类 Module inj
  • 如何检查 Android 上是否启用 USB 连接模式?

    我在 Android 市场上有一个应用程序 用户经常将他们的设备连接到计算机以将音乐添加到应用程序文件夹中 我在说明中特别指出 当启用 USB 连接模式时 Android 应用程序无法与 SD 卡通信 显然这还不够愚蠢的证据 有没有办法在j
  • 站点包位于 Conda 环境中的什么位置?

    在 Conda 环境中安装软件包后 我想对该软件包中的代码进行一些更改 我在哪里可以找到site packages包含已安装软件包的目录 我有一个 Anaconda Python 2 7base分发 但我没有找到目录 Users usern
  • 如何在 VueJS Webpack 项目中使用 Modernizr

    有人有在 VueJs Webpack 项目中捆绑和使用 Modernizr 的简单教程吗 我使用带有单文件组件的 VueJS 默认 Webpack 项目 我想要全部捆绑起来 为了精确起见 我想在大多数表单中使用 inputtypes dat
  • mongodb数据库与Java play 2.0

    有教程如何在 Java play 2 0 中使用 mongodb 数据库吗 在官方网站 playframework org 上似乎只有NoSql示例 在 github 上查看这个演示 https github com czihong pla
  • 绘制抗锯齿圆的算法?

    绘制抗锯齿圆的好算法是什么 已填充和未填充 Bresenham 因直线算法而闻名 也有一个圆形算法 吴晓林对直线算法进行了抗锯齿处理 对圆算法也进行了同样的处理 http en wikipedia org wiki Xiaoolin Wu
  • opencv 库的双链表损坏

    嗨 我写了这个简单的程序 Main cpp std vector
  • 使用 countplot() 进行标准化

    下面的代码显示了一个图表 其中包含我的列表中的值的数量 import seaborn as sns sns countplot 0 1 2 3 1 2 1 3 2 1 2 1 3 plt show 我想要带有百分比的相同图 seaborn
  • PHP 中的静态变量

    我发现了有关 PHP 中静态变量的不同信息 但没有任何信息能够真正解释它是什么以及它是如何工作的 我读过 在类中使用静态属性时 该类实例化的任何对象都不能使用静态属性 而该类实例化的对象可以使用静态方法吗 但是 我一直在尝试研究静态变量在不
  • Alpine 3.18 Docker 镜像在使用 & 运行后台命令后不遵守 `sleep` shell 命令

    我一直在使用一个简单的脚本 其中包含一个 while 循环作为 Docker 容器的入口点 每分钟运行一个命令 可以说是一种简单的定时任务 while 循环如下所示 bin sh while true do php script php s
  • T-SQL 舍入与 C# 舍入

    我正在使用微软SQL Server Express https en wikipedia org wiki SQL Server Express2016年写一篇存储过程 https en wikipedia org wiki Stored
  • Freebase 中所有标题/主题标题的文本文件

    我需要一个文本文件来包含 txt 文件中每个标题 每个主题的标题 每个项目的标题 每个标题都占一行 如果我已经下载了 freebase rdf 转储 我该如何执行此操作或进行此操作 如果可能 我还需要一个单独的文本文件 其中每个主题 项目的