什么是以“t”开头的值以及如何在计数时忽略它们

2023-12-30

我正在尝试查询某些属性的频率Wikidata https://query.wikidata.org,使用 SPARQL。

例如,为了找出性别不同值的频率是多少,我有以下查询:

SELECT ?rid (COUNT(?rid) AS ?count)
WHERE { ?qid wdt:P21 ?rid.
  BIND(wd:Q5 AS ?human)
  ?qid wdt:P31 ?human.
} GROUP BY ?rid

我得到以下结果:

wd:Q6581097 2752163
wd:Q6581072 562339
wd:Q1052281 223
wd:Q1097630 68
wd:Q2449503 67
wd:Q48270   36
wd:Q44148   8
wd:Q43445   4
t152990852  1
t152990762  1
t152990752  1
t152990635  1
t152775383  1
t152775370  1
t152775368  1
...

对此我有以下问题:

  • 那些做什么t152...价值观是指?
  • 我怎样才能忽略包含的元组t152...?
    我试过FILTER ( !strstarts(str(?rid), "wd:") )但它超时了。
  • 我怎样才能算distinct答案数量?
    我试过SELECT (COUNT(DISTINCT ?rid) AS ?count)使用上面的查询,但再次超时。

值开头为t被“斯科莱化”未知值 https://www.wikidata.org/wiki/Help:Statements#Unknown_or_no_values(参见,例如,Q2423351 https://www.wikidata.org/wiki/Q2423351对于性别未知的人)。

为了提高性能,我建议您将查询分为三个部分:

  1. 所有“正常”性别:

    SELECT ?rid (COUNT(?qid) AS ?count) 
    WHERE {
       ?qid wdt:P31 wd:Q5.
       ?qid wdt:P21 ?rid.
       ?rid wdt:P31 wd:Q48264 
    } GROUP BY ?rid ORDER BY DESC(?count)
    

    请注意,根据维基数据,WD:Q746411 https://www.wikidata.org/wiki/Q746411 is a subclass https://www.wikidata.org/wiki/Property:P279 of WD:Q48270 https://www.wikidata.org/wiki/Q48270, etc.

  2. 所有“非正常”性别:

    SELECT ?rid (COUNT(?qid) AS ?count) 
    WHERE {
       ?qid wdt:P31 wd:Q5.
       ?qid wdt:P21 ?rid.
       FILTER (?rid NOT IN
               (
                wd:Q6581097,
                wd:Q6581072,
                wd:Q1052281,
                wd:Q2449503,
                wd:Q48270,
                wd:Q746411,
                wd:Q189125,
                wd:Q1399232,
                wd:Q3277905
               )
              ).
       FILTER (isURI(?rid))
    } GROUP BY ?rid ORDER BY DESC(?count)
    

    我不使用FILTER NOT EXISTS {?rid wdt:P31 wd:Q48264 }由于性能原因。

  3. 所有(即1个)“未知”性别:

    SELECT (COUNT(?qid) AS ?count) 
    WHERE {
       ?qid wdt:P31 wd:Q5.
       ?qid wdt:P21 ?rid.
       FILTER (!isURI(?rid))
    } 
    

事实上,在你的情况下并不是很重要——计算不同的wd:Q5 https://www.wikidata.org/wiki/Q5或者将它们视为不不同的——但由于性能原因,后者更可取。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

什么是以“t”开头的值以及如何在计数时忽略它们 的相关文章

随机推荐

  • Asp.Net MVC3:在 ValidationContext 中设置自定义 IServiceProvider,以便验证器可以解析服务

    2012 年 12 月 18 日更新 在 MVC 5 2 上 您可以利用窃取 安德拉斯的回答 https stackoverflow com a 5222249 11635和 MVC 源以及 1 推导DataAnnotationsModel
  • Mandelbrot 程序未输出正确的数据

    我的班级接到一个作业 要编写一个绘制曼德尔布罗图的程序 我们基本上必须让程序绘制结果的位图 事情是 我的CalcMBF函数仅输出2作为曼德尔布罗数 我完全不知道为什么会这样 谁能帮我吗 这是我的代码 using System using S
  • 带有粘性标题和水平、垂直滚动条的垫表

    我有一个垫子表 带有粘性标题和页面的垂直滚动 它工作正常 直到我动态添加更多列并出现水平滚动条 粘性标题停止工作 有什么办法让它发挥作用吗 请看例子 https stackblitz com edit angular hdg9xh http
  • NSDate格式问题

    这是来自 nsdate 格式化程序的代码 由于某种原因 值 dateSelected 不正确 而不是 2011 年 4 月 30 日 7 55PM 它返回 2011 05 01 02 55 知道我是什么吗做错了吗 NSDateFormatt
  • go mod供应商返回“所有匹配的没有包”

    我正在尝试设置一个新的存储库 其中将包含一些后端服务 名为backend 我创建了存储库 将其克隆到 home me go src github com myrepo backend 然后我做了以下事情 go mod init backen
  • 如何在 VS 代码中语法高亮 JavaScript 字符串中的 HTML? [复制]

    这个问题在这里已经有答案了 是否有任何 Vs Code 扩展可以在 JavaScript 字符串中语法突出显示 HTML 具体来说 我正在编写网络组件 const html content gt div table content tabl
  • codeigniter 分页类中使用_page_numbers?

    我在分页类中使用 use page numbers 配置设置为 true 时遇到问题 当我单击第 2 页的链接时 它从数据库检索的行数是正确的 但问题是 第二页的第一行是第一页的第三行 这意味着第 2 页从数据库中的同一行开始 该行已在第一
  • 为什么当工作交错时 TCP 写入延迟会更严重?

    我一直在分析 TCP 延迟 特别是write从用户空间到内核空间的小消息 以便获得对某个消息的延迟的一些直觉write 承认这可能是特定于上下文的 我注意到在我看来相似的测试之间存在很大的不一致 并且我非常想弄清楚差异从何而来 我知道微基准
  • 获取django应用程序的绝对路径

    我正在编写一个单元测试 需要访问我放在 django 应用程序目录下的 fixtures 目录中的图像文件 我想在测试中使用相对路径打开这个图像文件 这需要我获取 django 应用程序的绝对路径 有没有办法获取 django 应用程序的绝
  • 如何解析并输出具有动态值的JSON对象?

    我需要输出 JSON 对象 如下所示 dynamicvaluenumberone 3 dynamicvaluenumbertwo 7 在某些方面 看起来像 dynamicvaluenumberone 3 dynamicvaluenumber
  • 使用 Qt Creator 时的 CMake 配置问题

    我正在尝试使用 cmake 在 qt Creator 中设置构建环境 但无论我尝试什么 我都无法让它取得进展 它因问题而失败 配置问题 当展开一般消息部分中的详细信息时 它看起来像是无法编译测试 C 程序 我看不出我的 qt 创建者配置有什
  • Java:如何获取OS X Lion中的滚动方法?

    由于 OS X 支持 自然滚动 因此我的应用程序无法正常工作 自然滚动是为滚动窗格设计的 我真的很喜欢 但是 当我想放大 缩小时 它会出错 所以 我想做的是检查 OS X 的滚动方法 如果它是 自然的 我将采用与滚动值相反的值MouseWh
  • 如何在Numpy中实现ReLU函数

    我想制作一个使用 ReLU 函数的简单神经网络 有人可以告诉我如何使用 numpy 实现该函数吗 有几种方法 gt gt gt x np random random 3 2 0 5 gt gt gt x array 0 00590765 0
  • 如何在 EditText 中嵌入视图(带有按钮等)?

    我正在尝试找出如何嵌入东西 other与 Drawables 相比 在 EditText 小部件内 具体来说 我想到的例子来自 Google Buzz 小部件 截屏 http greydream org pics buzz png 没有内嵌
  • Google Apps 域上的 Google App Engine

    我无法将我的域名指向由 Google 应用引擎托管的网站 这是背景 注意区分 谷歌应用程序 域名托管 电子邮件等 和 谷歌应用程序引擎 网站框架 的概念 我有一个正在使用 Google Apps for Your Domain 的域 我们将
  • 在 XQuery 中搜索两个图节点之间的路径

    我正在尝试创建一种算法 用于搜索并返回 xQuery 中图形中两个节点之间的路径 但到目前为止我没有运气 因为它只返回一个节点及其相邻节点 首先 我应该明确该图是一个有向图 每个节点可以有零个 一个或多个原点 在 XML 中 节点仅具有到其
  • 如何使用 SSL 在 RHEL 上编译 python3?无法导入 SSL

    我正在尝试在 RHEL 上编译 python 因为我当前的 python 使用的是旧的 1 0 2k ssl 版本 test env brad reason tlscheck python3 version Python 3 9 3 tes
  • 带有 Linq Select 的 Expression> - CS1929 List 不包含“Select”的定义和最佳扩展方法

    我收到以下错误 但无法解决 CS1929 List
  • 将instanceof与类Object一起使用[重复]

    这个问题在这里已经有答案了 使这项工作正常进行的正确语法是什么 public boolean isTypeOf Class type return this instanceof type 我打算这样称呼它 foo isTypeOf MyC
  • 什么是以“t”开头的值以及如何在计数时忽略它们

    我正在尝试查询某些属性的频率Wikidata https query wikidata org 使用 SPARQL 例如 为了找出性别不同值的频率是多少 我有以下查询 SELECT rid COUNT rid AS count WHERE