计算一组集合之间的相似度

2024-01-19

假设有4组:

s1={1,2,3,4};
s2={2,3,4};
s3={2,3,4,5};
s4={1,3,4,5};

有没有一个标准的度量来表示这组4组的相似程度?

感谢您对Jaccard方法的建议。然而,这似乎是成对的。 如何计算整组集合的相似度?


成对地,你可以计算杰卡德距离 http://en.wikipedia.org/wiki/Jaccard_distance两套。它只是两个集合之间的距离,如果它们是空间中的布尔向量,其中 {1, 2, 3…} 都是单位向量。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

计算一组集合之间的相似度 的相关文章

  • 是否有与 ASP.NET 的 PrimeFaces 等效的东西?

    我多年来一直是 ASP NET 开发人员 但最近我开始使用 JSF 2 0 来使用一些 PrimeFaces 解决方案 我对此没有什么可抱怨的 值得的强调几点让我喜欢PrimeFaces的 许多组件 易于使用 完全基于 jQuery 和 j
  • 使用 OpenCV 检查图像的相似性

    OpenCV 是否支持比较两个图像 返回一些值 可能是百分比 来指示这些图像的相似程度 例如 如果相同的图像被传递两次 则返回 100 如果图像完全不同 则返回 0 我已经在 StackOverflow 上阅读了很多类似的主题 我也做了一些
  • Spark 字数统计指标示例

    我阅读了 指标 部分火花网站 http spark apache org docs 1 3 1 monitoring html 我想在字数统计示例中尝试一下 但我无法使其工作 Spark conf metrics properties En
  • 詹森-香农散度

    我还有一个问题希望有人能帮助我 我使用詹森香农散度来测量两个概率分布之间的相似性 考虑到使用以 2 为底的对数 相似性得分落在 1 和 0 之间 从某种意义上说 相似性得分似乎是正确的 0 表示分布相等 然而 我不确定某个地方实际上是否存在
  • 将石墨指标偏移当前时间范围内的最低值

    我有带有 Graphite 指标的 Grafana 我有一个图表显示EnqueueCountActiveMQ 中的某些特定队列 问题是EnqueueCount显示自创建队列以来的所有值 因此当我将 Grafana 中的时间范围缩小到 今天到
  • Python(NumPy)中相似度矩阵的高效计算

    Let X be a Bxn numpy矩阵 即 import numpy as np B 10 n 2 X np random random B n 现在 我对计算所谓的内核 甚至相似度 矩阵感兴趣K 其形状为BxB 及其 i j th
  • 0 和 1 之间的余弦相似度

    我对计算向量之间的相似度感兴趣 但是这种相似度必须是 0 到 1 之间的数字 关于 tf idf 和余弦相似度有很多问题 所有问题都表明该值位于 0 到 1 之间 维基百科 https en wikipedia org wiki Cosin
  • 如何在 PHP 中找到拼写错误的相似单词?

    我将解释我的问题 我有一个名为country 它有两列 ID and name 当我想要寻找的时候 paris 但拼写错误 pares e 代替 i 我不会从数据库得到任何结果 我希望系统建议可以帮助搜索的相似单词 因此 我正在寻求帮助编写
  • 在 Eclipse 启动时禁用插件

    我刚刚为 Eclipse 安装了一个插件 但结果 Eclipse 将不再启动 它说 有一个错误 或一些此类无信息的消息 如何在不加载插件的情况下启动 Eclipse 以便我可以实际卸载有问题的软件 正如另一个人提到的 您可以尝试 clean
  • 带有 pod 标签的 Prometheus kubelet 指标 [关闭]

    Closed 这个问题是与编程或软件开发无关 help closed questions 目前不接受答案 我想弄清楚如何使用 prometheus stack 将 pod 标签从 kubelet 指标获取到指标标签 在我们的环境中 我们需要
  • 查找具有相似文本的文章的算法

    我在数据库中有很多文章 带有标题 文本 我正在寻找一种算法来找到 X 个最相似的文章 例如当你提出问题时 Stack Overflow 的 相关问题 我尝试用谷歌搜索这个问题 但只找到了有关其他 相似文本 问题的页面 例如将每篇文章与所有其
  • 在 Django 模型中使用 Trigram (gin_trgm_ops) 创建 Gin 索引

    django contrib postgres 的新 TrigramSimilarity 功能非常适合解决我遇到的问题 我用它作为搜索栏来查找难以拼写的拉丁名字 问题是名字超过 200 万个 搜索时间比我想要的要长 我想在三元组上创建一个索
  • 相似图像 - 如何比较它们

    我有超过 130 万张图像需要相互比较 并且每天都会添加数百张图像 我的公司拍摄图像并创建一个可供我们的供应商使用的版本 这些文件通常彼此非常相似 例如 两个不同的公司可以向我们发送两个不同的图像 一个 JPG 和一个 GIF 两者都带有麦
  • 如何从声纳中排除简单的 getter 和 setter?

    有的是way http skitch img s3 amazonaws com 20100903 ekunteuietuq9j394prku9d37t jpg从声纳报告中排除 getter 和 setter 假设我有 2 个 吸气剂 pub
  • 计算 Javascript 的循环复杂度 [关闭]

    Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案 是否有任何工具可用于计算 Javascript 中的圈复杂度 我过去在处理服务器端代码时发现它是一个非常有用的指标 并且希望能够将它用于我
  • 无法在 Spring Boot 2(版本 2.0.0.M7)中包含 Prometheus 指标

    无法在 Spring Boot 2 版本 2 0 0 M7 项目中包含 Prometheus 指标 根据千分尺文档 https micrometer io docs ref spring 2 0 prometheus added sprin
  • 显式语义分析

    我遇到了这个术语 显式语义分析 它使用维基百科作为参考 找到文档中的相似性并将它们分类 如果我错了 请纠正我 我遇到的链接是here http www cs technion ac il gabr resources code esa es
  • 如何在 Tensorflow 中计算 Spearman 相关性

    Problem 我需要计算 Pearson 和 Spearman 相关性 并将其用作张量流中的指标 对于皮尔逊来说 这是微不足道的 tf contrib metrics streaming pearson correlation y pre
  • 在 MySQL 中插入时检查并防止相似字符串

    简要信息 我有3张桌子 Set id name SetItem set id item id position TempSet id 我有一个函数可以生成新的随机组合Item桌子 基本上 总是在成功生成之后 我在中创建一个新行Set表 获取
  • 测量两个字符串之间相似性的有效方法是什么? (编辑距离使堆栈太深)

    所以 我从这个开始 http en wikibooks org wiki Algorithm Implementation Strings Levenshtein distance Ruby http en wikibooks org wi

随机推荐

  • C++ 中的不透明值是什么?

    C 中的 不透明值 是什么 不透明 在英语中的定义是 不能被看穿 不透明 在计算机科学中 这意味着除了值本身的类型之外不显示任何细节的值 人们经常使用C型FILE作为经典的例子 但通常这是not不透明 细节显示在stdio h任何人都可以看
  • 如何使用 CIColorControls 通过 UISlider 和 Swift 更改亮度、对比度和饱和度

    我正在开发一个照片滤镜应用程序 正如你所看到的 我添加了一个功能来调整对比度 亮度 饱和度和噪音 但问题是它们是独立工作的 这意味着当我开始编辑对比度时调整亮度时 它会返回到原始亮度 这是当我将亮度设置为最大 图像变白 然后尝试调整其对比度
  • 使用 Jquery,将表中的一行替换为新行

    假设我有一张桌子 table tr class old row td 1 td td 2 td td class edit Edit td tr tr class old row td 1 td td 2 td td class edit
  • 在多个音乐文件上运行命令行

    我正在使用一个名为 metaflac 的 CLI 程序 http flac sourceforge net documentation tools metaflac html http flac sourceforge net docume
  • 适用于 Android 的 Google 地图我的位置自定义按钮

    如何更改谷歌地图我的位置默认按钮 我设置了位置启用并在地图上绘制标准图像来查找位置 是否可以更改默认图像 请参阅下面的自定义按钮 xml 文件
  • dart 中的逆映射

    假设我在 dart 中有以下地图 Map f 0 0 1 1 2 0 3 1 4 0 5 1 dart中有没有什么东西可以让你轻松使用地图的逆图f 例如 逆映射f 0 用数学符号表示 应该等于集合0 2 4在这种情况下 如果值是唯一的 那么
  • 如何在ios7中以编程方式将地图颜色从白天更改为晚上

    我正在开发一个适用于 iOS 7 的应用程序 并尝试将地图从白天更改为夜间模式 将夜间模式更改为白天模式 我在 iOS 7 文档中没有找到任何相关的 API 来执行此操作 这不是内置功能MKMapKit所以你所要求的如果不自己做是不可能的
  • Jupyter Notebook 不允许我在多行中输入 MySQL 查询

    如上所述 我无法在 Jupyter 中多行输入查询 这很烦人 因为编写和读取我自己的查询比较困难 有没有办法切换多行和单行输入 我已经用谷歌搜索了好几次 但文档似乎没有多大帮助 PS 找到了输入 sql 而不是 sql 的愚蠢解决方案 使用
  • 如何在 GLSL / WebGL 中将 1 个 32 位整数打包为 4 个 8 位整数?

    我正在寻求并行化一些复杂的数学 而 WebGL 看起来是实现这一目标的完美方法 问题是 您只能从纹理中读取 8 位整数 理想情况下 我希望从纹理中获取 32 位数字 我的想法是使用 4 个颜色通道来获得每像素 32 位 而不是 4 乘以 8
  • 为什么 DateDiff 返回日期而不是分钟数?

    我需要找出两个字符串之间存在多少分钟 h1 TimeValue 06 00 00 h2 TimeValue 22 00 00 res DateDiff n h1 h2 然而 res 17 08 1902 而预期结果是 960 Sub cal
  • 让 AdView 实际显示

    我的 google adview 有问题 它没有显示 我挖了一段时间 发现人们对填充有问题 所以我去掉了填充 但仍然没有运气 这是我的相关清单数据
  • 如何将div内的img向右对齐?

    我想知道如何将div内的图像对齐到右侧 可以给周边div a text align right 这将在图像左侧留下空白区域 图像将占据整行 如果您希望内容显示在图像的左侧 请使用 float right 在图像上 然而 周边div然后将需要
  • Viewbag.Title 错误:找不到编译动态表达式所需的一种或多种类型。您是否缺少参考资料?

    我有一个 ASP NET MVC 5 Web 应用程序 在每个 cshtml 视图文件中 我收到以下错误Viewbag 找不到编译动态表达式所需的一种或多种类型 您是否缺少参考资料 我引用了 Microsoft CSharp dll 和 S
  • 如何使用 PyQt5 在 qml 中设置值?

    我想从 PyQt5 将值写入 qml 该值动态变化 例如 矩形文本值是从 Pyqt5 归档的 Rectangle width 75 height 75 text values from PyQt5 如果你想从 python 修改 QML 属
  • jQuery 醉酒插件。对焦触发不起作用

    我一直在通过 jQuery 工具提示插件进行过滤 并发现有点醉意 它由 GitHub 使用 这是我大部分决定的基础 我真的很喜欢它 而且它真的很容易使用 但我有一个问题 我需要工具提示在焦点上淡入 而不是悬停 目前它可以工作 但只能在悬停时
  • primefaces selectonemenu 更改事件不适用于空值

    我有一个包含一些项目的选择菜单 还有一个空项目用于显示 请选择一个 我的目标是当我选择其中之一时查询一些数据 如果我选择 请选择一个 则做另一件事 但最终 更改事件会针对正常值被触发 但如果我选择 请选择一个 项目 则不会触发它 感谢您的帮
  • HTML 中的上标文本

    是否可以在值字段中使用上标文本
  • SVN Changelist 与 Git 等效吗?

    只是好奇 Git 是否有类似 Subversions Changelist 功能 我发现它在运行中使用非常方便 我知道我可以运行类似的东西 cat changelistfileimade xargs git update 但我很好奇是否也有
  • android 内存不足:没有更多的后台进程?需要帮忙

    我面临内存不足的问题 Low memory no more background process这是场景 我正在使用一个从字符串数组获取数据的列表 它有一个自定义背景 单击项目 列表会获取另一个字符串数组以显示为第二级或第三级 数据库中写入
  • 计算一组集合之间的相似度

    假设有4组 s1 1 2 3 4 s2 2 3 4 s3 2 3 4 5 s4 1 3 4 5 有没有一个标准的度量来表示这组4组的相似程度 感谢您对Jaccard方法的建议 然而 这似乎是成对的 如何计算整组集合的相似度 成对地 你可以计