Python 相当于 R 的 cluster 包中的 daisy()

2024-03-20

我有一个数据集，其中包含分类（名义和序数）和数字属性。我想使用这些混合属性来计算我的观察结果的（不）相似度矩阵。使用daisy() http://stat.ethz.ch/R-manual/R-patched/library/cluster/html/daisy.htmlR中的cluster包函数，我可以很容易地得到相异矩阵，如下所示：

if(!require("cluster")) { install.packages("cluster");  require("cluster") }
data(flower)
as.matrix(daisy(flower, metric = "gower"))

这使用高尔度量来处理名义变量。Python 是否有相当于daisy()R 中的函数？

或者也许任何其他模块函数允许使用高尔度量或类似的东西来计算具有混合（名义、数字）属性的数据集的（不）相似度矩阵？

仅实现与 pdist 一起使用的 Gower 函数是不够的。

pdist 在内部进行多次数值转换，如果您使用包含混合数据的矩阵，这些转换将会失败。

我根据原始论文实现了 Gower 函数，以及 pdist 模块中所需的相应调整（我不能简单地覆盖这些函数，因为 pdist 模块中的 defs 是私有的）。

到目前为止我得到的结果与 R 的 daisy 函数相同。

源代码可以在这个jupyter笔记本上找到：https://sourceforge.net/projects/gower-distance-4python/files/ https://sourceforge.net/projects/gower-distance-4python/files/

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Python 相当于 R 的 cluster 包中的 daisy() 的相关文章

Pyqt-如何因另一个组合框数据而更改组合框数据？

我有一个表有 4 列这 4 列中的两列是关于功能的一个是特征另一个是子特征在每一列中所有单元格都有组合框我可以在这些单元格中打开txt 我想当我选择电影院作为功能时我只想看到子功能组合框中的电影名称而不是我的数据中的
“一旦获取切片就无法更新查询”。最佳实践？

由于我的项目的性质我发现自己不断地从查询集中取出切片如下所示 Thread objects filter board requested board id order by updatedate 10 但这给我带来了实际对我选择的元素进
如何在Python中高效地添加稀疏矩阵

我想知道如何在Python中有效地添加稀疏矩阵我有一个程序可以将大任务分解为子任务并将它们分配到多个 CPU 上每个子任务都会产生一个结果一个 scipy 稀疏矩阵格式为 lil matrix 稀疏矩阵尺寸为 100000x50
根据 Pandas 中的列表对多列进行排序

感谢有关如何根据 pandas 中的倍数列表对给定多列进行排序的任何提示如下所示 import pandas as pd sort a a d e sort b s1 s3 s6 sort c t1 t2 t3 df pd DataFra
手动设置scale_fill_distiller()的比例

我正在尝试制作一系列图表进行比较举例来说我想使用iris数据集来制作这样的图其中我已过滤以仅查看 setosa 物种 library ggplot2 library dplyr iris gt filter Species setos
Python Pandas：如何对组中的所有项目进行分组并为其分配 id？

我有 df domain orgid csyunshu com 108299 dshu com 108299 bbbdshu com 108299 cwakwakmrg com 121303 ckonkatsunet com 121303
Python、subprocess、call()、check_call 和 returncode 来查找命令是否存在

我已经弄清楚如何使用 call 让我的 python 脚本运行命令 import subprocess mycommandline lumberjack sleep all night work all day subprocess cal
如何自动启动我的 ec2 实例、运行命令然后将其关闭？

我想每周对 redshift postgres 数据库中的数据运行一次机器学习模型我使用以下命令将 R 脚本设置为休息 apiplumbr然后我将其设置为一项任务来管理pm2 我有它所以任务会在ec2实例启动然后继续运行要让 R 脚本
使用 NLP 进行地址分割

我目前正在开发一个项目该项目应识别地址的每个部分例如来自 str Jack London 121 Corvallis ARAD ap 1603 973130 输出应如下所示 street name Jack London no 121
以编程方式使用 Sphinx 特定指令解析 .rst 文件

我希望能够在 Python 中解析基于 sphinx 的 rst 以便进一步处理和检查就像是 import sphinx p sphinx parse path to file rst do something with p 似乎在 do
从 python 检测 macOS 中的暗模式

我正在编写一个 PyQt 应用程序我必须添加一个补丁以便在启用暗模式的 Macos 上可以读取字体 app QApplication Fix for the font colours on macos when running dark
Python对象初始化性能

我只是做了一些快速的性能测试我注意到一般情况下初始化列表比显式初始化列表慢大约四到六倍这些可能是错误的术语我不确定这里的行话例如 gt gt gt import timeit gt gt gt print timeit timeit
从列表python的单个列表中删除子列表

我已经经历过从列表列表中删除子列表 https stackoverflow com questions 47209786 removing sublists from a list of lists 但当我为我的数据集扩展它时它不适用于我
导入错误：无法导入名称“时间戳”

我使用以下代码在 python 3 6 3 中成功安装了 ggplot conda install c conda forge ggplot 但是当我使用下面的代码将其导入笔记本时出现错误 from ggplot import Impor
Python问题：打开和关闭文件返回语法错误

大家好我发现了这个有用的 python 脚本它允许我从网站获取一些天气数据我将创建一个文件和其中的数据集有些东西不起作用它返回此错误 File
RStudio 如何确定控制台宽度，为什么它似乎总是出错？

我刚刚发现wid lt options width在 RStudio 中它似乎是我日常控制台使用中令人烦恼的根源或者更确切地说更接近根源我应该先说一下我目前使用的是 R 3 2 2 RStudio 0 99 491 Linux M
bs4 `next_sibling` VS `find_next_sibling`

我在使用时遇到困难next sibling 并且类似地与next element 如果用作属性我不会得到任何返回但如果用作find next sibling or find next 然后就可以了来自doc https www cru
如何使用Python保存“完整的网页”而不仅仅是基本的html

我正在使用以下代码来使用 Python 保存网页 import urllib import sys from bs4 import BeautifulSoup url http www vodafone de privat tarife r
使用 Python 将对象列表转为 JSON

我在转换时遇到问题Object实例到 JSON ob Object list name scaping myObj base url u number page for ob in list name json string json du
通过使用 navbarPanel() 并隐藏导航栏构建多页闪亮应用程序用户端（在 ui.R 中）？

我想构建一个多页闪亮应用程序我可以在其中控制用户可以看到哪个页面迪安阿塔利确实这个演示应用程序中有类似的东西 https github com daattali advanced shiny tree master multiple

随机推荐

在 Android 中的 doinbackground() 中执行 UI 任务

有没有办法在 AsyncTask 的 doinbackground 中执行 UI 任务我很清楚最好在 onPostExecute 方法中执行此操作但就我而言由于我需要使用可重复使用的警报因此能够访问我的 doinbackground
查找 jQuery 中所有未选中的复选框

我有一个复选框列表
Django，在模型中按函数过滤 Q 对象

在我的 Profile 模型中我有以下功能它用于返回用户的全名如果某些数据丢失则返回用户的全名 def full name self first name self user first name strip if first na
像java一样的Visual Studio参数化单元测试

在 Java 测试环境中我可以使用参数化单元测试如以下代码所示 RunWith value Parameterized class public class JunitTest6 private int number public Ju
在后台重新加载 UITableView 的数据

在我的应用程序中我有一个 UITableViewController 它的 tableView 分为 3 个部分我从我的服务器下载每个部分的数据为此我有 3 个函数例如 f1 f2 和 f3 每个更新一个相应的 NSArray 用
VS 2022：Roslyn 代码分析的高 RAM 和 CPU 问题

我们在 Visual Studio 2022 v 17 2 2 64 位中拥有一个庞大的解决方案 ASP NET MVC C Roslyn 代码分析始终使用高 CPU 和 RAM 有办法防止这个问题吗配置还是其他在 Visual St
单击提交按钮时重新加载页面后如何滚动到特定 div？

我正在尝试做一些奇特的事情我已经成功编写了代码以便在填写小表单并单击提交按钮时显示数据库中的结果结果显示在表单的正下方但我觉得如果页面能自动向下滚动到包含已填写表单结果的 div 那就太好了我想我必须使用 jquery 或 aja
Angular2 - 将 POST 与 angular-in-memory-web-api 一起使用

我正在使用 Angular 2 的 angular in memory web api 到目前为止我只使用了 GET 调用而且运行良好我要调用的 API 仅使用 POST 调用因此我开始将 GET 调用重写为 POST 调用但随后
如何从 Ruby on Rails 应用程序打印（条形码）标签？

我在 RoR 中开发的第一个应用程序是针对我们库存中使用的一些 Kiosk 触摸屏 PC 当库存工人拿起一些材料时他在表格中输入数量现在我想在我们的 Zebra 打印机上打印一个标签其中包含客户名称材料描述数量和条形码我如何从
如何为 FsCheck 测试生成空字符串

Using FsCheck https github com fsharp FsCheck Haskell QuickCheck 测试库的 F 版本用于生成测试C https github com fsharp FsCheck blob
使用 jquery 验证文件上传控件

如何使用 jquery 验证 asp net FileUpload 控件我需要验证两件事当用户单击确定按钮时 FileUpload 不应为空并且它应仅包含 excel 和 csv 文件请帮忙您可以验证扩展 form submi
Spring LDAP 返回相同且不正确的 objectSid

在我的 Spring Web 应用程序中我无法检索正确的objectId来自当前使用 Active Directory 帐户登录的用户所有属性似乎都有正确的值但是objectId值始终设置为S 1 5 21 1723711471 31
Android 电子邮件意图不将文件作为附件附加

对于我的公司我正在尝试使用电子邮件意图从我的 Android 应用程序发送电子邮件我正在使用模拟器来测试我的应用程序但问题是当我尝试添加和附件例如 pdf 图像时它还无法附加这是我的代码 private String Sen
ClientCredentialType=Windows 和 =Ntlm 之间的区别

任何人都可以清楚地解释使用之间的区别 clientCredentialType Windows and clientCredentialType Ntlm 托管 WCF 服务时在服务器端 Web config 中我有一个 SOAP 1 1
Java Jackson嵌入对象反序列化

我有回应 item field1 1 field2 1 我想将其反序列化为Privacy有 2 个字段的类field1 and field2 A已添加 objectMapper configure DeserializationConfig
“ReverseManyToOneDescriptor”对象没有属性“最新”

我在尝试运行函数时收到此错误这是我的第一个 django python 项目所以我对此没有经验我已经搜索过此错误但没有找到类似的内容 def getpriority chunks p 0 for chunk in chunks a
您可以使用重载的 bool() 来评估对 boolean 的构造函数调用吗？

如果 bool 运算符重载构造函数调用是否可以计算为布尔值 class A public A operator bool const return true main if A a A do stuff 上面的代码是否有效或者我是否需要
这个 HorizontalScrollView 布局或其 LinearLayout 父级是无用的

我是 android 编程新手我对水平滚动视图有问题我遇到错误此 Horizo ntalScrollView 布局或其 LinearLayout 父级无用
C# HttpClient 是否支持socks4/5 代理？

我可以使用以下代码设置http代理 public class CustomFlurlHttpClient DefaultHttpClientFactory public override HttpClient CreateClient Ur
Python 相当于 R 的 cluster 包中的 daisy()

我有一个数据集其中包含分类名义和序数和数字属性我想使用这些混合属性来计算我的观察结果的不相似度矩阵使用daisy http stat ethz ch R manual R patched library cluster htm

Python 相当于 R 的 cluster 包中的 daisy()

Python 相当于 R 的 cluster 包中的 daisy() 的相关文章

随机推荐

热门标签