有没有办法模糊匹配或提供分数作为行值应与哪个 ID 或组关联的假设？

2023-11-30

我有一个看起来像这样的数据集

structure(list(ID = c(1, 2, 3, 4, 5, 6, 7, 8, 9, 10), Date = c("2020-01- 
\n04", 
"2020-04-03", "2020-12-10", "2020-09-12", "2020-11-19", "2020-04- \n03", 
"2020-06-03", "2020-05-03", "2020-08-09", "2020-10-10"), Name = c("Jon", 
"Mike", "", "Rodney", "Jon", "Mike", "", "Ryan", "Ryan", "Ryan"
), Phone = c("555-555-5555", "123-456-7890", "123-456-7890", 
"333-333-3333", "", "123-456-7890", "098-765-4321", "", "", "444-444- 
\n4444"
), Email = c("[email protected]", "[email protected]", "[email protected]", 
"[email protected]", "", "", "", "[email protected]", "", "[email protected]"
), Address = c("123 Main Street", "456 Washingto Avenue", "", 
"16 Henderson St", "", "456 Washingto Avenue", "123 Lincoln Avenue", 
"123 Lincoln Avenue", "", "156 Jefferson Street"), Group = c("1", 
"2", "2", "3", "1", "2", "4", "4", "4", "5")), row.names = c(NA, 
-10L), class = c("tbl_df", "tbl", "data.frame"))

我想要获得一个如下所示的数据集（请注意，分数列中的数字并不完全是我想要的数字。我只是添加了数字作为占位符。我将允许该方法确定正确的分数计数。但是 1 应该参考满分。

structure(list(ID = c(1, 2, 3, 4, 5, 6, 7, 8, 9, 10), Date = c("2020-01- 
04", "2020-04-03", "2020-12-10", "2020-09-12", "2020-11-19", "2020-04- 
03", "2020-06-03", "2020-05-03", "2020-08-09", "2020-10-10"), Name = 
c("Jon", "Mike", "", "Rodney", "Jon", "Mike", "", "Ryan", "Ryan", "Ryan"
), Phone = c("555-555-5555", "123-456-7890", "123-456-7890", 
"333-333-3333", "", "123-456-7890", "098-765-4321", "", "", "444-444- 
4444"), Email = c("[email protected]", "[email protected]", "[email protected]", 
"[email protected]", "", "", "", "[email protected]", "[email protected]", 
"[email protected]"), Address = c("123 Main Street", "456 Washingto 
Avenue","", "16 Henderson St", "", "456 Washingto Avenue", "123 Lincoln 
Avenue", 
"123 Lincoln Avenue", "", "156 Jefferson Street"), Group = c("1", 
"2", "2", "3", "1", "2", "4", "4", "4", "5"), Score = c("1", 
"1", ".88", "1", ".96", ".96", "1", "1", ".25", "1")), row.names = c(NA, 
-10L), class = c("tbl_df", "tbl", "data.frame"))

“分数”栏中的数字是任意的。我可以根据模糊匹配过程的规则获取其他数字。我脑海中的想法是，根据长数据集，脚本发现有四个组。这些组对应于 1、2、3 和 4，分别指 Jon、Mike、Rodney 和 Ryan。请注意，Ryan 的得分为 0.25，因为它只包含他的姓名，而不包含电话或电子邮件等其他信息。该分数是组内的相对分数，而不是相对于整个数据集的分数。

一套完整的

Col<-("Name","Phone","Email","Address")

应该画出一个完美的近似值，没有争议。 4 中 3 的一组应该高于 4 中 2 的集合，依此类推。这个过程该如何进行呢？这可能吗？

None

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

tidyverse

approximation

Fuzzy

有没有办法模糊匹配或提供分数作为行值应与哪个 ID 或组关联的假设？的相关文章

如何在 R 树形图中省略标签？

我一直在使用R 树形图包 http cran r project org web packages treemap treemap pdf我有一个 2 层深的树形图我希望打印第二级标签但不打印第一级标签使用手册页中的示例 tmPlot
用于带有嵌套子图的图的 r 包？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一个用于图形网络的 r 包它可以处理嵌套子图 Graphviz 做到了这一点但只提供可
使用 R：如何创建带有日期的时间序列对象？

我有一年中每小时采集的一系列值是否可以创建一个保留小时和年份值的时间序列对象我的代码使用股票价格第一列中的值但不使用日期 stockprices ts lt ts stockprices 1 start 1 freq 168 您没有提
ggplot2 中的小时刻度

我正在处理就寝时间和醒来时间因此我想创建一个具有 24 小时 x 轴的图表从第一天中午 12 点开始到第二天中午 12 点结束这意味着晚上 11 59 之后它应该再次从 0 开始同样的问题仅涉及数字我想创建一个从 10 到
合并具有一个共同元素的集合 R

我有一个这样的列表 lista list lista 1 c 1 2 4 6 8 9 10 11 12 19 32 34 35 36 37 38 lista 2 c 7 8 lista 3 c 13 14 16 26 27 28 29 30
使用 RMySQL 会干扰 RPostgreSQL

我有一个 R 脚本我想从 MySQL 数据库中提取一些数据然后从 PostgreSQL 数据库中提取一些数据但是从 RMySQL 加载 MySQL 驱动程序会阻止我从以下位置加载 PostgreSQL 驱动程序 PostgreSQL
R：为什么 kable 不在 for 循环内打印？

我正在使用 rmarkdown 和 Latex 编写报告我需要使用打印一组表格knitr kable 但在 for 循环内时不会打印这是我的代码 title project title author Mr Author date 201
S4 类 [（子集）带有附加参数的继承

这是一个扩展在 R 中的访问器函数中使用 callNextMethod https stackoverflow com q 24875284 2752888 2017 03 25 更新为了说明如何仅在加载方法时失败但在构建的包中时不会失
使用 purrr::map() 更改和分配新变量名称

我刚刚开始掌握编写函数并使用 lapply purrr map 使我的代码更加简洁但显然还没有完全理解它在我当前的示例中我想重命名 lm robust 对象的系数名称然后更改 lm robust 对象以合并新名称我目前这样做 li
计算 R 中数据帧的每一行中特定值的连续出现次数

我有一个data frame许多位置这么多行的变量的每月值我想计算值为零的连续月份即连续单元格的数量如果只是从左到右阅读这很容易但增加的复杂性是年底与年初是连续的例如在下面的缩短示例数据集中用季节而不是月份位置 1
如何融合颜色和形状？

当我有一个超过 6 个值的变量时我的麻烦就开始了因为这是 ggplot2 中 scale shape 函数的当前最大值由于这个问题我尝试使用另一个变量来解决这个问题我只是将原始变量的长度包裹起来这是我的示例代码 dataf lt
lmer（来自 R 包 lme4）如何计算对数似然？

我试图理解 lmer 函数我发现了很多关于如何使用该命令的信息但关于它实际执行的操作的信息却很少除了这里的一些神秘注释 http www bioconductor org help course materials 2008 PHSI
如何在 R 中的另一个函数中使用 `sink` 函数？

我有一个函数fun依赖于外部函数external 即来自某个包我如何收集来自的所有警告external在字符向量中这是一个最小的设置 External function from another package external lt
R：使用带有 .Call 和 C/C++ 包装器的 Fortran 子例程而不是 .Fortran 的优点？

我有一个 R 包它使用大量 Fortran 子例程来进行递归线性代数计算的嵌套循环很大程度上依赖于 BLAS 和 LAPACK 例程作为 Fortran 的接口我使用 Fortran功能我刚刚读过乔纳森卡拉汉的博客文章 http
R 中的 as.numeric 有什么问题？ [复制]

这个问题在这里已经有答案了 gt X864291X8X74 1 8 0000000000 9 0000000000 10 0000000000 6 0000000000 8 0000000000 10 Levels 0 0000000000
如果条件长度 > 1 并且仅使用第一个元素，为什么我会在 R 中收到此警告

我有下面的源代码这if is na monthData 用于检查是否monthData is NA 如果是则为其分配一个初始值 monthData lt NA if category QUARTER for m in c rep 1 4
确定向量中是否存在元素的最有效方法

我有几种算法取决于确定元素是否存在于向量中的效率在我看来这 in 这相当于is element 应该是最有效的因为它只返回一个布尔值在测试了几种方法之后令我惊讶的是这些方法是迄今为止效率最低的以下是我的分析随着向量大小的增加
按具有作业的组划分的 R 分位数

我有以下 df group rep seq 1 3 30 variable runif 90 5 0 7 5 df data frame group variable 我需要 i 按组定义分位数 ii 将每个人分配到相对于其组的分位数因此
使用 R 从字符串中提取函数参数

最好使用stringr包我想创建一个函数extract 以字符串向量作为参数 vec lt c div span icon hospital user i18n t Enrolments or i18n t Paper a string
分组和计数以获得接近值

我想计算每country的次数status is open以及次数status is closed 然后计算closerate per country Data customer lt c 1 2 3 4 5 6 7 8 9 country

随机推荐

使用 LINQ 获取配对集

当我有一个清单时 IList
如何在 map() 中使用异步代码（Flutter、Firestore）

我正在使用 Flutter 和 Firestore 插件开发一个群聊应用程序从数据库获取数据并将快照转换为消息列表完全可以正常工作但现在我想将数据库中的 uid 转换为用户名 uid 及其用户名保存在数据库中这是我的代码 final
使用 XSLT 2.0 的两阶段转换

我正在尝试将 CSV 文件作为输入并将其转换为 XML 我是 XSLT 新手我找到了一种将 CSV 转换为 XML 的方法使用来自安德鲁韦尔奇像这样输入 CSV 文件 car manufacturer model color pri
yaml 中的“>-”和“|-”有什么区别？

我想确切地知道 gt 和之间的区别特别是在 kubernetes yaml 清单中折叠块标量中的换行符 gt 受到行折叠文字块标量中的换行符不是行折叠将非空行之间的单个换行符替换为空格并且在空行的情况下将周围非空行之间的换行
ASP.NET Core执行Linux shell命令

有没有办法从 ASP NET Core 应用程序中执行 Linux shell 命令并将值返回到变量中目前最好的可能性似乎是使用预发布版SSH Net Core https www nuget org packages SSH Net C
使用 PHP 脚本进行 ERR_CONNECTION_RESET

我有一个 PHP 脚本可以下载和处理一些文件有时文件数量非常大因此需要一些时间但是当有大量文件需要处理时连接会中断并出现 ERR CONNECTION RESET 错误 Chrome 这是我的配置 upload max file
从网站上的按钮下载文件的 Python 脚本

我想通过单击以下网址中的导出到 Excel 按钮来下载 xls 文件 https apps tampagov net CallsForService Webapp Default aspx type TPD 更具体地说按钮 name c
offsetTop 与 jQuery.offset().top

我读过offsetLeft and offsetTop不能在所有浏览器中正常工作 jQuery offset 应该为此提供一个抽象以提供正确的值 xbrowser 我想要做的是获取元素被单击的位置相对于元素左上角的坐标问题是jQuery
在 iOS 上读取 sms.db 和 call_history.db 文件？

我正在为越狱的 iPhone 5s iOS 7 1 1 开发一个应用程序以获取存储在相应 db 文件中的通话日志和消息我有一些疑问我有一个有效的证书配置文件并且我的应用程序是使用此配置文件签名的因此是否有必要删除此配置文件并使用
错误：控制到达非 void 函数的末尾

我在学习C 我从教科书上复制了这段代码在编译代码时最后出现错误错误说控制到达非 void 函数的末尾它位于代码的末尾 include ComplexNumber hpp include
限制线程数和 Java 并发

我找不到使用最新 JAVA 并发例程的具体案例的示例我打算使用threads处理可能包含 0 到数千个请求的开放队列中的项目我想限制在任何给定时间都有不少于 0 且不超过 10 个线程处理队列项目是否有针对这种特定类型案例的 Java
如何使用 JqGrid 更改 select2 下拉列表的选定值？

我用的是奥列格的选择2演示但我想知道是否可以更改下拉菜单中当前选择的值例如如果加载的四个值是 Any Fruit Vegetable Meat 下拉列表默认为 Any 我怎样才能将其更改为 Fruit 在 JqGrid 事件中load
Android Studio 空白活动

我使用的是 Android Studio 2 1 没有空白活动选项我见过有人问过这个问题一般的建议是自己做一个问题是我对 Android 开发一无所知所以我正在学习这个教程http developer android com
jQuery onclick 删除表格行

如何点击删除表格行这里有一个jsfiddle 我只想删除 del 链接嵌套的行而不是脚本现在执行的最后一行单击呼叫delTableRow 函数并且需要更改该函数以删除嵌套的 del 链接行
jqGrid 多选上的 PrettyCheckable

我有一个jqGrid带有我用 CSS 自定义的多选复选框的表格和漂亮可检查要自定义我设置的表格的所有复选框 prettyCheckable 如下 jQuery document ready function input type chec
sqoop 与 mysql 的导入问题

我有一个基于 cdh5 的 hadoop ha 设置我尝试使用 sqoop 从 mysql 导入表失败并出现以下错误 15 03 20 12 47 53 ERROR manager SqlManager Error reading fr
空格上仅支持 JavaScript 的自动换行功能？

我发现的大多数自动换行功能都绑定到 css 和或浏览器 dom 我正在 javascript 环境 rhino 中工作需要找到或设计一个更好的自动换行该换行可以在给定行长度值之前的空白处中断我当前的解决方案只是搜索给定字符之前的最后
C++ 中如何进行柯里化？

什么是柯里化 C 中如何进行柯里化请解释一下STL容器中的活页夹 1 什么是柯里化柯里化只是意味着将多个参数的函数转换为单个参数的函数使用一个例子可以很容易地说明这一点取一个函数f它接受三个参数 int f int a std st
解决 pex 内部类

当被测试的类是内部类时有什么方法可以让 pex 工作吗密封课程怎么样我的意思是毕竟这种类型的工具非常适合 API 测试有时您可能希望至少将内容保留在内部 Thanks 通过以下方式为测试组件提供内部可见性InternalsVisi
有没有办法模糊匹配或提供分数作为行值应与哪个 ID 或组关联的假设？

我有一个看起来像这样的数据集 structure list ID c 1 2 3 4 5 6 7 8 9 10 Date c 2020 01 n04 2020 04 03 2020 12 10 2020 09 12 2020 11 19 2

有没有办法模糊匹配或提供分数作为行值应与哪个 ID 或组关联的假设？

有没有办法模糊匹配或提供分数作为行值应与哪个 ID 或组关联的假设？ 的相关文章

随机推荐

热门标签

有没有办法模糊匹配或提供分数作为行值应与哪个 ID 或组关联的假设？的相关文章