fuzzycomparison

在 R 中连接/匹配数据帧

我有两个数据框第一列有两列 x是水深 y是每个深度的温度第二个也有两列 x也是水深但与第一个表中的深度不同第二栏z是盐度我想通过以下方式连接两个表x 通过增加z到第一张桌子我已经学会了如何使用 key 来连接表tidyr 但只有

r join leftjoin fuzzycomparison

使用 Python/PIL 比较（相似）图像

我正在尝试计算相似 read 编辑距离的两个图像使用 Python 2 6 和 PIL 我计划使用python levenshtein http pypi python org pypi python Levenshtein 0 10

python pythonimaginglibrary fuzzylogic fuzzycomparison

Python“正则表达式”模块：模糊值

我正在使用模糊匹配功能Regex https pypi python org pypi regex 模块如何获得匹配的模糊度值它指示模式与字符串的差异程度就像 Levenshtein 中的编辑距离一样我以为我可以获取

python regex fuzzycomparison pypiregex

如何模糊匹配相邻单元格？

我有一行 10 000 个名字位于两个相应的列中每列 10 000 个 A 列中的每个单元格对应于 B 列中的相邻单元格我想进行模糊匹配并获得所有单元格与相邻单元格的兼容性分数我不希望它搜索整个列与整个列只搜索相邻的单元格我似

Excel excelformula fuzzysearch fuzzycomparison

如何规范公司名称

我们有用户生成的各种不同形式的雇主名称例如人们输入或导入 Google谷歌公司谷歌公司谷歌公司通过数据库搜索这看起来像是一家不同的公司我们更改了一些内容将每个雇主映射到一个规范化名称但总共有 70 000 个雇主因此很难

rubyonrails MongoDB fuzzycomparison

Ruby 上的 difflib [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案有没有类似Python的库difflib http docs python org library difflib html关于鲁比特别

python ruby string stringmatching fuzzycomparison

R 中的模糊合并 - 寻求帮助来改进我的代码

受到实验的启发fuzzy join函数从statar https github com matthieugomez statar我自己编写了一个函数它结合了精确匹配和模糊匹配按字符串距离我必须做的合并工作相当大导致多个字符串距离矩阵

r parallelprocessing dataTable fuzzycomparison stringdist

在Python中使用模糊匹配合并多列上的数据帧

我有两个示例数据框如下所示 df1 pd DataFrame Name 0 John 1 Bob 2 Shiela Degree 0 Masters 1 Graduate 2 Graduate Age 0 27 1 23 2 21 df2

python pandas DataFrame fuzzycomparison

用于模糊字符串比较的好 Python 模块？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案 Locked 这个问题及其答案是locked help locked posts因为这个问题是题外话但却具有历史意义目前不接受新的答案或互动

python string stringcomparison fuzzycomparison

模糊文本搜索：正则表达式通配符搜索生成器？

我想知道是否有某种方法可以在 PHP 中进行模糊字符串匹配在长字符串中查找单词即使拼写错误也能找到潜在的匹配项如果由于 OCR 错误而偏离一个字符它会找到它我在想正则表达式生成器也许能够做到这一点因此如果输入 crazy 它将

php regex OCR fuzzysearch fuzzycomparison

Lucene.net 模糊短语搜索

我自己已经尝试了相当长的一段时间并在网络上到处寻找但一直无法找到任何通过 Lucene NET 2 9 2 进行模糊短语搜索的示例 C 是否能够建议如何详细执行此操作和或提供一些示例代码我将非常感谢任何帮助因为我完全陷入困境我假

lucenenet fuzzysearch Lucene fuzzycomparison

查找近似重复记录的技术

我正在尝试清理一个数据库多年来该数据库已获取许多重复记录且名称略有不同例如在公司表中有 Some Company Limited 和 SOME COMPANY LTD 之类的名称我的计划是将有问题的表导出到 R 中将名称转换为

r duplicatedata duplicates fuzzycomparison

R 中近似子串匹配的位置

我正在使用 R 进行字符串处理我有一个带有一列字符串的数据框例如 df lt data frame textcol c In this substring would like to find the position of this

r fuzzycomparison

模糊匹配一列中的字符串并使用 fuzzywuzzy 创建新的数据框

我有以下数据框 df pd DataFrame id 1 2 3 4 5 6 fruits apple apples orange apple tree oranges mango id fruits 0 1 apple 1 2 apple

python pandas fuzzycomparison fuzzywuzzy

如何在Python中模糊匹配数组列中的项目？

我有一系列来自 NCAA 的球队名称以及与其相关的统计数据学校名称通常会被缩短或完全省略但名称的所有变体通常都有一个共同元素例如阿拉巴马州赤潮与赤潮这些名称全部包含在一个数组中没有特定的顺序我希望能够通过模糊匹配来获取团队名称

python27 fuzzycomparison

如何使用 jaro-winkler 查找表中最接近的值？

我的数据库中有一个 jaro winkler 算法的实现这个函数不是我写的该函数比较两个值并给出匹配的概率所以 jaro string1 string2 matchnoofchars 将返回结果我不想比较两个字符串而是想发送一个带

Oracle stringcomparison fuzzycomparison

模糊匹配微小差异

我有一列公司名称我想计算该列中有多少家不同的公司在本栏目中一些相同的公司名称略有不同例如这些公司应该只计算一次 ASAHI INTECC CO LTD Asahi Intecc USA Inc ASAHI INTECC USA I

r fuzzycomparison

模糊字符串比较

我正在努力完成的是一个读取文件并根据原始句子比较每个句子的程序与原文完美匹配的句子将获得 1 分完全相反的句子将获得 0 分所有其他模糊句子将获得 1 到 0 之间的分数我不确定使用哪个操作来让我在 Python 3 中完成此操作

python NLP fuzzycomparison

模糊地址匹配R

是的以前有人问过这个问题但我找不到一个线程可以为这个问题提供简单干净的答案我有下面的示例数据我有两列 col1 是当前地址 col2 是我被告知比当前地址更好的地址我需要看看第二列比第一列好多少大多数时候第二个更好

r lapply fuzzycomparison

如何对相似的新闻文章进行分组/比较

在我正在创建的应用程序中我想添加将新闻报道分组在一起的功能我想将来自不同来源的有关同一主题的新闻报道分组到同一组中例如来自 CNN 和 MSNBC 的关于 XYZ 的文章将属于同一组我猜它是某种模糊逻辑比较从技术角度来看我将如何

fuzzycomparison