Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
在 R 中连接/匹配数据帧
我有两个数据框 第一列有两列 x是水深 y是每个深度的温度 第二个也有两列 x也是水深 但与第一个表中的深度不同 第二栏z是盐度 我想通过以下方式连接两个表x 通过增加z到第一张桌子 我已经学会了如何使用 key 来连接表tidyr 但只有
r
join
leftjoin
fuzzycomparison
使用 Python/PIL 比较(相似)图像
我正在尝试计算相似 read 编辑距离 的两个图像 使用 Python 2 6 和 PIL 我计划使用python levenshtein http pypi python org pypi python Levenshtein 0 10
python
pythonimaginglibrary
fuzzylogic
fuzzycomparison
Python“正则表达式”模块:模糊值
我正在使用 模糊匹配 功能Regex https pypi python org pypi regex 模块 如何获得 匹配 的 模糊度值 它指示模式与字符串的差异程度 就像 Levenshtein 中的 编辑距离 一样 我以为我可以获取
python
regex
fuzzycomparison
pypiregex
如何模糊匹配相邻单元格?
我有一行 10 000 个名字 位于两个相应的列中 每列 10 000 个 A 列中的每个单元格对应于 B 列中的相邻单元格 我想进行模糊匹配 并获得所有单元格与相邻单元格的兼容性分数 我不希望它搜索整个列与整个列 只搜索相邻的单元格 我似
Excel
excelformula
fuzzysearch
fuzzycomparison
如何规范公司名称
我们有用户生成的各种不同形式的雇主名称 例如 人们输入或导入 Google谷歌公司谷歌公司谷歌公司 通过数据库搜索 这看起来像是一家不同的公司 我们更改了一些内容 将每个雇主映射到一个 规范化 名称 但总共有 70 000 个雇主 因此很难
rubyonrails
MongoDB
fuzzycomparison
Ruby 上的 difflib [关闭]
Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案 有没有类似Python的库difflib http docs python org library difflib html关于鲁比 特别
python
ruby
string
stringmatching
fuzzycomparison
R 中的模糊合并 - 寻求帮助来改进我的代码
受到实验的启发fuzzy join函数从statar https github com matthieugomez statar我自己编写了一个函数 它结合了精确匹配和模糊匹配 按字符串距离 我必须做的合并工作相当大 导致多个字符串距离矩阵
r
parallelprocessing
dataTable
fuzzycomparison
stringdist
在Python中使用模糊匹配合并多列上的数据帧
我有两个示例数据框 如下所示 df1 pd DataFrame Name 0 John 1 Bob 2 Shiela Degree 0 Masters 1 Graduate 2 Graduate Age 0 27 1 23 2 21 df2
python
pandas
DataFrame
fuzzycomparison
用于模糊字符串比较的好 Python 模块? [关闭]
Closed 这个问题是基于意见的 help closed questions 目前不接受答案 Locked 这个问题及其答案是locked help locked posts因为这个问题是题外话 但却具有历史意义 目前不接受新的答案或互动
python
string
stringcomparison
fuzzycomparison
模糊文本搜索:正则表达式通配符搜索生成器?
我想知道是否有某种方法可以在 PHP 中进行模糊字符串匹配 在长字符串中查找单词 即使拼写错误也能找到潜在的匹配项 如果由于 OCR 错误而偏离一个字符 它会找到它 我在想正则表达式生成器也许能够做到这一点 因此 如果输入 crazy 它将
php
regex
OCR
fuzzysearch
fuzzycomparison
Lucene.net 模糊短语搜索
我自己已经尝试了相当长的一段时间 并在网络上到处寻找 但一直无法找到任何通过 Lucene NET 2 9 2 进行模糊短语搜索的示例 C 是否能够建议如何详细执行此操作和 或提供一些示例代码 我将非常感谢任何帮助 因为我完全陷入困境 我假
lucenenet
fuzzysearch
Lucene
fuzzycomparison
查找近似重复记录的技术
我正在尝试清理一个数据库 多年来该数据库已获取许多重复记录 且名称略有不同 例如 在公司表中 有 Some Company Limited 和 SOME COMPANY LTD 之类的名称 我的计划是将有问题的表导出到 R 中 将名称转换为
r
duplicatedata
duplicates
fuzzycomparison
R 中近似子串匹配的位置
我正在使用 R 进行字符串处理 我有一个带有一列字符串的数据框 例如 df lt data frame textcol c In this substring would like to find the position of this
r
fuzzycomparison
模糊匹配一列中的字符串并使用 fuzzywuzzy 创建新的数据框
我有以下数据框 df pd DataFrame id 1 2 3 4 5 6 fruits apple apples orange apple tree oranges mango id fruits 0 1 apple 1 2 apple
python
pandas
fuzzycomparison
fuzzywuzzy
如何在Python中模糊匹配数组列中的项目?
我有一系列来自 NCAA 的球队名称 以及与其相关的统计数据 学校名称通常会被缩短或完全省略 但名称的所有变体通常都有一个共同元素 例如阿拉巴马州赤潮与赤潮 这些名称全部包含在一个数组中 没有特定的顺序 我希望能够通过模糊匹配来获取团队名称
python27
fuzzycomparison
如何使用 jaro-winkler 查找表中最接近的值?
我的数据库中有一个 jaro winkler 算法的实现 这个函数不是我写的 该函数比较两个值并给出匹配的概率 所以 jaro string1 string2 matchnoofchars 将返回结果 我不想比较两个字符串 而是想发送一个带
Oracle
stringcomparison
fuzzycomparison
模糊匹配微小差异
我有一列公司名称 我想计算该列中有多少家不同的公司 在本栏目中 一些相同的公司名称略有不同 例如 这些公司应该只计算一次 ASAHI INTECC CO LTD Asahi Intecc USA Inc ASAHI INTECC USA I
r
fuzzycomparison
模糊字符串比较
我正在努力完成的是一个读取文件并根据原始句子比较每个句子的程序 与原文完美匹配的句子将获得 1 分 完全相反的句子将获得 0 分 所有其他模糊句子将获得 1 到 0 之间的分数 我不确定使用哪个操作来让我在 Python 3 中完成此操作
python
NLP
fuzzycomparison
模糊地址匹配R
是的 以前有人问过这个问题 但我找不到一个线程可以为这个问题提供简单 干净的答案 我有下面的示例数据 我有两列 col1 是当前地址 col2 是我被告知比当前地址 更好 的地址 我需要看看第二列比第一列 好 多少 大多数时候 第二个更好
r
lapply
fuzzycomparison
如何对相似的新闻文章进行分组/比较
在我正在创建的应用程序中 我想添加将新闻报道分组在一起的功能 我想将来自不同来源的有关同一主题的新闻报道分组到同一组中 例如 来自 CNN 和 MSNBC 的关于 XYZ 的文章将属于同一组 我猜它是某种模糊逻辑比较 从技术角度来看我将如何
fuzzycomparison