Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
弹性搜索模糊匹配,精确匹配首先显示
我想在查询中使用模糊匹配 但精确匹配显示在结果的顶部 我已经尝试过以下方法 return this gt client gt search array index gt self INDEX type gt self TYPE body g
php
elasticsearch
fuzzysearch
r中的模糊字符串匹配
我有 2 个数据集 每个数据集超过 100K 行 我想根据匹配一列 电影标题 的模糊字符串以及使用发布日期来合并它们 我提供了下面两个数据集中的样本 数据集 1 itemid userid rating time title release
r
stringmatching
fuzzysearch
如何在 Ruby 中进行模糊子字符串匹配?
我发现了很多关于模糊匹配的链接 将一个字符串与另一个字符串进行比较 看看哪个字符串的相似度得分最高 我有一个很长的字符串 一个文档 和一个子字符串 子字符串来自原始文档 但已被转换多次 因此可能会引入奇怪的工件 例如这里有一个空格 那里有一
ruby
string
fuzzysearch
在 C# 中对超过 100k 个字符串进行快速动态模糊搜索
假设它们是预先加载的股票代码 输入到文本框中 我正在寻找可以复制的代码 而不是要安装的库 这是受到这个问题的启发 是否有为 C 编写的模糊搜索或字符串相似性函数库 https stackoverflow com questions 8377
c
Algorithm
net40
fuzzysearch
textsearch
如何模糊匹配相邻单元格?
我有一行 10 000 个名字 位于两个相应的列中 每列 10 000 个 A 列中的每个单元格对应于 B 列中的相邻单元格 我想进行模糊匹配 并获得所有单元格与相邻单元格的兼容性分数 我不希望它搜索整个列与整个列 只搜索相邻的单元格 我似
Excel
excelformula
fuzzysearch
fuzzycomparison
如何在 Python 中对编辑距离超过 80% 的单词进行分组
假设我有一个清单 person name zakesh oldman LLC bikash goldman LLC zikash rakesh 我正在尝试以这种方式对列表进行分组 以便编辑距离 https en wikipedia org
python
groupby
levenshteindistance
fuzzysearch
fuzzylogic
在 NGS 数据中查找 CDR
我有数百万个fasta格式的序列 想要提取CDR CDR1 CDR2和CDR3 我只选择了一个序列作为示例 并尝试提取CDR1 但无法提取CDR1 顺序 FYSHSAVTLDESGGGLQTPGGGLSLVCKASGFTFSSYGMMWVR
python
regex
pythonre
biopython
fuzzysearch
Pandas 模糊检测重复项
如何在 pandas 中使用模糊匹配来检测重复行 有效 如何在没有将 row i 转换为 String 然后将其与所有其他列进行比较的巨大 for 循环的情况下查找一列与所有其他列的重复项 不是 pandas 特有的 而是在 python
python
pandas
fuzzysearch
localitysensitivehash
recordlinkage
从字符串列表中找到与给定字符串匹配的最佳子集
我有一根绳子 s mouse 和一个字符串列表 sub strings m o se e 我需要找出与 s 匹配的列表的 sub strings 的最佳和最短匹配子集是什么 做这个的最好方式是什么 理想的结果是 m o se 因为它们一起拼
python
string
Algorithm
matching
fuzzysearch
Lucene 模糊搜索客户名称和部分地址
我浏览了所有现有的问题帖子 但找不到相关的内容 我有数百万条记录 包括个人名字 姓氏 地址 1 地址 2 国家 地区代码 出生日期 我想每天使用上述文件检查我的客户列表 我的客户列表也会每天更新 并且文件也每天更新 对于名字和姓氏 我想要模
Lucene
fuzzysearch
SQL模糊匹配
希望我没有重复这个问题 在在这里发帖之前 我在这里做了一些搜索和谷歌 我正在使用启用全文的 SQL Server 2008R2 运行 eStore 我的要求 有一个产品表 其中包含产品名称 OEM 代码 该产品适合的型号 一切都在文字中 我
sqlserver
sqlserver2008
fulltextsearch
fuzzysearch
使用非精确测量(模糊逻辑)查找一系列数据
这是一个更复杂的后续问题 查找连续值的有效方法 https stackoverflow com questions 8011330 efficient way to look up sequential values Each Produc
sql
sqlserver
Algorithm
sqlserver2008
fuzzysearch
在进行文本相似度评分时如何矢量化和加速 pandas 数据帧的双 for 循环
我有以下数据框 d test name South Beach Dog Bird Ant Big Dog Beach Dear Cat cluster number 1 2 3 3 2 1 4 2 df test pd DataFrame
python
pandas
vectorization
fuzzysearch
fuzzywuzzy
使用索引搜索相似的单词
我需要使用某种模糊搜索 例如来自 Oracle 的模糊搜索 并使用索引来搜索数据库表 因为我不需要表扫描 有大量数据 我想忽略大小写 语言特殊内容 和特殊字符 如 等 搜索 maria cool 应该得到 maria COOL 和 Mar
Oracle
Indexing
oracle11g
fuzzysearch
Elasticsearch - 模糊、短语、完成建议和破折号
因此 我一直在问单独的问题 试图实现我想要实现的搜索功能 但仍然达不到要求 所以我想我只会问人们他们对最佳 Elasticsearch 设置 映射 索引和查询结构的建议 以完成我正在寻找的工作为了 当您键入查询类别的解决方案时 我需要进行搜
elasticsearch
fuzzysearch
searchsuggestion
phrase
在Python中检查较长字符串中存在的模糊/近似子字符串?
使用像leveinstein leveinstein或difflib 这样的算法 很容易找到近似匹配 gt gt gt import difflib gt gt gt difflib SequenceMatcher None amazing
python
python27
fuzzysearch
生成拼写错误的单词(打字错误)
我已经实现了模糊匹配算法 我想使用一些带有测试数据的示例查询来评估其召回率 假设我有一个包含文本的文档 text The quick brown fox jumps over the lazy dog 我想看看是否可以通过测试诸如 sox
python
NLP
fuzzysearch
如何找到最佳的模糊字符串匹配?
蟒蛇的新的正则表达式模块 https pypi python org pypi regex支持模糊字符串匹配 大声歌颂 现在 根据文档 The ENHANCEMATCH标志进行模糊匹配尝试以提高拟合度 它找到的下一个匹配项 The BEST
python
regex
string
fuzzysearch
pypiregex
模糊文本搜索:正则表达式通配符搜索生成器?
我想知道是否有某种方法可以在 PHP 中进行模糊字符串匹配 在长字符串中查找单词 即使拼写错误也能找到潜在的匹配项 如果由于 OCR 错误而偏离一个字符 它会找到它 我在想正则表达式生成器也许能够做到这一点 因此 如果输入 crazy 它将
php
regex
OCR
fuzzysearch
fuzzycomparison
使用 NHibernate 对串联全名进行模糊搜索
我正在尝试将以下 SQL 转换为 NHibernate SELECT FROM dbo Customer WHERE FirstName LastName LIKE bob smith 我试图做这样的事情 但它不起作用 name name
c
sql
LINQ
nhibernate
fuzzysearch
1
2
»