Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
PHP - 相互比较多维子数组并根据相似度阈值进行合并
简介 此问题已于 2018 年 5 月 27 日更新 我有 1PHP多维数组 包含6个子数组 每个子数组包含20个子子数组 每个子数组又包含2个子子数组 一个是字符串 header 另一个是未指定数量的关键字 keywords 我希望将 1
php
Arrays
multidimensionalarray
Compare
levenshteindistance
具有错误字符容限的最长公共子串
我在这里找到了一个脚本 在寻找最低公共子串时效果很好 但是 我需要它来容忍一些不正确 丢失的字符 我希望能够输入所需的相似性百分比 或者指定允许的丢失 错误字符的数量 例如 我想找到这个字符串 大黄色校车 该字符串内部 那天下午他们乘坐黄色
php
stringmatching
levenshteindistance
longestsubstring
VBA 中的编辑距离 [关闭]
Closed 此问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 我有包含数据的 Excel 工作表 我想获取它们之间的 Levenshtein 距离 我已经尝试导出为文
vba
Excel
levenshteindistance
mySQL:使用编辑距离查找 20,000 行中的重复项
我基本上有一个两列表 其中包含主键和大约 20 000 行的公司名称 我的任务是找到所有重复的条目 我最初尝试使用 soundex 但它会匹配完全不同的公司 只是因为它们的第一个单词相似 这让我开始使用编辑距离算法 问题是 查询花费的时间是
mysql
sql
levenshteindistance
对 tsvector 中的每个元素使用 Levenshtein 函数?
我正在尝试使用 Postgres 创建模糊搜索 并一直使用 django watson 作为基本搜索引擎来工作 我有一个名为 search tsv 的字段 它是一个 tsvector 其中包含我要搜索的模型的所有字段值 我想使用 Leven
postgresql
levenshteindistance
fuzzysearch
tsvector
如何纠正 Damerau-Levenshtein 实施中的错误?
我带着另一个较长的问题回来了 尝试过许多基于 Python 的 Damerau Levenshtein 编辑距离实现 我终于找到了下面列出的那个 as editdistance reference 它 似乎提供了正确的结果并且似乎有一个有效
python
python3x
Cython
levenshteindistance
editdistance
优化编辑距离算法
我有一个存储过程 它使用编辑距离来确定最接近用户键入内容的结果 唯一真正影响速度的是在选择距离最小的记录之前计算所有记录的 Levenshtein 距离的函数 我通过将 0 代替对 Levenshtein 函数的调用来验证这一点 该表有 1
Optimization
levenshteindistance
editdistance
T-SQL 中的编辑距离
我对 T SQL 计算 Levenshtein 距离的算法感兴趣 我在 TSQL 中实现了标准 Levenshtein 编辑距离函数 并进行了多项优化 与我所知的其他版本相比 速度有所提高 如果两个字符串的开头有共同的字符 共享前缀 结尾有
TSQL
editdistance
levenshteindistance
修改编辑距离以实现位置偏差
我使用 Levenshtein 距离算法将作为用户输入提供的公司名称与已知公司名称的数据库进行比较 以找到最接近的匹配 就其本身而言 该算法工作正常 但我想构建一个偏差 以便如果字符串的初始部分匹配 则编辑距离被认为较低 例如 如果搜索条件
Distance
levenshteindistance
对于字符串距离,是否有比 Levenshtein 更快(不太精确)的算法?
我想运行 Levenshtein 但速度要快得多 因为它是我正在构建的实时应用程序 一旦距离大于10 它就会终止 从评论来看 人们似乎对Sift3 http sift codeplex com
javascript
levenshteindistance
PHP - 查找两段文本之间匹配单词的数量?
我想找到两个文本之间相似单词的数量 Example str1 the cat is on the roof str2 the mouse is on the roof 屋顶上 str1 和 str2 中的单词相似 所以输出将是5号 OR 百
php
match
levenshteindistance
fuzzylogic
PHP:使用编辑距离来匹配单词
我一直在阅读和测试 php 中的一些示例编辑 比较 input 和 words 输出 比较 input hw r u my dear angel array of words to check against words array app
php
levenshteindistance
如何修改 Levenshtein 算法,以了解它是否插入、删除或替换了字符?
所以我试图设计一个 Levenshtein 算法的衍生版本 在其中我跟踪我在字符串中所做的转换 插入 a 或用 a 代替 b Example 基本上 假设我正在计算 bbd 和 bcd 的编辑距离 编辑距离将为 1 变换将为 用 b 代替
python
Algorithm
levenshteindistance
使用levenshtein距离计算两个完整文本的相似度[关闭]
Closed 这个问题是无关 目前不接受答案 我有两个想要比较的文本文件 我所做的是 我把它们都分成了句子 我测量了一个文件中的每个句子与第二个文件中的每个句子之间的编辑距离 我想计算这两个文本文件之间的平均相似度 但是我很难提供任何有意义
Algorithm
statistics
levenshteindistance
Python 中的字符串相似度度量[重复]
这个问题在这里已经有答案了 我想找到两个字符串之间的字符串相似度 维基百科有其中一些例子 code google 有一个 Python 实现编辑距离 在这些限制下 是否有更好的算法 希望有一个 Python 库 我想在字符串之间进行模糊匹配
python
string
Algorithm
levenshteindistance
editdistance
编辑替代方案
我有一大堆查询并使用levenshtein来计算拼写错误 现在levenshtein导致mysql占用完整的CPU时间 我的查询是 UNION 语句中的全文搜索 levenshtein sql1 是我当前的查询 sql2 只是全文搜索 速度
mysql
levenshteindistance
狮身人面像和“你的意思是……?”建议想法。它会起作用吗?
我正在尝试想出最快的方法来提出搜索建议 起初我认为 Levenstein UDF 函数与 mysql 表相结合就可以完成这项工作 但是使用 levenshtein mysql 必须遍历表中的每一行 大量的单词 这会使查询非常慢 现在我最近安
mysql
sphinx
keyword
levenshteindistance
searchsuggestion
根据十六进制颜色获取最接近的颜色名称
我尝试根据给定的十六进制值获取最匹配的颜色名称 例如 如果我们有十六进制颜色 f00我们必须得到颜色名称red ff0000 gt red 000000 gt black ffff00 gt yellow 我目前使用编辑距离算法来获取最接近
javascript
performance
Colors
levenshteindistance
莱文斯坦到达默劳-莱文斯坦
我坐在这里 用 Java 为我的主程序编写一些算法 到目前为止是第一个 我对 levenshtein 算法进行了很好的编程 这要归功于 wiki 为新手提供的伪代码以及一个很好的教程 D 然后我决定升级到 Damerau 并添加额外的行 但
Java
Algorithm
levenshteindistance
Sqlite 具有真正的“全文搜索”和拼写错误(FTS+spellfix 一起)
假设我们有 100 万行 如下所示 import sqlite3 db sqlite3 connect memory c db cursor c execute CREATE TABLE mytable id integer descrip
python
SQLite
fulltextsearch
levenshteindistance
«
1
2
3
»