Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
测量两个字符串之间相似性的有效方法是什么? (编辑距离使堆栈太深)
所以 我从这个开始 http en wikibooks org wiki Algorithm Implementation Strings Levenshtein distance Ruby http en wikibooks org wi
rubyonrails
string
Compare
similarity
levenshteindistance
在 MySQL 中插入时检查并防止相似字符串
简要信息 我有3张桌子 Set id name SetItem set id item id position TempSet id 我有一个函数可以生成新的随机组合Item桌子 基本上 总是在成功生成之后 我在中创建一个新行Set表 获取
mysql
sql
Hash
combinations
similarity
使用 PHP 比较两个字符串的相似度
嘿伙计们 我想寻求一些解决方案 现在我有字典了单词 txt 这里有一些例子 happy laugh sad 我有俚语字符串 hppy 我想要搜索和匹配那个俚语字符串我的字典这意味着它将返回 happy 因为这些字符串参考 快乐 in 字典
php
similarity
R 忽略空值的矩阵列的成对比较
我有一个数组 我想获取它之间的相似度的度量values在每一列中 我的意思是我希望比较数组的成对列之间的行 并在它们的值匹配时增加一个度量 对于两列来说 所得的测量值最大值将完全相同 本质上我的问题与这里讨论的相同 R 两两比较矩阵中的所有
r
matrix
similarity
查找重复邮寄地址的策略
我正在尝试想出一种根据相似度分数查找重复地址的方法 考虑这些重复的地址 addr 1 3 FAIRMONT LINK SOUTH addr 2 3 FAIRMONT LINK S addr 3 5703 48TH AVE adrr 4 57
python
duplicates
streetaddress
similarity
mailing
显式语义分析
我遇到了这个术语 显式语义分析 它使用维基百科作为参考 找到文档中的相似性并将它们分类 如果我错了 请纠正我 我遇到的链接是here http www cs technion ac il gabr resources code esa es
Text
similarity
textmining
如何找到两条曲线之间的相似度以及相似度得分?
我有两个数据集 t y1 和 t y2 这些数据集在视觉上看起来相同 但它们存在一些时间延迟或幅度变化 我想找到两条曲线之间的相似度 对于近似相似的曲线给出相似度得分 1 对于不相似的曲线给出相似度得分 0 由于数据的波动 一些曲线似乎有所
MATLAB
TimeSeries
similarity
curves
检测不同分辨率下的图像相等性
我正在尝试构建一个脚本来浏览我的原始高分辨率照片 并替换我在拥有专业帐户之前上传到 Flickr 的旧的低分辨率照片 对于其中许多 我可以只使用 Exif 信息 例如拍摄日期 来确定匹配 但有些确实很旧 要么原始文件没有 Exif 信息 要
ruby
image
imageprocessing
ComputerVision
similarity
如何计算两个单词之间的相似度以检测它们是否重复?
我有两个单词 我想计算它们之间的相似度 以便对它们是否重复进行排名 如何使用深度学习 NLP 方法实现这一目标 这里有一些解决文本相似性的方法 基于字符串的方法 给定 2 个句子字符串计算余弦相似度 https stackoverflow
python
deeplearning
NLP
similarity
基于WordNet测量语义相似度,Brown Corpus有什么用
我遇到了几种使用 WordNet 的结构和层次结构来测量语义相似性的方法 例如Jiang and Conrath测度 JNC Resnik测度 RES 林测度 LIN 等 使用 NLTK 测量它们的方式是 sim2 wn jcn simil
NLP
similarity
WordNet
corpus
semanticanalysis
Python 相当于 R 的 cluster 包中的 daisy()
我有一个数据集 其中包含分类 名义和序数 和数字属性 我想使用这些混合属性来计算我的观察结果的 不 相似度矩阵 使用daisy http stat ethz ch R manual R patched library cluster htm
python
r
similarity
categoricaldata
rdaisy
两个数据集或数组之间的相似性
假设我有一个如下所示的数据集 A 1 B 3 C 6 D 6 我还有其他集合的列表来比较我的特定集合 A 1 B 3 C 6 D 6 A 2 B 3 C 6 D 6 A 99 B 3 C 6 D 6 A 5 B 1 C 6 D 9 A 4
Algorithm
correlation
similarity
Python + Sqlite 的字符串相似度(Levenshtein 距离/编辑距离)
Python Sqlite 中是否有可用的字符串相似性度量 例如使用sqlite3模块 用例示例 import sqlite3 conn sqlite3 connect memory c conn cursor c execute CREA
python
SQLite
stringcomparison
similarity
java 中的 PHP 相似文本()
你知道 PHP 的任何严格等效的实现吗相似文本 https www php net manual en function similar text phpJava 中的函数 这是我在java中的实现 package comwebndesig
Java
php
similarity
Pyspark:如何处理 python 用户定义函数中的空值
我想使用一些非 pyspark 原生的字符串相似性函数 例如数据帧上的 jaro 和 jaro winkler 度量 这些在 python 模块中很容易获得 例如jellyfish 对于没有的情况 我可以写 pyspark udf 很好nu
python
apachespark
PySpark
apachesparksql
similarity
相似图像 - 如何比较它们
我有超过 130 万张图像需要相互比较 并且每天都会添加数百张图像 我的公司拍摄图像并创建一个可供我们的供应商使用的版本 这些文件通常彼此非常相似 例如 两个不同的公司可以向我们发送两个不同的图像 一个 JPG 和一个 GIF 两者都带有麦
php
image
imageprocessing
similarity
Fingerprint
在 Django 模型中使用 Trigram (gin_trgm_ops) 创建 Gin 索引
django contrib postgres 的新 TrigramSimilarity 功能非常适合解决我遇到的问题 我用它作为搜索栏来查找难以拼写的拉丁名字 问题是名字超过 200 万个 搜索时间比我想要的要长 我想在三元组上创建一个索
python
django
postgresql
Indexing
similarity
根据另一个参考数组从一个数组中选择密切匹配
我有一个数组A和一个参考数组B 尺寸为A至少和B e g A 2 100 300 793 1300 1500 1810 2400 B 4 305 789 1234 1890 B实际上是指定时间信号中峰值的位置 并且A包含稍后时间的峰值位置
python
Arrays
MATLAB
NumPy
similarity
查找具有相似文本的文章的算法
我在数据库中有很多文章 带有标题 文本 我正在寻找一种算法来找到 X 个最相似的文章 例如当你提出问题时 Stack Overflow 的 相关问题 我尝试用谷歌搜索这个问题 但只找到了有关其他 相似文本 问题的页面 例如将每篇文章与所有其
string
Algorithm
Text
languageagnostic
similarity
计算一组集合之间的相似度
假设有4组 s1 1 2 3 4 s2 2 3 4 s3 2 3 4 5 s4 1 3 4 5 有没有一个标准的度量来表示这组4组的相似程度 感谢您对Jaccard方法的建议 然而 这似乎是成对的 如何计算整组集合的相似度 成对地 你可以计
Metrics
similarity
1
2
3
»