归一化编辑距离公式解释

2024-01-05

基于本文： IEEE PAITERN 分析交易：归一化编辑距离的计算及应用本文归一化编辑距离 http://www.csie.ntu.edu.tw/~b93076/Computation%20of%20Normalized%20Edit%20Distance%20and%20Applications.pdf如下：

给定有限字母表上的两个字符串 X 和 Y，标准化编辑 X 和 Y 之间的距离，d( X , Y ) 定义为 W( P )/L(P)w，这里P是X和Y之间的编辑路径，W(P)是 P 的基本编辑操作的权重之和，以及 L(P) 是这些操作的数量（P 的长度）。

我可以安全地将上面解释的标准化编辑距离算法翻译为：

normalized edit distance = 
levenshtein(query 1, query 2)/max(length(query 1), length(query 2))

您可能误解了该指标。有两个问题：

标准化步骤是划分W(P)这是编辑过程的权重L(P)，这是编辑过程的长度，而不是像您那样超过字符串的最大长度；
此外，论文还表明（示例 3.1）归一化编辑距离不能简单地用编辑距离来计算。您可能需要实现他们的算法。

例3.1(c)的解释：

From aaab to abbb，论文使用了以下变换：

match a with a;
skip a在第一个字符串中；
skip a在第一个字符串中；
skip b在第二个字符串中；
skip b在第二个字符串中；
匹配决赛bs.

这是 6 个操作，这就是为什么L(P)是 6；从 (a) 中的矩阵来看，匹配的成本为 0，跳过的成本为 2，因此我们的总成本为0 + 2 + 2 + 2 + 2 + 0 = 8，这正是W(P), and W(P) / L(P) = 1.33。 (b) 可以获得类似的结果，我将其留给您作为练习:-)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

归一化编辑距离公式解释的相关文章

将嵌套字典中的所有键从camelCase转换为snake_case

我有一本类似这样的字典 firstName abc lastName xyz favoriteMovies Star Wars The lone ranger favoriteCountries country China capitalC
非法转义字符“\”

我想在链接末尾获取名称所以我这样做了 if invName substring j k equals copyf invName substring 0 j Eclipse 说字符串文字没有用双引号正确关闭如何将字符串与此字符进行比较
以点作为分隔符分割字符串

我想知道我是否要在一个字符串上分割字符串正确的方式我的代码是 String fn filename split return fn 0 我只需要字符串的第一部分这就是我返回第一项的原因我问这个是因为我在 API 中注意到意味着任何
通过分布式数据库聚合作业优化网络带宽

我有一个分布式联合数据库结构如下数据库分布在三个地理位置节点每个节点集群有多个数据库关系数据库是 PostgreSQL MySQL Oracle 和 MS SQL Server 的混合体非关系数据库是 MongoDB 或 Ca
codePointAt 和 charCodeAt 之间的区别

有什么区别String prototype codePointAt and String prototype charCodeAt 在 JavaScript 中 A codePointAt 65 A charCodeAt 65 从 MDN
确定解决迷宫问题的最小线段数

我有一个问题我需要定义一个具有最少数量的顶点的多边形该多边形与不透明的图像中的每个像素相交或包含每个像素令 N 为图像中的像素数我唯一的假设是图像的边界孔内不能包含透明像素并且至少有两个像素是不透明的举个例子假设我有以下图
液体字符串中的转义字符

我正在尝试将包含各种尺寸的标签列表放在一起在 Shopify 中使用 Liquid 尺寸使用单引号和双引号表示英寸和英尺因为它同时使用两者所以会导致字符串正确关闭的问题我尝试过使用标准转义字符但这似乎不起作用是否可以在 Liqu
如何在 C++ 中对静态缓冲区执行字符串格式化？

我正在处理一段对性能要求非常高的代码我需要执行一些格式化的字符串操作但我试图避免内存分配甚至是内部库的内存分配在过去我会做类似以下的事情假设是 C 11 constexpr int BUFFER SIZE 200 char bu
如何用C++解析复杂的字符串？

我试图弄清楚如何使用解析这个字符串sstream 和C 其格式为 string int int 我需要能够将包含 IP 地址的字符串的第一部分分配给 std string 以下是该字符串的示例 std string 127 0 0 1 1
每第 n 个字符分割一个字符串

在 JavaScript 中这就是我们如何在每 3 个字符处分割一个字符串 foobarspam match 1 3 g 我正在尝试弄清楚如何在 Java 中做到这一点有什么指点吗你可以这样做 String s 1234567890
为什么你可以在字符串上重载 __radd__ 而不是 __rmod__ ？

在Python中您可以覆盖右和左加法运算符
如何快速防止标签中出现孤儿？

我有一个可以有一两行的标签如果它有两行我希望第二行至少有两个或者可能三个单词而不仅仅是一个关于如何使用 swift 实现这一点有什么想法吗提前致谢 Daniel 编辑我删除了我愚蠢的第一个想法这些想法并没有真正的帮助好吧
检查子字符串是否在字符串列表中？

我之前已经找到了这个问题的一些答案但它们对于当前的Python版本来说似乎已经过时了或者至少它们对我不起作用我想检查字符串列表中是否包含子字符串我只需要布尔结果我找到了这个解决方案 word to check or wordlis
Karasuba算法递归过多

我正在尝试用 c 实现 Karasuba 乘法算法但现在我只是想让它在 python 中工作这是我的代码 def mult x y b m if max x y lt b return x y bm pow b m x0 x bm x1
从三点求圆心的算法是什么？

我在圆的圆周上有三个点 pt A A x A y pt B B x B y pt C C x C y 如何计算圆心在Processing Java 中实现它我找到了答案并实施了一个可行的解决方案 pt circleCenter pt A
将字符串中的“奇怪”字符转换为罗马字符

我需要能够将用户输入仅转换为 a z 罗马字符不区分大小写所以我感兴趣的角色只有26个然而用户可以输入他们想要的任何形式的字符西班牙语 n 法语 e 和德语 u 都可以包含用户输入中的重音符号这些重音符号会被程序删除我已
数组中连续元素的最大乘积

我在现场面试的时候被问到了这个算法问题由于没有要求我签署保密协议我将其发布在这里寻求答案给定一个数组REAL不包含 0 的数字找到产生最大乘积的连续元素该算法应在线性时间内运行我考虑过以下方法使用两个数组第一个是利用DP思想
如何从 PHP 中的字符串创建可能的字符串组合？

如何从 PHP 中的字符串创建可能的字符串组合 Exp input abc output array 0 gt a 1 gt ab 2 gt abc 3 gt ac 4 gt acb 5 gt b 6 gt ba 7 gt bac 8 gt
0-1背包算法

以下 0 1 背包问题是否可解浮动正值和浮动权重可以是正数或负数背包的浮动容量 gt 0 我平均有这是一个相对简单的二进制程序我建议用蛮力进行修剪如果任何时候你超过了允许的重量你不需要尝试其他物品的组合你可以丢弃整
如何使用 PHP 查找字符串中字符的序列模式？

假设我有随机的文本块 EAMoAAQAABwEBAAAAAAAAAAAAAAABAgMFBgcIBAkBAQABBQEBAAAAAAAAAAAAAAAGAgMEBQcBCBAAAQMDAgMEBQcIBQgGCwEAAQACAxEEBSEG

随机推荐

openerp：ubuntu 上的内部服务器错误

我刚刚在我的系统中安装了新的 OpenERP 8 0 替换了 Ubuntu 12 04 上现有的 OpenERP 7 0 我已经在家里的 Ubuntu 笔记本电脑上下载了这个它运行得很好并且想在我的办公室服务器上做同样的事情我采取的步
STL 是否包含哈希表？ [复制]

这个问题在这里已经有答案了可能的重复 C 中的哈希表 https stackoverflow com questions 133569 hashtable in c 有人可以提供一个简单的 C hash map 示例吗 https sta
丢失的 ;在 for 循环初始化程序之后

var nodeWordsString document getElementById nodeWordsTextArea value trim var nodeWordsStringArray nodeWordsString split
在 mac el Capitan 上将 Brew 降级到之前版本 (opencv3/3.0.0)

我在 mac 上并使用过brew安装opencv3 我有 opencv3 3 0 0 今天我更新了它并获得了版本3 1 0 1 但是此更新破坏了一切当我尝试使用 VideoCapture 读取帧并使用 waitKey 函数时它会因以
如何从`MoyaError`获取错误状态代码？

我正在使用一个Moya Moya ModelMapper and RxSwift执行网络请求这是我的示例代码 let provider RxMoyaProvider
如何使用 Realm 查询随机项目

我只是好奇有没有办法从 Realm 查询随机项目我需要从我的领域中获取 4 件随机物品一件指定了 ID 的特定物品 Edit 我不知道 Realm 中有获取随机对象的方法但您可以按照下面的描述进行操作一种方法是查询所有对象然后生成
使用 C# 将光标移动到 MsWord 中文本的末尾？

这个问题听起来可能很简单但我无法找到任何解决方案我想做的是将MsWord中的光标位置移动到文本末尾我的代码如下 object StartPos 0 object Endpos 1 Microsoft Office Interop Wo
如何使用 casperJS 等待 socket.io 连接返回数据？

我正在抓取一个使用 socket io 填充一些选择标签选项的页面在评估页面之前如何等待套接字接收数据我在用casperJS http casperjs org 套接字代码由目标站点加载 socket on list function
导入错误：没有名为“Cython”的模块

我正在尝试做from Cython Build import cythonize我收到消息ImportError No module named Cython 但是我用命令安装了Pythonpip install Cython 怎么了 Py
scapy 十六进制转储()

我想知道哪个hexdump scapy 使用因为我想修改它但我根本找不到任何东西我发现的是 def hexdump self lfilter None for i in range len self res p self elt2pk
Linux 上的 Java BlockingQueue 延迟较高

我正在使用 BlockingQueue s 尝试 ArrayBlockingQueue 和 LinkedBlockingQueue 在我当前正在处理的应用程序中的不同线程之间传递对象在此应用程序中性能和延迟相对重要因此我很好奇使用 B
检查 JSON 和 XML 是否有效？ C＃

我使用 newtonsoft json nethttp json codeplex com http json codeplex com 我想知道如何验证 json 和 xml 是否有效 json xml 我如何验证这一点您想要在服务器
如何在双引号字符串中使用对象的属性？

我有以下代码 DatabaseSettings NewDatabaseSetting select DatabaseName DataFile LogFile LiveBackupPath NewDatabaseSetting Databa
Qt中有进程内本地管道吗？

Qt 有没有QIODevice适合的一对intra 处理点对点通信人们可以使用混凝土QTCPSocket or QLocalSocket 但是服务器端连接API有点麻烦而且强制数据通过OS似乎很浪费以下是一个可用的基本实现它使用内部
将 UILabel 高度设置为 0

是否可以通过编程方式设置 UILabel 的高度我在 Xib 文件中添加了一系列约束因此每个其他标签都依赖于其上方或下方的标签来定位如果我可以使用它会让我的生活变得更轻松 nameLabel height 0 我的 Xib 看起来像
设置HttpClient的授权头

我有一个用于 REST API 的 HttpClient 但是我在设置授权标头时遇到问题我需要将标头设置为执行 OAuth 请求时收到的令牌我看到一些 NET 代码表明以下内容 httpClient DefaultRequestHead
如何使 COMReference 在 Azure CI/CD 管道中工作

我在我的项目中使用了一个 dll 它被添加到我的项目文件中作为COMReference喜欢关注
使用带有 $ 的逻辑向量对数据帧进行子集化

我无法理解使用原因 and behavior of the 子集 a 中的符号data frame下面的例子是在我正在参加的初学者课程中提出的不是现场教授所以不能在那里询问 temp mat lt matrix 1 9 nrow 3 c
如何使用嵌套的 NSDate 属性将 Realm 对象转换为 JSON？

我有一个带有多个嵌套的嵌套 Realm 对象NSDate嵌套对象中的属性我在用这个答案 https stackoverflow com questions 32023249 how can i convert a realm object
归一化编辑距离公式解释

基于本文 IEEE PAITERN 分析交易归一化编辑距离的计算及应用本文归一化编辑距离 http www csie ntu edu tw b93076 Computation 20of 20Normalized 20Edit 20Dis

归一化编辑距离公式解释

归一化编辑距离公式解释 的相关文章

随机推荐

热门标签

归一化编辑距离公式解释的相关文章