我们都在谷歌中看到过,如果我们输入查询并输入错误,谷歌会建议一个更清晰的查询版本(通常是正确的)。现在他们是怎么做到的呢?我能想到的一种可能的方法是找出距给定字符串编辑距离为 1 的所有其他字符串,如果其中任何一个返回具有更高值“searched”属性的字符串(可能来自后端数据库,如果每个索引查询术语都有一个与其关联的权重(基于该术语在查询中出现的频率)而不是给定字符串,则建议使用该字符串。如果没有找到,则搜索编辑距离为 2 的字符串,依此类推,直到 5 处,SE 判定可能是该字符串is用户要查找的内容,并返回相应的搜索结果。
现在是否有可能从给定字符串中查找给定编辑距离处的字符串?这个过程的效率如何?有什么很酷的算法可以做到这一点吗?
Peter Norvig 有一篇有趣的文章“如何编写拼写纠正器 http://norvig.com/spell-correct.html” 谈论“你的意思是”如何发挥作用
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)