我正在尝试比较两个来源的数据。
ORIG Kick-Ass: Music From The Motion Picture
ALT Kick-A*s (Music from the Motion Picture)
ALT Kick-Ass: (Music from the Motion Picture)[Explicit]
ALT Kick-Ass: A dedication
ALT 1 ALT 2 和 ORIG 是相同的匹配。 ALT 3 是虚拟结果。
我需要验证它们是否匹配,PHP 库中是否有可用的方法。
我正在考虑使用 count_chars 来计算每个单独的字符,然后使用百分比匹配来比较 ORIG 字符串。但是,如果标题很短,效果就不太好。
你有什么想法我可以验证它们是否匹配吗?
Cheers,
J
嗯,总有编辑距离 http://en.wikipedia.org/wiki/Levenshtein_distance,但我不确定这最终对您有多大用处。
可能值得一试 http://php.net/manual/en/function.levenshtein.php, 尽管。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)