我有两个包含用户名的列表,我想计算 Jaccard 相似度。是否可以?
This https://stackoverflow.com/questions/11911252/python-jaccard-distance-using-word-intersection-but-not-character-intersection线程显示了如何计算两个字符串之间的杰卡德相似度,但是我想将其应用于两个列表,其中每个元素都是一个单词(例如,用户名)。
毕竟我最终编写了自己的解决方案:
def jaccard_similarity(list1, list2):
intersection = len(list(set(list1).intersection(list2)))
union = (len(set(list1)) + len(set(list2))) - intersection
return float(intersection) / union
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)