如何从列表中删除相似的字符串? [关闭]

2024-03-12

从列表中删除相似字符串的有效方法是什么?

考虑一个List<string>由这些(和其他)字符串组成:

“SRS 投资管理有限公司”

“SRS投资管理”

“枫叶资本有限公司”

“枫林资本有限公司”

所以我需要做的是删除“足够相似”的字符串。我的想法是,这应该通过将列表中的所有字符串大写,然后删除与另一个字符串的最后 X 个字符之外的所有字符匹配的任何字符串来完成。最后,我希望这给我留下一个列表,其中仅包含他们实际代表的每个现实生活公司的一个字符串。

关于如何实现这一目标有什么想法吗?


您可以首先创建一个例程,用完整的单词替换明显的缩写,然后删除空格。好消息是公司注册处对公司名称有非常严格的规定。例如,如果“Band C Ltd”已经存在,则您不能拥有名为“B & C Ltd”的公司。 之后,您将需要开始考虑匹配算法,例如 Levenshteins 和 Soundex。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何从列表中删除相似的字符串? [关闭] 的相关文章

随机推荐