有没有Collator
与MySQL的utf8_general_ci具有相同特征的实现?我需要一个不区分大小写的整理器不区分德语元音变音如ä
与元音a
.
背景:
我们最近遇到了一个错误,该错误是由表中的错误排序规则引起的。使用的排序规则是utf8_general_ci
where utf8_bin
将是正确的。特定的列有一个唯一的索引。这utf8_general_ci
排序规则不区分单词,例如pöker
and poker
,因此行被合并,这是不希望的。
我现在需要一种方法来为我们的 Java 应用程序实现一个模块,该模块可以修复错误的行。
您可以使用以下整理器:
Collator collator = Collator.getInstance();
collator.setStrength(Collator.PRIMARY);
具有这种实力的整理者在比较过程中只会考虑主要差异。
考虑一个例子:
System.out.println(compare("abc", "ÀBC", Collator.PRIMARY)); //base char
System.out.println(compare("abc", "ÀBC", Collator.SECONDARY)); //base char + accent
System.out.println(compare("abc", "ÀBC", Collator.TERTIARY)); //base char + accent + case
System.out.println(compare("abc", "ÀBC", Collator.IDENTICAL)); //base char + accent + case + bits
private static int compare(String first, String second, int strength) {
Collator collator = Collator.getInstance();
collator.setStrength(strength);
return collator.compare(first, second);
}
输出是:
0
-1
-1
-1
查看这些链接以获取更多信息:
http://www.javapractices.com/topic/TopicAction.do?Id=207 http://www.javapractices.com/topic/TopicAction.do?Id=207
https://docs.oracle.com/javase/7/docs/api/java/text/Collator.html#PRIMARY https://docs.oracle.com/javase/7/docs/api/java/text/Collator.html#PRIMARY
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)