使用 Java 分割日语文本的最佳方法是什么?
例如,对于以下文本:
こんにちは。私の名前はオバマです。私はアメリカに行く。
我需要以下输出:
こんにちは
私の名前はオバマです
私はアメリカに行く
可以使用黑字吗?
您可以使用java.text.BreakIterator。
String TEXT = "こんにちは。私の名前はオバマです。私はアメリカに行く。";
BreakIterator boundary = BreakIterator.getSentenceInstance(Locale.JAPAN);
boundary.setText(TEXT);
int start = boundary.first();
for (int end = boundary.next();
end != BreakIterator.DONE;
start = end, end = boundary.next()) {
System.out.println(TEXT.substring(start, end));
}
该程序的输出是:
こんにちは。
私の名前はオバマです。
私はアメリカに行く。
您不能使用 Kuromoji 来查找日语句子边界。它可以将句子分成单词。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)