1

使用 Java BreakIterator,我能够从字符串中提取单词。但是,给定以下使用括号表示单词可以是复数的字符串,括号被识别为它们自己的单词。

String test = "Please enter the number of dependent(s).";

BreakIterator iterator = BreakIterator.getWordInstance(Locale.US);
iterator.setText(test);

int start = iterator.first();
for (int end = iterator.next(); end != BreakIterator.DONE; start = end, end = iterator.next()) {
    System.out.println(test.substring(start, end));
}

输出:

Please
 
enter
 
the
 
number
 
of
 
dependent
(
s
)
.

当我期望:

Please
 
enter
 
the
 
number
 
of
 
dependent(s)
.

是否可以使用中断迭代器的自定义实现,以便实际上将具有“可选复数”的单词视为一个单词?

4

0 回答 0