使用 Java BreakIterator,我能够从字符串中提取单词。但是,给定以下使用括号表示单词可以是复数的字符串,括号被识别为它们自己的单词。
String test = "Please enter the number of dependent(s).";
BreakIterator iterator = BreakIterator.getWordInstance(Locale.US);
iterator.setText(test);
int start = iterator.first();
for (int end = iterator.next(); end != BreakIterator.DONE; start = end, end = iterator.next()) {
System.out.println(test.substring(start, end));
}
输出:
Please
enter
the
number
of
dependent
(
s
)
.
当我期望:
Please
enter
the
number
of
dependent(s)
.
是否可以使用中断迭代器的自定义实现,以便实际上将具有“可选复数”的单词视为一个单词?