请看以下内容。
String[]sentenceHolder = titleAndBodyContainer.split("\n|\\.(?!\\d)|(?<!\\d)\\.");
这就是我尝试将段落拆分为句子的方式。但有个问题。我的段落包括日期之类Jan. 13, 2014
的、单词之类的U.S
和数字之类的2.2
。他们都被上面的代码分开了。所以基本上,无论是否是句号,这段代码都会分割很多“点”。
我也试过String[]sentenceHolder = titleAndBodyContainer.split(".\n");
了String[]sentenceHolder = titleAndBodyContainer.split("\\.");
。都失败了。
如何“正确”地将段落拆分为句子?