我正在尝试逐字分隔一个句子,但使用 JavaScript 似乎是一项非常艰巨的任务。我不能简单地通过查看空格来分隔句子。因为有些语言(泰语、中文、日语等)不使用空格来分隔单词。因此,基于字典的算法似乎是可行的方法。但是,字典很大,我试图在客户端上分离句子。
Java 有一个BreakIterator类,它允许您遍历句子中的单词。这正是我需要的,但 JS 没有相同的功能。Chrome 有Intl.v8BreakIterator但我正在寻找适用于所有主要浏览器的解决方案。
有一个提案Intl.Segmenter可以解决这个问题。它基本上是 Javascript 上的BreakIterator。但它还没有发布。
如果有办法,你能指出我正确的方向吗?