2

我正在尝试逐字分隔一个句子,但使用 JavaScript 似乎是一项非常艰巨的任务。我不能简单地通过查看空格来分隔句子。因为有些语言(泰语、中文、日语等)不使用空格来分隔单词。因此,基于字典的算法似乎是可行的方法。但是,字典很大,我试图在客户端上分离句子。

Java 有一个BreakIterator类,它允许您遍历句子中的单词。这正是我需要的,但 JS 没有相同的功能。Chrome 有Intl.v8BreakIterator但我正在寻找适用于所有主要浏览器的解决方案。

有一个提案Intl.Segmenter可以解决这个问题。它基本上是 Javascript 上的BreakIterator。但它还没有发布。

如果有办法,你能指出我正确的方向吗?

4

1 回答 1

0

看来您可能必须使用扩展运算符:

const text = '中國是最古老的文明';
const splitString = [...text];
console.log(splitString);

但话又说回来,我不太确定这是否是你想要做的,因为我不确定中文/字符的含义/阅读。但我不久前在某个地方读到了这个。

于 2020-10-21T14:18:41.913 回答