有人知道UAX #29, Unicode Text Segmentation的任何 JavaScript 实现吗?我对Word Boundaries特别感兴趣。
当我遇到XRegExp时,我充满希望,但它似乎使用了标准的 JavaScript 实现\b
。
有人知道UAX #29, Unicode Text Segmentation的任何 JavaScript 实现吗?我对Word Boundaries特别感兴趣。
当我遇到XRegExp时,我充满希望,但它似乎使用了标准的 JavaScript 实现\b
。
https://github.com/orling/grapheme-splitter是UAX #29 Grapheme Cluster Boundaries的纯 js 实现。
还有一个关于使用 UAX #29 实现 Intl.Segmenter 的 ES 提案,请参阅https://github.com/tc39/proposal-intl-segmenter。
https://www.npmjs.com/package/node-word-boundaries是其中之一,但对于一些 unix 原生 unicode 库,它需要 Node;它不是纯js。