1

我的目标是将东南亚文本分解成单词,最好是在浏览器中。虽然这对于使用正则表达式或简单地分割空格的西方语言来说是微不足道的,但对于某些脚本来说这是一个更棘手的问题。例如在这一行中找到单词边界:

เขาสามารถทำในสิ่งที่ต้องการต่อไปได้

但是,现代浏览器确实会检测单词边界。这可以通过双击上面的文本来观察。只有行内的单词被突出显示,而不是整个块。从我目前的研究来看,这个词的边界确定是由每个平台上的本地库完成的。是否可以通过 JavaScript 获得这些分词边界?

4

0 回答 0