0

我正在为聋儿学习泰语进行申请。该应用程序为他们提供了一些基本单词(1 或 2 个音节),用于练习发音和反馈单词的可理解程度。所以我专注于可理解性,而不是卓越。

我在这个领域很新。现在,我正在使用语音转文本技术,它正是谷歌的云语音转文本。由于它是语音识别,所以它提供了可能的最终匹配词。然而,自然而然,聋儿会发好元音而不是辅音。有时元音是正确的,但辅音对于发音的单词来说并不完全正确,这在某种程度上是可以理解的,语音识别不会提供任何帮助。我希望该应用程序提供可懂度方面的反馈,这也可以告诉他们哪些发音的音素是正确的,哪些是错误的。所以语音到文本技术不太适合这个应用程序,我正在寻找使用语音中的音素检测在可理解性方面的发音评估。

根据我的研究,我发现这项工作与我想要的非常相似,但我不知道如何为泰语实现它。

因此,请任何人指导我如何从话语中检测音素并根据可理解性评估它们,或者对其他更好的方法提出任何建议。移动应用程序(Android、iOS)的离线解决方案更可取。

4

1 回答 1

0

对于泰语,您只需使用泰语声学模型,其他一切都是一样的。

实际服务和文档的代码在这里:

https://github.com/brijmohan/proneval-service

于 2019-08-24T22:36:12.520 回答