android - 发音评估的音素检测

Question

我正在为聋儿学习泰语进行申请。该应用程序为他们提供了一些基本单词（1 或 2 个音节），用于练习发音和反馈单词的可理解程度。所以我专注于可理解性，而不是卓越。

我在这个领域很新。现在，我正在使用语音转文本技术，它正是谷歌的云语音转文本。由于它是语音识别，所以它提供了可能的最终匹配词。然而，自然而然，聋儿会发好元音而不是辅音。有时元音是正确的，但辅音对于发音的单词来说并不完全正确，这在某种程度上是可以理解的，语音识别不会提供任何帮助。我希望该应用程序提供可懂度方面的反馈，这也可以告诉他们哪些发音的音素是正确的，哪些是错误的。所以语音到文本技术不太适合这个应用程序，我正在寻找使用语音中的音素检测在可理解性方面的发音评估。

根据我的研究，我发现这项工作与我想要的非常相似，但我不知道如何为泰语实现它。

因此，请任何人指导我如何从话语中检测音素并根据可理解性评估它们，或者对其他更好的方法提出任何建议。移动应用程序（Android、iOS）的离线解决方案更可取。

score 0 · Accepted Answer

对于泰语，您只需使用泰语声学模型，其他一切都是一样的。

实际服务和文档的代码在这里：

https://github.com/brijmohan/proneval-service

android - 发音评估的音素检测

1 回答 1

Related

Reference