我正在使用srvk/eesen-transcriber存储库来转录一些音频文件,并且我已经在我的 Vagrant 虚拟机上按预期启动并运行了所有内容。
我希望能够用 Linux、Laravel 或 MySQL 之类的词转录非常技术性的录音,这些词不能很好地转录。我将如何(轻松地)将这些单词添加到转录软件中,以便在说出时成功识别它们?
更新
我试图按照 Nikolay Shmyrev 在这里找到的建议进行操作:
http://speechkitchen.org/kaldi-language-model-building/
run_adapt.sh
添加新词汇后我可以成功运行脚本newwords.txt
,但是当我尝试使用更新的语言模型用新词汇转录音频文件时,它无法识别新词汇。
这是我尝试遵循有关如何调整语言模型的指示的视频: