我想使用 Speech to Text Azure 服务来翻译 AudioSource 对象的音频(剪辑)。怎么做?
2 回答
0
从当前的语音 SDK 示例中,我建议您先查看以下示例
它使用带有 Unity 麦克风的 AudioSource。您需要做的是修改麦克风部分以从文件中读取,并将 SpeechRecognizer 替换为 TranslationRecognizer。
我们将来会为更多样本工作,如果这有帮助,请告诉我们。
于 2020-09-03T19:50:15.897 回答
0
根据您提供的信息,我假设您希望捕获 AudioSource 对象的输出并将其发送到 Azure 服务进行翻译。
对于自定义音频源配置 - 您可以使用PullAudioInputStream / PushAudioInputStream。在这种情况下,您将不得不截取输出音频 - 将其发送到 SDK - 再发送到 azure 服务。
遇到这些帖子,您可以将其用作参考:
- https://github.com/Azure-Samples/cognitive-services-speech-sdk/issues/95
- 自定义音频输入字节到 Python 中的 Azure 认知语音翻译服务
或者
您可以使用 SDK 进行统一
这里的示例将引导您完成
- 语音识别同时翻译多种语言。
于 2020-08-26T06:41:44.360 回答