2

使用示例代码转录对话,但在识别事件时我总是$ref$在调用时得到e.Result.UserId

我对语音签名使用 16 位样本、16 kHz 采样率和单通道(单声道)格式。以及用于转录对话的 32 位样本、32 kHz 采样率和单通道(单声道)格式。

所有代码来自:https ://docs.microsoft.com/en-us/azure/cognitive-services/speech-service/how-to-use-conversation-transcription-service

有什么想法吗?或我可以使用的 .wav 示例文件?

UPD

似乎音频格式不正确。应该是 16 位,16kHZ,8 通道(立体声左=1,立体声右=2,单声道=3,单声道=4,单声道=5,单声道=6,单声道=7,静音单声道=8)。

在这里您可以找到enrollment_audio_steve.wav、enrollment_audio_katie.wav 和对话katiesteve.wav。它的格式正确。但是它不允许从enrollment_audio_katie.wav 创建签名。所以它与史蒂夫一起工作。

它似乎仍然只适用于 SpeechSDK 设备。但我能够根据这种格式录制自己的音频。

4

0 回答 0