我想做一个语音到文本分析的项目,我想 1)说话者识别 2)说话者分类 3)语音到文本。现在,我正在测试为 Microsoft、Google、AWS、IBM 等各种公司提供的各种 API,我可以在 Microsoft 中找到您可以选择用户注册和说话者识别 ( https://cognitivewuppe.portal.azure-api.net/ docs/services/563309b6778daf02acc0a508/operations/5645c3271984551c84ec6797)但是,所有其他平台都具有说话人分类功能,但没有说话人识别功能。在演讲者分类中,如果我理解正确,它将能够“区分”用户,但除非我不注册他们,否则它将如何识别?我只能找到 azure 中可用的注册选项
但我想确定一下,所以只想在这里检查一下,也许我正在查看正确的文档,或者也许有其他方法可以在 Google Cloud、Watson 和 AWS 转录中实现这一目标。如果是这样的话,你们可以帮我解决这个问题吗