在尝试让 Speech to Text(IBM Voice Gateway IVR 应用程序)识别字母数字字符串时,我想知道是否可以创建一个自定义语法或实体,将 STT 限制为仅识别单个字母和数字,完全不包括单词。例如,这是一个典型的字符串:20Y0H8C。Watson 会返回单词和数字,例如“two”而不是“2”。数字字符串工作正常。我意识到字母识别对于典型的 ASR 来说是有问题的,但我希望 Watson 能够胜任这项任务。我注意到没有字母数字字符的系统实体。任何建议都非常感谢。
1055 次
1 回答
2
在这种情况下,设置smart_formatting
为true
。
smart_formatting 参数将日期、时间、数字和数字系列、电话号码、货币价值和 Internet 地址转换为识别请求的最终记录中的更传统的表示形式。转换使转录本更具可读性,并能够更好地对转录结果进行后处理。您将参数设置为 true 以启用智能格式化,如下例所示;默认情况下,该参数为 false,不执行智能格式化。
查看:
curl -X POST -u {username}:{password}
--header "Content-Type: audio/flac"
--data-binary @{path}audio-file.flac
"https://stream.watsonplatform.net/speech-to-text/api/v1/recognize?smart_formatting=true"
结果:
声音:数量是一百万一百零一
结果:数量为 1000101
检查 IBM 官方文档。
注意:智能格式化功能目前是测试版功能,仅适用于美国英语。
于 2017-06-14T17:33:59.730 回答