试图找到一个包来转换我的来自 Amazon AWS Transcribe 服务的 json 响应,但没有成功。
您可以在 Fiddle 的 JavaScript 部分中看到一个示例JSON
。
我不想采取幼稚的方法,只是将 10 个单词“捆绑”在一起,因为这会以一种奇怪的方式分隔标题。
我什至会接受使用 Google Speech 服务或 Speechmatics 的编程方式。它们都返回一个按单词分解的 json 文件。
以前有人用过吗?
谢谢!
试图找到一个包来转换我的来自 Amazon AWS Transcribe 服务的 json 响应,但没有成功。
您可以在 Fiddle 的 JavaScript 部分中看到一个示例JSON
。
我不想采取幼稚的方法,只是将 10 个单词“捆绑”在一起,因为这会以一种奇怪的方式分隔标题。
我什至会接受使用 Google Speech 服务或 Speechmatics 的编程方式。它们都返回一个按单词分解的 json 文件。
以前有人用过吗?
谢谢!
您可能已经找到了一种方法来做到这一点或创建了一个脚本。我还尝试找到一些现成的解决方案,因此最终编写了一些 JavaScript 代码来从 Amazon Transcribe 的 JSON 输出生成 SRT。
https://www.yash.info/aws-srt-creator.htm
我在句号 (.) 处断句。它是一个独立的 HTML 文件。随意下载并根据需要进行修改。
我使用了来自 github 的这个 python 脚本,它的格式非常好,可以转换为 docx 格式。输出甚至包括单词置信度的散点图以及将颜色更改为较低置信度的单词。
https://github.com/kibaffo33/aws_transcribe_to_docx
这对我来说非常有效,但我认为如果你想改变 python 脚本,你可以很简单地把这个转到 html。
受到yash 回答的启发,我接受了它并做了一些小改动。随意使用它。
https://apoorv.blog/aws-transcribe-json-to-srt.html
我个人将此工具用于我自己的目的,因此希望保持更新。
我为此目的构建了一个 Web 应用程序(查看和编辑 aws 转录 JSON 文件):https ://scription.app
它分离扬声器,突出低置信度单词并将文本链接到音频播放(如果您加载音频文件)。它仍然是一个测试版,但希望对看到这篇文章的人有所帮助!
这是一个简单的实用程序脚本,我发现它可以将 Amazon Transcribe .json 脚本转换为更易读的脚本
我最终创建了一个 Bash 脚本来将 AWS Transcribe JSON 文件转换为 SRT。
它使用“jq”来解析 JSON 文件。
这里有一些东西(aws-transcribe-to-vtt
)但我还没有能够测试它......
我遇到了这个答案,并且也在寻找它一段时间,通过使用其他一些链接中显示的一些信息 - 接近了我可以使用的东西,但没有得到确切的答案,我决定完成解决方案。
第 1 步 - 获取一个 HTML 模板来处理文本块和扬声器名称,并按下按钮来处理 javascript 第 2 步 - 将从 Aws 接收到的 json 粘贴到文本块第 3 步 - 单击按钮。
Html 页面可以在这里找到:https ://js.do/lnortje_gmail-com/amazon-transcribe-to-html-converter
我发现有用的一件事是了解翻译的可信度 - 使用它有助于了解翻译中可能存在的问题,并显示翻译的确切时间允许您去那个地方录音。
好吧,使用它并享受它,有一天可能会帮助某人:)
这是您可能可以使用的要点。或者让您了解需要什么。基本上我最终做了什么。 https://gist.github.com/mwleinad/67a39d7d723f0a2ed076ed2485e098ae