json - 如何将 Amazon Transcribe json 响应转换为字幕格式（srt、webvvt 等）？

Question

试图找到一个包来转换我的来自 Amazon AWS Transcribe 服务的 json 响应，但没有成功。

我不想采取幼稚的方法，只是将 10 个单词“捆绑”在一起，因为这会以一种奇怪的方式分隔标题。

我什至会接受使用 Google Speech 服务或 Speechmatics 的编程方式。它们都返回一个按单词分解的 json 文件。

以前有人用过吗？

谢谢！

score 8 · Accepted Answer

您可能已经找到了一种方法来做到这一点或创建了一个脚本。我还尝试找到一些现成的解决方案，因此最终编写了一些 JavaScript 代码来从 Amazon Transcribe 的 JSON 输出生成 SRT。

我在句号 (.) 处断句。它是一个独立的 HTML 文件。随意下载并根据需要进行修改。

score 3 · Accepted Answer

我使用了来自 github 的这个 python 脚本，它的格式非常好，可以转换为 docx 格式。输出甚至包括单词置信度的散点图以及将颜色更改为较低置信度的单词。

这对我来说非常有效，但我认为如果你想改变 python 脚本，你可以很简单地把这个转到 html。

score 1 · Accepted Answer

受到yash 回答的启发，我接受了它并做了一些小改动。随意使用它。

我个人将此工具用于我自己的目的，因此希望保持更新。

score 0 · Accepted Answer

我为此目的构建了一个 Web 应用程序（查看和编辑 aws 转录 JSON 文件）：https ://scription.app

它分离扬声器，突出低置信度单词并将文本链接到音频播放（如果您加载音频文件）。它仍然是一个测试版，但希望对看到这篇文章的人有所帮助！

score 0 · Accepted Answer

这是一个简单的实用程序脚本，我发现它可以将 Amazon Transcribe .json 脚本转换为更易读的脚本

score 0 · Accepted Answer

我最终创建了一个 Bash 脚本来将 AWS Transcribe JSON 文件转换为 SRT。

它使用“jq”来解析 JSON 文件。

score 0 · Accepted Answer

0

于 2018-05-25T10:05:42.357 回答

score 0 · Accepted Answer

我遇到了这个答案，并且也在寻找它一段时间，通过使用其他一些链接中显示的一些信息 - 接近了我可以使用的东西，但没有得到确切的答案，我决定完成解决方案。

第 1 步 - 获取一个 HTML 模板来处理文本块和扬声器名称，并按下按钮来处理 javascript 第 2 步 - 将从 Aws 接收到的 json 粘贴到文本块第 3 步 - 单击按钮。

我发现有用的一件事是了解翻译的可信度 - 使用它有助于了解翻译中可能存在的问题，并显示翻译的确切时间允许您去那个地方录音。

好吧，使用它并享受它，有一天可能会帮助某人:)

score 0 · Accepted Answer

这是您可能可以使用的要点。或者让您了解需要什么。基本上我最终做了什么。 https://gist.github.com/mwleinad/67a39d7d723f0a2ed076ed2485e098ae

9 回答 9