问题标签 [amazon-polly]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
600 浏览

python - 如何在不保存文件的情况下将 .mp3 文件从 Amazon Polly 文本播放到语音

我正在使用 Amazon Polly 进行文本转语音,但我不想将转换后的文件保存到检索它的 PC 上。相反,我想将其作为流播放。

我已经使用过playsound,但它不适用于返回的变量。

0 投票
1 回答
418 浏览

amazon-web-services - 使用 NodeJs 从 Amazon Polly 获取语音标记

我正在做一个动画项目,为我的角色所说的内容添加字幕。我可以毫无问题地从 AWS Polly 获取 mp3 文件。

但是,当我想分别获取单词的每个部分时,它不起作用。我检查了检查器选项卡,我可以看到一些参数正在传递给polly.aws的请求。知道如何让 json/mark-up 文件知道每个单词和句子的开头和结尾吗?

一些有用的检查链接:https ://aws.amazon.com/blogs/aws/new-amazon-polly-speech-marks/

使用 cli 也可以使用文件:https : //docs.aws.amazon.com/polly/latest/dg/speechmarkexamples.html 但我想在 NodeJs 中使用它

0 投票
1 回答
381 浏览

json - 一次调用同时从 AWS Polly 获取 mp3 和 json(节省成本)

我在这里问了一个问题,几秒钟后我自己回答了:Get mp3 and speech mark from Amazon Polly using NodeJs

我想知道我是否必须打两个电话才能获取文本的 json 和 mp3?

似乎 polly ui https://us-east-1.console.aws.amazon.com/polly/home/SynthesizeSpeech也分开做?

在此处输入图像描述

^ 没有 mp3 的下载链接,请求 json 时只需播放按钮。

0 投票
1 回答
33 浏览

wordpress - 警告:preg_replace(): Unknown modifier 'j' in

我使用运行亚马逊的 Amazon AI 插件 Polly。一切都很好,但知道我遇到了错误。

我在 Cpanel 中打开代码。

$text = preg_replace('/<' . $value . '>(\s*?)(. ?)(\s ?)</' . $value . '>/', '', $text);

我应该怎么办?出现此错误:

警告:preg_replace():第 1313 行 /amazon-polly/admin/AmazonAI-Common.php 中的未知修饰符“j”

0 投票
2 回答
786 浏览

amazon-web-services - 向强调标签添加参数时,控制台返回 SSML 错误

我正在编写一个 Python 脚本来将 SSML 转换为应用程序的音频。我已经可以进行文本转换,但我正在通过在控制台中进行试验来找出 SSML 部分。

从文档中:https ://docs.aws.amazon.com/polly/latest/dg/supported-ssml.html#emphasis-tag有一个使用带有 level 参数的强调标签的示例:

当我在控制台中输入我的 SSML 时:

按下“收听音频”按钮后,控制台返回错误

输入文本包含无效的 SSML 语法。修复 SSML 语法,然后重试。

如果我删除 level 关键字,那么 SSML 会读取

它被正确转换。

Polly 文档中提供的示例有效,但我无法弄清楚为什么我的文本有错误。

0 投票
1 回答
738 浏览

c++ - 在 Freeswitch 中使用 AWS C++ SDK 加载模块时出现未定义符号错误

我再次问这个问题,因为 mods 决定在这里关闭我的问题作为重复,在被问到的几分钟内(并且也被否决了!!)。现在,我已经浏览了所有33 个被认为是我的解决方案的答案,但它没有帮助。所以我又问了。

我正在尝试构建一个 FreeSWITCH 模块,以使用 AWS Polly 和 AWS C++ SDK 添加文本转语音功能。开发环境是 Debian 8,g++ 4.9.2。AWS C++ SDK 是使用此处的说明构建的,但我关闭了共享库(生成 .a 库文件)。

AWS C++ SDK 是按照此处的建议构建的(基本上是带有 C++ 链接的 C++ 代码)。mod_polly.cpp也使用 C++ 链接构建以生成mod_polly.so. 它确实引用了一些 C 头文件和函数。这是建造为 -

g++ -shared -o mod_polly.so -L/usr/local/lib/ -laws-cpp-sdk-polly -laws-cpp-sdk-core -fPIC -g -ggdb -std=c++11 -Wall -Werror -I/usr/src/freeswitch/src/include/ -I/usr/src/freeswitch/libs/libteletone/src/mod_polly.cpp

以下来源 -

现在当我尝试加载它时Freeswitch,它会引发错误

2019-07-31 22:00:51.918181 [CRIT] switch_loadable_module.c:1522 加载模块 /usr/local/freeswitch/mod/mod_polly.so 时出错

/usr/local/freeswitch/mod/mod_polly.so:未定义符号:_ZNK3Aws35AmazonSerializableWebServiceRequest7GetBodyEv

Freeswitch 是在头文件中带有 C++ 保护的 C 代码(外部“C”声明)。

看里面的符号mod_polly.so

readelf -Ws mod_polly.so | grep _ZNK3Aws35AmazonSerializableWebServiceRequest7GetBodyEv

66: 0000000000000000 0 NOTYPE GLOBAL DEFAULT UND _ZNK3Aws35AmazonSerializableWebServiceRequest7GetBodyEv

590: 0000000000000000 0 NOTYPE 全球默认 UND _ZNK3Aws35AmazonSerializableWebServiceRequest7GetBodyEv

现在我对这里帖子的基本理解告诉我该符号存在于so文件中但Freeswitch无法找到或加载它。

现在这个错误很可能与混合 C/C++ 代码有关,但是看看这个并没有帮助我弄清楚如何修复它。

我不想构建Freeswitch来加载我的模块,我想我不应该这样做,因为这会使这个项目无法扩展。

我在这里想念什么?

PS:

readelf -Ws libaws-cpp-sdk-core.a | grep AmazonSerializableWebServiceRequest7GetBodyEv

165:0000000000000000 716 FUNC 全局默认值 42 _ZNK3Aws35AmazonSerializableWebServiceRequest7GetBodyEv

符号被定义在libaws-cpp-sdk-core.a其中是编译命令的一部分mod_polly.cpp

0 投票
1 回答
63 浏览

angular - Amazon Polly.Presigner 期望 0-1 个参数,但得到 2 个

在一个 Angular 应用程序中,我设置了一个应用程序,该应用程序使用 Amazon Polly 主要基于this说出一些难以言说的东西。

我不得不像这样导入 Polly,因为我无法让 aws-sdk 允许导入 AWS,这曾经可以工作:

我已经导入了@types/node,并且在tsconfig.app.json 文件的compilerOptions 下的types 下添加了["node']。

我在 polyfills.ts 中添加了以下内容:

对于我的一生,我无法弄清楚为什么下面的“polly”位会抛出一个错误,上面写着:“预期的参数为 0-1,但得到了 2。”

它阻止我部署构建。该怎么办?!

0 投票
1 回答
339 浏览

node.js - 如何使用aws polly api对网页进行tts并保存在aws s3中

我正在尝试让 AWS Polly 保存 URL 内容的 mp3 音频转录。我已经尝试了几个预先烘焙的脚本,但它们似乎都不起作用。

这是我的目标蓝图: (1) lambda 函数 - 调用 polly api StartSpeechSynthesisTask - 用作文本,URL 的内容 - 将音频文件保存在 s3

这是我在 Lambda 中尝试过的

我希望输出是保存在我的 s3 存储桶中的 MP3 文件。

0 投票
2 回答
285 浏览

java - AWS StartSpeechSynthesisTaskRequest

目前使用 AWS 服务通过 Polly 创建一个 PCM 音频文件并将其存储到 S3 存储桶中。该应用程序使用 AWS lambda 完成所有这些工作。

我正在使用“StartSpeechSynthesisTaskRequest”,它允许用户向 amazon Polly 创建一个请求,并将文件直接传送到用户选择的指定 S3 存储桶中。

我遇到的问题是,一旦运行代码,我最终会得到一个像这样的文件名:

“MY_FILE_NAME.a1f9999f-f00r-6h45-j2ks-pd7fcc9sfw77.pcm”

我想要的是:

“MY_FILE_NAME.pcm”

为什么会发生这种额外的事情?有人得到这个问题的答案吗?

我已经发布了下面的代码。

更新:

如果我打印“startSpeechSynthesisRequest”,在它使用所有参数构建后,它将完全按照我的需要打印“withOutputS3KeyPrefix”。polly 和 S3 存储桶之间出现了问题。

0 投票
1 回答
214 浏览

ios - 用户如何在 iOS Safari 中启用音频自动播放,以便 Amazon Polly 文本转语音按预期工作?

我正在使用 Amazon Polly 生成语音,在我的 Web 应用程序中以“对话式”交互方式说出。这涉及进行 API 调用以获取生成的音频文件,然后在适当的时候播放它以响应用户并与用户交互。

这在桌面 chrome 上效果很好,在桌面 safari 上效果很好,只要我指示用户转到 Safari > 此网站的设置 > 允许所有自动播放。

但是,在 iOS (iPad) 上的 Safari 中,这不起作用。我还没有找到让用户修改首选项并允许自动播放的等效方法。没有这个,我的文本到语音音频被 Safari 的默认自动播放设置阻止播放。

有没有办法让我的用户在他们的 iPad 上为这个网站设置这样的偏好?如果没有,是否有一种解决方法可以让我播放我的语音音频文件?

出于这个问题的目的,让我们假设要求用户启用音频自动播放是一种很好的用户体验。