有谁知道将 Microsoft Word 文档转换为 MP3 或 WAV 格式的任何得到良好支持/经过验证的方法,以便听力受损的人可以“收听”我存储在基于 Web 的文档管理系统中的文档?
我已经构建了这样的界面,以便某人可以使用电话获取可用文档列表,日期和标题通过电话“读取”给他们,但现在我希望能够让某人真正收听内容存储在系统中的 Word 文件。
理想情况下,让我在每次上传后转换 DOC -> MP3 的 .NET 库或实用程序是最好的,但按需“读取”文件的库或实用程序也可以。
有谁知道将 Microsoft Word 文档转换为 MP3 或 WAV 格式的任何得到良好支持/经过验证的方法,以便听力受损的人可以“收听”我存储在基于 Web 的文档管理系统中的文档?
我已经构建了这样的界面,以便某人可以使用电话获取可用文档列表,日期和标题通过电话“读取”给他们,但现在我希望能够让某人真正收听内容存储在系统中的 Word 文件。
理想情况下,让我在每次上传后转换 DOC -> MP3 的 .NET 库或实用程序是最好的,但按需“读取”文件的库或实用程序也可以。
您可以使用System.Speech.Recognition来配置您的 TTS 引擎,并使用 System.Speech.Synthesis命名空间来录制/保存(保存到 .WAV)。在System.Speech.AudioFormat
您可以配置 WAV 文件的输出参数。对于 Word,您只需使用COM Interop来获取文件、打开它并以您需要的任何类型的块获取它的文本并将其提供给托管 SAPI。我可能会将内容分成段落/运行、表格、参考和其他。
如果您正在寻找一种更强大的技术,其中一个更知名的 TTS 引擎是NaturallySpeaking 的服务器 SDK - 他们最近添加了一个“音频流”功能,允许即时 TTS,所以会有无需预先录制到永久音频文件(但如果您愿意,也可以预先录制)。您还可以查看他们的AudioMining SDK,它允许对音频文件中的语音文本进行完整索引和搜索。他们的 SDK 都是 COM,而不是 .NET。
从 Word 中取出文本是最容易的部分。有一些 tts 库可用,但商品库往往很贵。Acapela ( http://www.acapela-group.com ) 可能是我发现的最好的,API 支持输出到声音文件。我不确定是否支持 MP3,但转换声音格式很简单。
祝你好运。
如果您的 Word 文档以 Office 2007 引入的新 OpenXML 格式存储,您可能需要查看 Daisy 工具链。
SourceForge 上有一个免费的转换器,可用于从 Word 文档创建 Daisy 文件。屏幕阅读器可以理解 Daisy 格式,并且还有转换器可用于将 Daisy 文件转换为音频文件。
详情见:
您可以试用Panopreter,它有免费的专业版。我以前使用过它并取得了不错的成功。
我不确定免费版本是否可以直接保存到 mp3,但您总是可以使用另一个程序将输出记录到 mp3。
我可能会使用mintext命令行版本首先将 .doc 文件转换为文本,然后将此文本存储在您的数据库中(也许在上传时?)
然后使用任何文本到语音库来转换和保存这个文件,也许有一个参考 ID 将这个文件链接到数据库中。
要转换大文件,它需要专业版应用程序。但是,无论来自在线文本 reader.com 的文件有多大,您都可以转换文件