文本转语音常见问题解答 | 您所在的位置:网站首页 › tweet正确发音语音 › 文本转语音常见问题解答 |
常规
文本转语音是如何计费的?
文本转语音服务按字符计费。 查看定价说明中可计费字符的定义。 文本转语音合成请求的速率限制是多少?文本转语音的合成速率在收到更多请求时会自动调整。 每个语音资源都设有默认速率限制。 速率可根据业务理由进行调整,并且不会因提高速率限制而产生额外费用。 请在语音服务配额和限制中查看更多详细信息。 如何向最终用户披露语音是合成语音?我们建议每个用户在使用 TTS 服务时都应遵守我们的行为准则。 披露语音的合成性质有多种方式,包括隐式和显式署名。 请参考披露设计准则。 如何降低语音应用的延迟?我们为你提供了一些提示,以降低延迟并为用户提供最佳性能。 请参阅使用语音 SDK 降低语音合成延迟。 TTS 支持哪些输出音频格式?TTS 服务支持采用常用采样率的各种流式处理和非流式处理音频格式。 所有 TTS 预生成的神经语音都可支持 48kHz 和 24kHz 的高保真音频输出。 可以根据需要对音频重新采样以支持其他速率。 请参阅音频输出。 是否可以自定义语音以重读特定字词?某些语音支持调整强调,具体取决于区域设置。 请参阅强调标记。 每种情绪是否可以有多种不同的强烈程度,比如非常悲伤、有点悲伤等等?某些语音支持调整风格程度,具体取决于区域设置。 请参阅 mstts:express-as 标记。 视位 ID 和嘴形之间是否有对应关系?是的。 请参阅使用视位获取面部位置。 音频内容创建 如何在代码中引用在“有声内容创作”平台上创建的词典文件?首先,可以在“有声内容创作”上打开词典文件并获取字典文件 ID,该 ID 显示在文件路径中的“?fileKind=CustomLexiconFile”之前。 例如,如果文件路径为 https://speech.microsoft.com/portal/d391a094f76846acbcd11dc2ba835f4f/audiocontentcreation/file/6cbc2527-8d57-4c1b-b9d9-3ea6d13ca95c?fileKind=CustomLexiconFile,则词典文件 ID 为 6cbc2527-8d57-4c1b-b9d9-3ea6d13ca95c。 然后,在“有声内容创作”上将引用该词典的文件切换为 SSML 格式。 在 SSML 文件中,找到 |
CopyRight 2018-2019 实验室设备网 版权所有 |