文本转语音常见问题解答 您所在的位置:网站首页 tweet正确发音语音 文本转语音常见问题解答

文本转语音常见问题解答

#文本转语音常见问题解答| 来源: 网络整理| 查看: 265

常规 文本转语音是如何计费的?

文本转语音服务按字符计费。 查看定价说明中可计费字符的定义。

文本转语音合成请求的速率限制是多少?

文本转语音的合成速率在收到更多请求时会自动调整。 每个语音资源都设有默认速率限制。 速率可根据业务理由进行调整,并且不会因提高速率限制而产生额外费用。 请在语音服务配额和限制中查看更多详细信息。

如何向最终用户披露语音是合成语音?

我们建议每个用户在使用 TTS 服务时都应遵守我们的行为准则。 披露语音的合成性质有多种方式,包括隐式和显式署名。 请参考披露设计准则。

如何降低语音应用的延迟?

我们为你提供了一些提示,以降低延迟并为用户提供最佳性能。 请参阅使用语音 SDK 降低语音合成延迟。

TTS 支持哪些输出音频格式?

TTS 服务支持采用常用采样率的各种流式处理和非流式处理音频格式。 所有 TTS 预生成的神经语音都可支持 48kHz 和 24kHz 的高保真音频输出。 可以根据需要对音频重新采样以支持其他速率。 请参阅音频输出。

是否可以自定义语音以重读特定字词?

某些语音支持调整强调,具体取决于区域设置。 请参阅强调标记。

每种情绪是否可以有多种不同的强烈程度,比如非常悲伤、有点悲伤等等?

某些语音支持调整风格程度,具体取决于区域设置。 请参阅 mstts:express-as 标记。

视位 ID 和嘴形之间是否有对应关系?

是的。 请参阅使用视位获取面部位置。

音频内容创建 如何在代码中引用在“有声内容创作”平台上创建的词典文件?

首先,可以在“有声内容创作”上打开词典文件并获取字典文件 ID,该 ID 显示在文件路径中的“?fileKind=CustomLexiconFile”之前。 例如,如果文件路径为 https://speech.microsoft.com/portal/d391a094f76846acbcd11dc2ba835f4f/audiocontentcreation/file/6cbc2527-8d57-4c1b-b9d9-3ea6d13ca95c?fileKind=CustomLexiconFile,则词典文件 ID 为 6cbc2527-8d57-4c1b-b9d9-3ea6d13ca95c。 然后,在“有声内容创作”上将引用该词典的文件切换为 SSML 格式。 在 SSML 文件中,找到



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有