文字转语音 (TTS) API 指南#
音频 API 提供 speech 端点,基于 TTS 模型实现以下功能:重要提示:必须向用户声明所听到的是 AI 生成的语音,而非人类声音
基础使用#
基本示例#
功能特性#
音频质量选项#
tts-1-hd: 更高质量,可能有更少的静态内容
可用声音#
支持的输出格式#
| 格式 | 特点 | 适用场景 |
|---|
| MP3 | 默认格式 | 通用场景 |
| Opus | 低延迟 | 网络流媒体和通信 |
| AAC | 高效压缩 | 移动设备播放 |
| FLAC | 无损压缩 | 音频存档 |
| WAV | 无压缩 | 低延迟应用 |
| PCM | 原始采样 | 24kHz, 16位有符号 |
实时音频流#
支持语言#
常见问题#
Q: 如何控制生成音频的情感?#
A: 目前没有直接控制机制。大写字母或语法可能影响输出,但效果不确定。Q: 能创建自定义声音吗?#
Q: 生成的音频归属权?#
A: 归创建者所有,但需告知用户这是 AI 生成的音频。Modified at 2026-02-01 07:33:56