UniAPI API Doc
  1. Audio
UniAPI API Doc
  • OpenAI
    • Audio
      • 文本生成音频
        POST
      • 音频转文本
        POST
      • 创建转录
        POST
    • Chat
      • 聊天接口
    • Completions
      • 自动补全
    • Embeddings
      • 向量接口
    • Images
      • 图像编辑
      • 图像生成
      • 图像变体
    • Models
      • 获取模型列表
    • Moderations
      • 审核
    • Responses
      • response
  • 平台接口
    • 余额
      GET
  • 音乐模型
    • Suno
      • 创建音乐
      • 创建歌词
      • 批量获取任务
      • 查询单个任务
    • Udio
      • 创建音乐
      • 查询任务
  • 图像模型
    • MidJourney
      • 提交swap_face任务
      • 绘图变化(UPSCALE; VARIATION; REROLL)
      • 执行动作(所有的关联按钮动作UPSCALE; VARIATION; REROLL; ZOOM等)
      • 绘图变化-simple(UPSCALE; VARIATION; REROLL)
      • 提交Blend任务(图生图)
      • 提交Describe任务(图生文)
      • 提交Imagine任务(文生图、文图生图)
      • 提交Modal(提交局部重绘、ZOOM)
      • 提交Shorten任务(prompt分析)
    • ideogram
      • Generates(文生图)
      • Remix(混合图)
      • Upscale(放大高清)
      • Describe(描述)
    • FalAI
      • Openai 格式
      • 提交任务
      • 获取任务状态
      • 获取任务结果
    • 即梦
      • Openai 格式
    • Kling
      • 图像生成(文生图/图生图)
      • 图像生成 获取状态
      • 虚拟试穿
      • 虚拟试穿 获取状态
  • 视频模型
    • Luma
      • 生成视频
      • 扩展视频
      • 获取下载地址
      • 获取任务
    • FalAI
      • 提交任务
      • 获取任务状态
      • 获取任务结果
    • Kling
      • 图像生成(文生图/图生图)
      • 图像生成 获取状态
      • 文生视频
      • 文生视频 获取状态
      • 图生视频
      • 图生视频 获取状态
      • 虚拟试穿
      • 虚拟试穿 获取状态
  1. Audio

文本生成音频

POST
/v1/audio/speech
Audio

请求参数

Authorization
在 Header 添加参数
Authorization
,其值为在 Bearer 之后拼接 Token
示例:
Authorization: Bearer ********************
Body 参数application/json
model
必需
输入TTS models: tts-1, tts-1-hd or gpt-4o-mini-tts.
Any of
input
string 
必需
要生成音频的文本。最大长度为4096个字符。
<= 4096 字符
instructions
string 
可选
控制您生成的音频的语音,使用附加指令。不与tts-1或tts-1-hd兼容。
<= 4096 字符
voice
VoiceIdsShared
必需
使用生成音频时的声音。支持的声音有 alloy、ash、ballad、coral、echo、fable、onyx、nova、sage、shimmer 和 verse
Any of
示例值:
ash
response_format
enum<string> 
可选
输入音频的格式。支持的格式有 mp3、opus、aac、flac、wav 和 pcm。
枚举值:
mp3opusaacflacwavpcm
默认值:
mp3
speed
number 
可选
生成的音频速度。从 0.25 到 4.0 选择一个值。1.0 是默认值。
>= 0.25<= 4
默认值:
1
示例
{
    "model": "string",
    "input": "string",
    "instructions": "string",
    "voice": "string",
    "response_format": "mp3",
    "speed": 1
}

示例代码

Shell
JavaScript
Java
Swift
Go
PHP
Python
HTTP
C
C#
Objective-C
Ruby
OCaml
Dart
R
请求示例请求示例
Shell
JavaScript
Java
Swift
curl --location --request POST 'https://api.uniapi.io/v1/audio/speech' \
--header 'Content-Type: application/json' \
--data-raw '{
    "model": "string",
    "input": "string",
    "instructions": "string",
    "voice": "string",
    "response_format": "mp3",
    "speed": 1
}'

返回响应

🟢200成功
application/octet-stream
OK
Headers
Transfer-Encoding
string 
chunked
可选
Body
string <binary>
可选
修改于 2025-05-18 07:36:21
下一页
音频转文本
Built with