音频转文本
POST
/v1/audio/transcriptions
Audio
请求参数
Body 参数multipart/form-data
file
file
必需
model
string
必需
gpt-4o-transcribe
、gpt-4o-mini-transcribe
和 whisper-1
示例值:
gpt-4o-transcribe
language
string
可选
en
)格式提供输入语言将提高准确性和延迟。prompt
string
可选
response_format
string
可选
temperature
number
可选
默认值:
0
示例值:
0
include[]
array[string]
可选
logprobs
将返回响应中标记的对数概率,以了解模型对转录的置信度。logprobs
仅在将 response_format
设置为 json
时有效,并且仅与 gpt-4o-transcribe
和 gpt-4o-mini-transcribe
模型一起使用。枚举值:
logprobs
timestamp_granularities[]
array[string]
可选
response_format
设置为verbose_json
才能 使用时间戳粒度。支持以下一个或两个选项:word
或segment
。注意:分段时间戳不会增加额外延迟,但生成单词时间戳会增加额外延迟。枚举值:
wordsegment
默认值:
segment
示例值:
["segment"]
stream
boolean | null
可选
默认值:
false
示例值:
false
示例代码
返回响应
修改于 2025-05-18 07:36:21