Authorization: Bearer ********************
用于生成补全的提示,编码为字符串、字符串数组、标记数组或标记数组的数组。
请注意,<|endoftext|> 是模型在训练期间看到的文档分隔符,因此如果未指定提示,模型将像从新文档的开头开始生成一样。
用于生成补全的提示,编码为字符串、字符串数组、标记数组或标记数组的数组。
请注意,<|endoftext|> 是模型在训练期间看到的文档分隔符,因此如果未指定提示,模型将像从新文档的开头开始生成一样。
best_of
个完成结果,并返回“最佳”的一个(每个标记的对数概率最高)。结果不能被流式传输。n
一起使用时,best_of
控制候选完成的数量,n
指定返回的数量——best_of
必须大于 n
。max_tokens
和 stop
有合理的设置。修改指定标记在完成中出现的可能性。
接受一个 JSON 对象,该对象将标记(由 GPT 分词器中的标记 ID 指定)映射到一个关联的偏差值,范围从 -100 到 100。您可以使用此tokenizer 工具将文本转换为标记 ID。从数学上讲,偏差值会被加到模型生成的 logits 上,然后再进行采样。具体效果因模型而异,但介于 -1 和 1 之间的值应会减少或增加选择的可能性;像 -100 或 100 这样的值应导致相关标记被禁止或被专门选择。
例如,您可以传递 {"50256": -100}
来防止生成 <|endoftext|> 标记。
logprobs
最可能输出的标记的对数概率,以及所选择的标记。例如,如果 logprobs
是 5,API 将返回一个包含 5 个最可能标记的列表。API 始终会返回采样标记的 logprob
,因此响应中最多可能包含 logprobs+1
个元素。logprobs
的最大值为 5。max_tokens
不能超过模型的上下文长度。计数令牌的Python示例代码。max_tokens
和 stop
有合理的设置。seed
和参数的重复请求应返回相同的结果。system_fingerprint
响应参数以监控后端的变化。o3
和 o4-mini
。data: [DONE]
消息终止。示例Python代码。stream: true
时设置此项。data: [DONE]
消息之前会额外流式传输一个块。该块上的 usage
字段显示整个请求的令牌使用统计信息,choices
字段将始终是一个空数组。usage
字段,但其值为 null。注意:如果流被中断,您可能无法收到包含请求总令牌使用量的最终使用块。gpt-3.5-turbo-instruct
。