你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
GetCompletionsOptions interface
完成请求的配置信息。 完成支持各种任务,并生成继续或“完成”提供的提示数据的文本。
- Extends
属性
best |
一个 值,该值控制在响应表述之前将在内部生成的完成次数。 与 n 一起使用时,best_of控制候选完成数,并且必须大于 n。 由于此设置可以生成许多完成,因此可能会快速使用令牌配额。 请谨慎使用并确保max_tokens和停止的合理设置。 |
echo | 一个 值,该值指定完成响应是否应包括输入提示作为其生成的输出的前缀。 |
frequency |
一个 值,该值根据生成的文本中生成的标记的累积频率影响其出现概率。 正值将使标记在频率增加时出现的可能性降低,并降低模型逐字重复相同语句的可能性。 |
logit |
GPT 令牌 ID 与偏差分数之间的映射,该映射会影响完成响应中出现特定标记的概率。 令牌 ID 通过外部 tokenizer 工具计算,而偏差分数位于 -100 到 100 的范围内,最小值和最大值分别对应于令牌的完全禁止或独占选择。 给定偏差分数的确切行为因模型而异。 |
logprobs | 一个 值,该值控制完成响应中提供的最有可能标记数的对数的输出。 |
max |
要生成的令牌的最大数目。 |
n | 作为整体完成响应的一部分,应根据提供的提示生成的完成选项数。 由于此设置可以生成许多完成,因此可能会快速使用令牌配额。 请谨慎使用并确保max_tokens和停止的合理设置。 |
presence |
一个 值,该值根据生成的文本中的现有状态影响生成的令牌出现概率。 正值将使标记在已存在时不太可能出现,并增加模型输出新主题的可能性。 |
stop | 将结束完成生成的文本序列的集合。 |
temperature | 用于控制生成完成的明显创造性的采样温度。 值越高,输出的随机性就越高,而值越小,结果的针对性和确定性就越高。 不建议为相同的完成请求修改温度和top_p,因为这两个设置的交互难以预测。 |
topP | 温度采样的替代方法,称为核采样。 此值使模型考虑具有提供的概率质量的标记的结果。 例如,如果值为 0.15,则只会考虑包含概率质量前 15% 的标记。 不建议为相同的完成请求修改温度和top_p,因为这两个设置的交互难以预测。 |
user | 操作的调用方或最终用户的标识符。 这可用于跟踪或速率限制目的。 |
继承属性
abort |
可用于中止请求的信号。 |
on |
在执行请求的操作时,每次从服务器收到响应时要调用的函数。 可以多次调用。 |
request |
创建和发送此操作的 HTTP 请求时使用的选项。 |
tracing |
启用跟踪时使用的选项。 |
属性详细信息
bestOf
一个 值,该值控制在响应表述之前将在内部生成的完成次数。 与 n 一起使用时,best_of控制候选完成数,并且必须大于 n。 由于此设置可以生成许多完成,因此可能会快速使用令牌配额。 请谨慎使用并确保max_tokens和停止的合理设置。
bestOf?: number
属性值
number
echo
一个 值,该值指定完成响应是否应包括输入提示作为其生成的输出的前缀。
echo?: boolean
属性值
boolean
frequencyPenalty
一个 值,该值根据生成的文本中生成的标记的累积频率影响其出现概率。 正值将使标记在频率增加时出现的可能性降低,并降低模型逐字重复相同语句的可能性。
frequencyPenalty?: number
属性值
number
logitBias
GPT 令牌 ID 与偏差分数之间的映射,该映射会影响完成响应中出现特定标记的概率。 令牌 ID 通过外部 tokenizer 工具计算,而偏差分数位于 -100 到 100 的范围内,最小值和最大值分别对应于令牌的完全禁止或独占选择。 给定偏差分数的确切行为因模型而异。
logitBias?: Record<string, number>
属性值
Record<string, number>
logprobs
一个 值,该值控制完成响应中提供的最有可能标记数的对数的输出。
logprobs?: number
属性值
number
maxTokens
要生成的令牌的最大数目。
maxTokens?: number
属性值
number
n
作为整体完成响应的一部分,应根据提供的提示生成的完成选项数。 由于此设置可以生成许多完成,因此可能会快速使用令牌配额。 请谨慎使用并确保max_tokens和停止的合理设置。
n?: number
属性值
number
presencePenalty
一个 值,该值根据生成的文本中的现有状态影响生成的令牌出现概率。 正值将使标记在已存在时不太可能出现,并增加模型输出新主题的可能性。
presencePenalty?: number
属性值
number
stop
将结束完成生成的文本序列的集合。
stop?: string[]
属性值
string[]
temperature
用于控制生成完成的明显创造性的采样温度。 值越高,输出的随机性就越高,而值越小,结果的针对性和确定性就越高。 不建议为相同的完成请求修改温度和top_p,因为这两个设置的交互难以预测。
temperature?: number
属性值
number
topP
温度采样的替代方法,称为核采样。 此值使模型考虑具有提供的概率质量的标记的结果。 例如,如果值为 0.15,则只会考虑包含概率质量前 15% 的标记。 不建议为相同的完成请求修改温度和top_p,因为这两个设置的交互难以预测。
topP?: number
属性值
number
user
操作的调用方或最终用户的标识符。 这可用于跟踪或速率限制目的。
user?: string
属性值
string
继承属性详细信息
abortSignal
onResponse
在执行请求的操作时,每次从服务器收到响应时要调用的函数。 可以多次调用。
onResponse?: RawResponseCallback
属性值
继承自 OperationOptions.onResponse
requestOptions
创建和发送此操作的 HTTP 请求时使用的选项。
requestOptions?: OperationRequestOptions
属性值
继承自 OperationOptions.requestOptions
tracingOptions
启用跟踪时使用的选项。
tracingOptions?: OperationTracingOptions
属性值
继承自 OperationOptions.tracingOptions