你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

GetCompletionsOptions interface

完成请求的配置信息。 完成支持各种任务,并生成继续或“完成”提供的提示数据的文本。

Extends

属性

bestOf

一个 值,该值控制在响应表述之前将在内部生成的完成次数。 与 n 一起使用时,best_of控制候选完成数,并且必须大于 n。 由于此设置可以生成许多完成,因此可能会快速使用令牌配额。 请谨慎使用并确保max_tokens和停止的合理设置。

echo

一个 值,该值指定完成响应是否应包括输入提示作为其生成的输出的前缀。

frequencyPenalty

一个 值,该值根据生成的文本中生成的标记的累积频率影响其出现概率。 正值将使标记在频率增加时出现的可能性降低,并降低模型逐字重复相同语句的可能性。

logitBias

GPT 令牌 ID 与偏差分数之间的映射,该映射会影响完成响应中出现特定标记的概率。 令牌 ID 通过外部 tokenizer 工具计算,而偏差分数位于 -100 到 100 的范围内,最小值和最大值分别对应于令牌的完全禁止或独占选择。 给定偏差分数的确切行为因模型而异。

logprobs

一个 值,该值控制完成响应中提供的最有可能标记数的对数的输出。

maxTokens

要生成的令牌的最大数目。

n

作为整体完成响应的一部分,应根据提供的提示生成的完成选项数。 由于此设置可以生成许多完成,因此可能会快速使用令牌配额。 请谨慎使用并确保max_tokens和停止的合理设置。

presencePenalty

一个 值,该值根据生成的文本中的现有状态影响生成的令牌出现概率。 正值将使标记在已存在时不太可能出现,并增加模型输出新主题的可能性。

stop

将结束完成生成的文本序列的集合。

temperature

用于控制生成完成的明显创造性的采样温度。 值越高,输出的随机性就越高,而值越小,结果的针对性和确定性就越高。 不建议为相同的完成请求修改温度和top_p,因为这两个设置的交互难以预测。

topP

温度采样的替代方法,称为核采样。 此值使模型考虑具有提供的概率质量的标记的结果。 例如,如果值为 0.15,则只会考虑包含概率质量前 15% 的标记。 不建议为相同的完成请求修改温度和top_p,因为这两个设置的交互难以预测。

user

操作的调用方或最终用户的标识符。 这可用于跟踪或速率限制目的。

继承属性

abortSignal

可用于中止请求的信号。

onResponse

在执行请求的操作时,每次从服务器收到响应时要调用的函数。 可以多次调用。

requestOptions

创建和发送此操作的 HTTP 请求时使用的选项。

tracingOptions

启用跟踪时使用的选项。

属性详细信息

bestOf

一个 值,该值控制在响应表述之前将在内部生成的完成次数。 与 n 一起使用时,best_of控制候选完成数,并且必须大于 n。 由于此设置可以生成许多完成,因此可能会快速使用令牌配额。 请谨慎使用并确保max_tokens和停止的合理设置。

bestOf?: number

属性值

number

echo

一个 值,该值指定完成响应是否应包括输入提示作为其生成的输出的前缀。

echo?: boolean

属性值

boolean

frequencyPenalty

一个 值,该值根据生成的文本中生成的标记的累积频率影响其出现概率。 正值将使标记在频率增加时出现的可能性降低,并降低模型逐字重复相同语句的可能性。

frequencyPenalty?: number

属性值

number

logitBias

GPT 令牌 ID 与偏差分数之间的映射,该映射会影响完成响应中出现特定标记的概率。 令牌 ID 通过外部 tokenizer 工具计算,而偏差分数位于 -100 到 100 的范围内,最小值和最大值分别对应于令牌的完全禁止或独占选择。 给定偏差分数的确切行为因模型而异。

logitBias?: Record<string, number>

属性值

Record<string, number>

logprobs

一个 值,该值控制完成响应中提供的最有可能标记数的对数的输出。

logprobs?: number

属性值

number

maxTokens

要生成的令牌的最大数目。

maxTokens?: number

属性值

number

n

作为整体完成响应的一部分,应根据提供的提示生成的完成选项数。 由于此设置可以生成许多完成,因此可能会快速使用令牌配额。 请谨慎使用并确保max_tokens和停止的合理设置。

n?: number

属性值

number

presencePenalty

一个 值,该值根据生成的文本中的现有状态影响生成的令牌出现概率。 正值将使标记在已存在时不太可能出现,并增加模型输出新主题的可能性。

presencePenalty?: number

属性值

number

stop

将结束完成生成的文本序列的集合。

stop?: string[]

属性值

string[]

temperature

用于控制生成完成的明显创造性的采样温度。 值越高,输出的随机性就越高,而值越小,结果的针对性和确定性就越高。 不建议为相同的完成请求修改温度和top_p,因为这两个设置的交互难以预测。

temperature?: number

属性值

number

topP

温度采样的替代方法,称为核采样。 此值使模型考虑具有提供的概率质量的标记的结果。 例如,如果值为 0.15,则只会考虑包含概率质量前 15% 的标记。 不建议为相同的完成请求修改温度和top_p,因为这两个设置的交互难以预测。

topP?: number

属性值

number

user

操作的调用方或最终用户的标识符。 这可用于跟踪或速率限制目的。

user?: string

属性值

string

继承属性详细信息

abortSignal

可用于中止请求的信号。

abortSignal?: AbortSignalLike

属性值

继承自 OperationOptions.abortSignal

onResponse

在执行请求的操作时,每次从服务器收到响应时要调用的函数。 可以多次调用。

onResponse?: RawResponseCallback

属性值

继承自 OperationOptions.onResponse

requestOptions

创建和发送此操作的 HTTP 请求时使用的选项。

requestOptions?: OperationRequestOptions

属性值

继承自 OperationOptions.requestOptions

tracingOptions

启用跟踪时使用的选项。

tracingOptions?: OperationTracingOptions

属性值

继承自 OperationOptions.tracingOptions