你当前正在访问 Microsoft Azure Global Edition 技术文档网站。如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站，请访问 https://docs.azure.cn。

GetCompletionsOptions interface

参考

包:: @azure/openai

完成请求的配置信息。完成支持各种任务，并生成继续或“完成”提供的提示数据的文本。

Extends: OperationOptions

属性

bestOf	一个值，该值控制在响应表述之前将在内部生成的完成次数。与 n 一起使用时，best_of控制候选完成数，并且必须大于 n。由于此设置可以生成许多完成，因此可能会快速使用令牌配额。请谨慎使用并确保max_tokens和停止的合理设置。
echo	一个值，该值指定完成响应是否应包括输入提示作为其生成的输出的前缀。
frequencyPenalty	一个值，该值根据生成的文本中生成的标记的累积频率影响其出现概率。正值将使标记在频率增加时出现的可能性降低，并降低模型逐字重复相同语句的可能性。
logitBias	GPT 令牌 ID 与偏差分数之间的映射，该映射会影响完成响应中出现特定标记的概率。令牌 ID 通过外部 tokenizer 工具计算，而偏差分数位于 -100 到 100 的范围内，最小值和最大值分别对应于令牌的完全禁止或独占选择。给定偏差分数的确切行为因模型而异。
logprobs	一个值，该值控制完成响应中提供的最有可能标记数的对数的输出。
maxTokens	要生成的令牌的最大数目。
n	作为整体完成响应的一部分，应根据提供的提示生成的完成选项数。由于此设置可以生成许多完成，因此可能会快速使用令牌配额。请谨慎使用并确保max_tokens和停止的合理设置。
presencePenalty	一个值，该值根据生成的文本中的现有状态影响生成的令牌出现概率。正值将使标记在已存在时不太可能出现，并增加模型输出新主题的可能性。
stop	将结束完成生成的文本序列的集合。
temperature	用于控制生成完成的明显创造性的采样温度。值越高，输出的随机性就越高，而值越小，结果的针对性和确定性就越高。不建议为相同的完成请求修改温度和top_p，因为这两个设置的交互难以预测。
topP	温度采样的替代方法，称为核采样。此值使模型考虑具有提供的概率质量的标记的结果。例如，如果值为 0.15，则只会考虑包含概率质量前 15% 的标记。不建议为相同的完成请求修改温度和top_p，因为这两个设置的交互难以预测。
user	操作的调用方或最终用户的标识符。这可用于跟踪或速率限制目的。

继承属性

abortSignal	可用于中止请求的信号。
onResponse	在执行请求的操作时，每次从服务器收到响应时要调用的函数。可以多次调用。
requestOptions	创建和发送此操作的 HTTP 请求时使用的选项。
tracingOptions	启用跟踪时使用的选项。

属性详细信息

bestOf

一个值，该值控制在响应表述之前将在内部生成的完成次数。与 n 一起使用时，best_of控制候选完成数，并且必须大于 n。由于此设置可以生成许多完成，因此可能会快速使用令牌配额。请谨慎使用并确保max_tokens和停止的合理设置。

bestOf?: number

属性值

number

echo

一个值，该值指定完成响应是否应包括输入提示作为其生成的输出的前缀。

echo?: boolean

属性值

boolean

frequencyPenalty

一个值，该值根据生成的文本中生成的标记的累积频率影响其出现概率。正值将使标记在频率增加时出现的可能性降低，并降低模型逐字重复相同语句的可能性。

frequencyPenalty?: number

属性值

number

logitBias

GPT 令牌 ID 与偏差分数之间的映射，该映射会影响完成响应中出现特定标记的概率。令牌 ID 通过外部 tokenizer 工具计算，而偏差分数位于 -100 到 100 的范围内，最小值和最大值分别对应于令牌的完全禁止或独占选择。给定偏差分数的确切行为因模型而异。

logitBias?: Record<string, number>

属性值

Record<string, number>

logprobs

一个值，该值控制完成响应中提供的最有可能标记数的对数的输出。

logprobs?: number

属性值

number

maxTokens

要生成的令牌的最大数目。

maxTokens?: number

属性值

number

n

作为整体完成响应的一部分，应根据提供的提示生成的完成选项数。由于此设置可以生成许多完成，因此可能会快速使用令牌配额。请谨慎使用并确保max_tokens和停止的合理设置。

n?: number

属性值

number

presencePenalty

一个值，该值根据生成的文本中的现有状态影响生成的令牌出现概率。正值将使标记在已存在时不太可能出现，并增加模型输出新主题的可能性。

presencePenalty?: number

属性值

number

stop

将结束完成生成的文本序列的集合。

stop?: string[]

属性值

string[]

temperature

用于控制生成完成的明显创造性的采样温度。值越高，输出的随机性就越高，而值越小，结果的针对性和确定性就越高。不建议为相同的完成请求修改温度和top_p，因为这两个设置的交互难以预测。

temperature?: number

属性值

number

topP

温度采样的替代方法，称为核采样。此值使模型考虑具有提供的概率质量的标记的结果。例如，如果值为 0.15，则只会考虑包含概率质量前 15% 的标记。不建议为相同的完成请求修改温度和top_p，因为这两个设置的交互难以预测。

topP?: number

属性值

number

user

操作的调用方或最终用户的标识符。这可用于跟踪或速率限制目的。

user?: string

属性值

string

继承属性详细信息

abortSignal

可用于中止请求的信号。

abortSignal?: AbortSignalLike

属性值

AbortSignalLike

继承自 OperationOptions.abortSignal

onResponse

在执行请求的操作时，每次从服务器收到响应时要调用的函数。可以多次调用。

onResponse?: RawResponseCallback

属性值

RawResponseCallback

继承自 OperationOptions.onResponse

requestOptions

创建和发送此操作的 HTTP 请求时使用的选项。

requestOptions?: OperationRequestOptions

属性值

OperationRequestOptions

继承自 OperationOptions.requestOptions

tracingOptions

启用跟踪时使用的选项。

tracingOptions?: OperationTracingOptions

属性值

OperationTracingOptions

继承自 OperationOptions.tracingOptions

通过

GetCompletionsOptions interface

属性

继承属性

属性详细信息

bestOf

属性值

echo

属性值

frequencyPenalty

属性值

logitBias

属性值

logprobs

属性值

maxTokens

属性值

n

属性值

presencePenalty

属性值

stop

属性值

temperature

属性值

topP

属性值

user

属性值

继承属性详细信息

abortSignal

属性值

onResponse

属性值

requestOptions

属性值

tracingOptions

属性值

其他资源