GetCompletionsOptions interface

Referência

Pacote:: @azure/openai

As informações de configuração de uma solicitação de conclusão. As conclusões dão suporte a uma ampla variedade de tarefas e geram texto que continua ou "conclui" dados de prompt fornecidos.

Extends: OperationOptions

Propriedades

bestOf	Um valor que controla quantas conclusões serão geradas internamente antes da formulação de resposta. Quando usado junto com n, best_of controla o número de conclusões de candidatos e deve ser maior que n. Como essa configuração pode gerar muitas conclusões, ela pode consumir rapidamente sua cota de token. Use cuidadosamente e garanta configurações razoáveis para max_tokens e parar.
echo	Um valor que especifica se as respostas de conclusões devem incluir prompts de entrada como prefixos para a saída gerada.
frequencyPenalty	Um valor que influencia a probabilidade de tokens gerados aparecerem com base em sua frequência cumulativa no texto gerado. Os valores positivos tornarão os tokens menos propensos a aparecer à medida que sua frequência aumentar e diminuir a probabilidade de o modelo repetir as mesmas instruções textualmente.
logitBias	Um mapa entre IDs de token GPT e pontuações de desvio que influenciam a probabilidade de tokens específicos aparecerem em uma resposta de conclusões. As IDs de token são computadas por meio de ferramentas de token externo, enquanto as pontuações de desvio residem no intervalo de -100 a 100 com valores mínimos e máximos correspondentes a uma proibição completa ou seleção exclusiva de um token, respectivamente. O comportamento exato de uma determinada pontuação de desvio varia de acordo com o modelo.
logprobs	Um valor que controla a emissão de probabilidades de log para o número fornecido de tokens mais prováveis em uma resposta de conclusões.
maxTokens	O número máximo de tokens a serem gerados.
n	O número de opções de conclusões que devem ser geradas por prompt fornecido como parte de uma resposta geral de conclusões. Como essa configuração pode gerar muitas conclusões, ela pode consumir rapidamente sua cota de token. Use cuidadosamente e garanta configurações razoáveis para max_tokens e parar.
presencePenalty	Um valor que influencia a probabilidade de tokens gerados aparecerem com base em sua presença existente no texto gerado. Os valores positivos tornarão os tokens menos propensos a aparecer quando já existirem e aumentarão a probabilidade do modelo gerar novos tópicos.
stop	Uma coleção de sequências textuais que encerrará a geração de conclusões.
temperature	A temperatura de amostragem a ser usada que controla a criatividade aparente das conclusões geradas. Valores mais altos tornarão a saída mais aleatória, enquanto valores mais baixos tornarão os resultados mais focados e determinísticos. Não é recomendável modificar a temperatura e top_p para a mesma solicitação de conclusões que a interação dessas duas configurações é difícil de prever.
topP	Uma alternativa à amostragem com temperatura chamada amostragem de núcleo. Esse valor faz com que o modelo considere os resultados de tokens com a massa de probabilidade fornecida. Por exemplo, um valor de 0,15 fará com que apenas os tokens que compõem os 15% principais da massa de probabilidade sejam considerados. Não é recomendável modificar a temperatura e top_p para a mesma solicitação de conclusões que a interação dessas duas configurações é difícil de prever.
user	Um identificador para o chamador ou usuário final da operação. Isso pode ser usado para fins de acompanhamento ou limitação de taxa.

Propriedades herdadas

abortSignal	O sinal que pode ser usado para anular solicitações.
onResponse	Uma função a ser chamada sempre que uma resposta é recebida do servidor durante a execução da operação solicitada. Pode ser chamado várias vezes.
requestOptions	Opções usadas ao criar e enviar solicitações HTTP para essa operação.
tracingOptions	Opções usadas quando o rastreamento está habilitado.

Detalhes da propriedade

bestOf

Um valor que controla quantas conclusões serão geradas internamente antes da formulação de resposta. Quando usado junto com n, best_of controla o número de conclusões de candidatos e deve ser maior que n. Como essa configuração pode gerar muitas conclusões, ela pode consumir rapidamente sua cota de token. Use cuidadosamente e garanta configurações razoáveis para max_tokens e parar.

bestOf?: number

Valor da propriedade

number

echo

Um valor que especifica se as respostas de conclusões devem incluir prompts de entrada como prefixos para a saída gerada.

echo?: boolean

Valor da propriedade

boolean

frequencyPenalty

Um valor que influencia a probabilidade de tokens gerados aparecerem com base em sua frequência cumulativa no texto gerado. Os valores positivos tornarão os tokens menos propensos a aparecer à medida que sua frequência aumentar e diminuir a probabilidade de o modelo repetir as mesmas instruções textualmente.

frequencyPenalty?: number

Valor da propriedade

number

logitBias

Um mapa entre IDs de token GPT e pontuações de desvio que influenciam a probabilidade de tokens específicos aparecerem em uma resposta de conclusões. As IDs de token são computadas por meio de ferramentas de token externo, enquanto as pontuações de desvio residem no intervalo de -100 a 100 com valores mínimos e máximos correspondentes a uma proibição completa ou seleção exclusiva de um token, respectivamente. O comportamento exato de uma determinada pontuação de desvio varia de acordo com o modelo.

logitBias?: Record<string, number>

Valor da propriedade

Record<string, number>

logprobs

Um valor que controla a emissão de probabilidades de log para o número fornecido de tokens mais prováveis em uma resposta de conclusões.

logprobs?: number

Valor da propriedade

number

maxTokens

O número máximo de tokens a serem gerados.

maxTokens?: number

Valor da propriedade

number

n

O número de opções de conclusões que devem ser geradas por prompt fornecido como parte de uma resposta geral de conclusões. Como essa configuração pode gerar muitas conclusões, ela pode consumir rapidamente sua cota de token. Use cuidadosamente e garanta configurações razoáveis para max_tokens e parar.

n?: number

Valor da propriedade

number

presencePenalty

Um valor que influencia a probabilidade de tokens gerados aparecerem com base em sua presença existente no texto gerado. Os valores positivos tornarão os tokens menos propensos a aparecer quando já existirem e aumentarão a probabilidade do modelo gerar novos tópicos.

presencePenalty?: number

Valor da propriedade

number

stop

Uma coleção de sequências textuais que encerrará a geração de conclusões.

stop?: string[]

Valor da propriedade

string[]

temperature

A temperatura de amostragem a ser usada que controla a criatividade aparente das conclusões geradas. Valores mais altos tornarão a saída mais aleatória, enquanto valores mais baixos tornarão os resultados mais focados e determinísticos. Não é recomendável modificar a temperatura e top_p para a mesma solicitação de conclusões que a interação dessas duas configurações é difícil de prever.

temperature?: number

Valor da propriedade

number

topP

Uma alternativa à amostragem com temperatura chamada amostragem de núcleo. Esse valor faz com que o modelo considere os resultados de tokens com a massa de probabilidade fornecida. Por exemplo, um valor de 0,15 fará com que apenas os tokens que compõem os 15% principais da massa de probabilidade sejam considerados. Não é recomendável modificar a temperatura e top_p para a mesma solicitação de conclusões que a interação dessas duas configurações é difícil de prever.

topP?: number

Valor da propriedade

number

user

Um identificador para o chamador ou usuário final da operação. Isso pode ser usado para fins de acompanhamento ou limitação de taxa.

user?: string

Valor da propriedade

string

Detalhes das propriedades herdadas

abortSignal

O sinal que pode ser usado para anular solicitações.

abortSignal?: AbortSignalLike

Valor da propriedade

AbortSignalLike

Herdado de OperationOptions.abortSignal

onResponse

Uma função a ser chamada sempre que uma resposta é recebida do servidor durante a execução da operação solicitada. Pode ser chamado várias vezes.

onResponse?: RawResponseCallback

Valor da propriedade

RawResponseCallback

Herdado de OperationOptions.onResponse

requestOptions

Opções usadas ao criar e enviar solicitações HTTP para essa operação.

requestOptions?: OperationRequestOptions

Valor da propriedade

OperationRequestOptions

Herdado de OperationOptions.requestOptions

tracingOptions

Opções usadas quando o rastreamento está habilitado.

tracingOptions?: OperationTracingOptions

Valor da propriedade

OperationTracingOptions

Herdado de OperationOptions.tracingOptions

Compartilhar via

GetCompletionsOptions interface

Propriedades

Propriedades herdadas

Detalhes da propriedade

bestOf

Valor da propriedade

echo

Valor da propriedade

frequencyPenalty

Valor da propriedade

logitBias

Valor da propriedade

logprobs

Valor da propriedade

maxTokens

Valor da propriedade

n

Valor da propriedade

presencePenalty

Valor da propriedade

stop

Valor da propriedade

temperature

Valor da propriedade

topP

Valor da propriedade

user

Valor da propriedade

Detalhes das propriedades herdadas

abortSignal

Valor da propriedade

onResponse

Valor da propriedade

requestOptions

Valor da propriedade

tracingOptions

Valor da propriedade

Recursos adicionais