GetCompletionsOptions interface

Referentie

Pakket:: @azure/openai

De configuratiegegevens voor een voltooiingsaanvraag. Voltooiingen ondersteunen een breed scala aan taken en genereren tekst die wordt voortgezet op basis van of 'voltooit' verstrekte promptgegevens.

Extends: OperationOptions

Eigenschappen

bestOf	Een waarde die bepaalt hoeveel voltooiingen er intern worden gegenereerd vóór de antwoordformulering. Als u samen met n gebruikt, bepaalt best_of het aantal voltooiingen van kandidaten en moet deze groter zijn dan n. Omdat deze instelling veel voltooiingen kan genereren, kan het tokenquotum snel worden verbruikt. Gebruik zorgvuldig en zorg voor redelijke instellingen voor max_tokens en stop.
echo	Een waarde die aangeeft of voltooiingsreacties invoerprompts moeten bevatten als voorvoegsels voor de gegenereerde uitvoer.
frequencyPenalty	Een waarde die van invloed is op de waarschijnlijkheid dat gegenereerde tokens worden weergegeven op basis van hun cumulatieve frequentie in gegenereerde tekst. Positieve waarden zorgen ervoor dat tokens minder snel worden weergegeven naarmate de frequentie toeneemt en de kans dat het model dezelfde instructies letterlijk herhaalt.
logitBias	Een toewijzing tussen GPT-token-id's en bias-scores die van invloed zijn op de waarschijnlijkheid van specifieke tokens die worden weergegeven in een voltooiingsantwoord. Token-id's worden berekend via externe tokenizer-hulpprogramma's, terwijl bias-scores zich bevinden in het bereik van -100 tot 100 met respectievelijk minimum- en maximumwaarden die overeenkomen met een volledige ban of exclusieve selectie van een token. Het exacte gedrag van een bepaalde bias-score verschilt per model.
logprobs	Een waarde die de emissie van logboekkansen bepaalt voor het opgegeven aantal meest waarschijnlijke tokens binnen een voltooiingsreactie.
maxTokens	Het maximum aantal tokens dat moet worden gegenereerd.
n	Het aantal voltooiingsopties dat per opgegeven prompt moet worden gegenereerd als onderdeel van een algemeen voltooiingsantwoord. Omdat deze instelling veel voltooiingen kan genereren, kan het tokenquotum snel worden verbruikt. Gebruik zorgvuldig en zorg voor redelijke instellingen voor max_tokens en stop.
presencePenalty	Een waarde die van invloed is op de waarschijnlijkheid dat gegenereerde tokens worden weergegeven op basis van hun bestaande aanwezigheid in gegenereerde tekst. Positieve waarden zorgen ervoor dat tokens minder snel worden weergegeven wanneer ze al bestaan en vergroten de kans dat het model nieuwe onderwerpen uitvoert.
stop	Een verzameling tekstreeksen die het genereren van voltooiingen beëindigen.
temperature	De te gebruiken bemonsteringstemperatuur die de schijnbare creativiteit van gegenereerde voltooiingen bepaalt. Met hogere waarden wordt de uitvoer willekeuriger, terwijl lagere waarden de resultaten meer gericht en deterministisch maken. Het wordt niet aanbevolen om de temperatuur en top_p te wijzigen voor dezelfde voltooiingsaanvraag, omdat de interactie van deze twee instellingen moeilijk te voorspellen is.
topP	Een alternatief voor steekproeven met temperatuur, ook wel kernsampling genoemd. Deze waarde zorgt ervoor dat het model rekening houdt met de resultaten van tokens met de opgegeven kansdichtheid. Een waarde van 0,15 zorgt er bijvoorbeeld voor dat alleen de tokens die de bovenste 15% van de kansmassa omvatten, in aanmerking worden genomen. Het wordt niet aanbevolen om de temperatuur en top_p te wijzigen voor dezelfde voltooiingsaanvraag, omdat de interactie van deze twee instellingen moeilijk te voorspellen is.
user	Een id voor de beller of eindgebruiker van de bewerking. Dit kan worden gebruikt voor tracerings- of snelheidsbeperkingsdoeleinden.

Overgenomen eigenschappen

abortSignal	Het signaal dat kan worden gebruikt om aanvragen af te breken.
onResponse	Een functie die moet worden aangeroepen telkens wanneer er een antwoord van de server wordt ontvangen tijdens het uitvoeren van de aangevraagde bewerking. Kan meerdere keren worden aangeroepen.
requestOptions	Opties die worden gebruikt bij het maken en verzenden van HTTP-aanvragen voor deze bewerking.
tracingOptions	Opties die worden gebruikt wanneer tracering is ingeschakeld.

Eigenschapdetails

bestOf

Een waarde die bepaalt hoeveel voltooiingen er intern worden gegenereerd vóór de antwoordformulering. Als u samen met n gebruikt, bepaalt best_of het aantal voltooiingen van kandidaten en moet deze groter zijn dan n. Omdat deze instelling veel voltooiingen kan genereren, kan het tokenquotum snel worden verbruikt. Gebruik zorgvuldig en zorg voor redelijke instellingen voor max_tokens en stop.

bestOf?: number

Waarde van eigenschap

number

echo

Een waarde die aangeeft of voltooiingsreacties invoerprompts moeten bevatten als voorvoegsels voor de gegenereerde uitvoer.

echo?: boolean

Waarde van eigenschap

boolean

frequencyPenalty

Een waarde die van invloed is op de waarschijnlijkheid dat gegenereerde tokens worden weergegeven op basis van hun cumulatieve frequentie in gegenereerde tekst. Positieve waarden zorgen ervoor dat tokens minder snel worden weergegeven naarmate de frequentie toeneemt en de kans dat het model dezelfde instructies letterlijk herhaalt.

frequencyPenalty?: number

Waarde van eigenschap

number

logitBias

Een toewijzing tussen GPT-token-id's en bias-scores die van invloed zijn op de waarschijnlijkheid van specifieke tokens die worden weergegeven in een voltooiingsantwoord. Token-id's worden berekend via externe tokenizer-hulpprogramma's, terwijl bias-scores zich bevinden in het bereik van -100 tot 100 met respectievelijk minimum- en maximumwaarden die overeenkomen met een volledige ban of exclusieve selectie van een token. Het exacte gedrag van een bepaalde bias-score verschilt per model.

logitBias?: Record<string, number>

Waarde van eigenschap

Record<string, number>

logprobs

Een waarde die de emissie van logboekkansen bepaalt voor het opgegeven aantal meest waarschijnlijke tokens binnen een voltooiingsreactie.

logprobs?: number

Waarde van eigenschap

number

maxTokens

Het maximum aantal tokens dat moet worden gegenereerd.

maxTokens?: number

Waarde van eigenschap

number

n

Het aantal voltooiingsopties dat per opgegeven prompt moet worden gegenereerd als onderdeel van een algemeen voltooiingsantwoord. Omdat deze instelling veel voltooiingen kan genereren, kan het tokenquotum snel worden verbruikt. Gebruik zorgvuldig en zorg voor redelijke instellingen voor max_tokens en stop.

n?: number

Waarde van eigenschap

number

presencePenalty

Een waarde die van invloed is op de waarschijnlijkheid dat gegenereerde tokens worden weergegeven op basis van hun bestaande aanwezigheid in gegenereerde tekst. Positieve waarden zorgen ervoor dat tokens minder snel worden weergegeven wanneer ze al bestaan en vergroten de kans dat het model nieuwe onderwerpen uitvoert.

presencePenalty?: number

Waarde van eigenschap

number

stop

Een verzameling tekstreeksen die het genereren van voltooiingen beëindigen.

stop?: string[]

Waarde van eigenschap

string[]

temperature

De te gebruiken bemonsteringstemperatuur die de schijnbare creativiteit van gegenereerde voltooiingen bepaalt. Met hogere waarden wordt de uitvoer willekeuriger, terwijl lagere waarden de resultaten meer gericht en deterministisch maken. Het wordt niet aanbevolen om de temperatuur en top_p te wijzigen voor dezelfde voltooiingsaanvraag, omdat de interactie van deze twee instellingen moeilijk te voorspellen is.

temperature?: number

Waarde van eigenschap

number

topP

Een alternatief voor steekproeven met temperatuur, ook wel kernsampling genoemd. Deze waarde zorgt ervoor dat het model rekening houdt met de resultaten van tokens met de opgegeven kansdichtheid. Een waarde van 0,15 zorgt er bijvoorbeeld voor dat alleen de tokens die de bovenste 15% van de kansmassa omvatten, in aanmerking worden genomen. Het wordt niet aanbevolen om de temperatuur en top_p te wijzigen voor dezelfde voltooiingsaanvraag, omdat de interactie van deze twee instellingen moeilijk te voorspellen is.

topP?: number

Waarde van eigenschap

number

user

Een id voor de beller of eindgebruiker van de bewerking. Dit kan worden gebruikt voor tracerings- of snelheidsbeperkingsdoeleinden.

user?: string

Waarde van eigenschap

string

Details van overgenomen eigenschap

abortSignal

Het signaal dat kan worden gebruikt om aanvragen af te breken.

abortSignal?: AbortSignalLike

Waarde van eigenschap

AbortSignalLike

Overgenomen van OperationOptions.abortSignal

onResponse

Een functie die moet worden aangeroepen telkens wanneer er een antwoord van de server wordt ontvangen tijdens het uitvoeren van de aangevraagde bewerking. Kan meerdere keren worden aangeroepen.

onResponse?: RawResponseCallback

Waarde van eigenschap

RawResponseCallback

Overgenomen van OperationOptions.onResponse

requestOptions

Opties die worden gebruikt bij het maken en verzenden van HTTP-aanvragen voor deze bewerking.

requestOptions?: OperationRequestOptions

Waarde van eigenschap

OperationRequestOptions

Overgenomen van OperationOptions.requestOptions

tracingOptions

Opties die worden gebruikt wanneer tracering is ingeschakeld.

tracingOptions?: OperationTracingOptions

Waarde van eigenschap

OperationTracingOptions

Overgenomen van OperationOptions.tracingOptions

Delen via

GetCompletionsOptions interface

Eigenschappen

Overgenomen eigenschappen

Eigenschapdetails

bestOf

Waarde van eigenschap

echo

Waarde van eigenschap

frequencyPenalty

Waarde van eigenschap

logitBias

Waarde van eigenschap

logprobs

Waarde van eigenschap

maxTokens

Waarde van eigenschap

n

Waarde van eigenschap

presencePenalty

Waarde van eigenschap

stop

Waarde van eigenschap

temperature

Waarde van eigenschap

topP

Waarde van eigenschap

user

Waarde van eigenschap

Details van overgenomen eigenschap

abortSignal

Waarde van eigenschap

onResponse

Waarde van eigenschap

requestOptions

Waarde van eigenschap

tracingOptions

Waarde van eigenschap

Aanvullende resources