Delen via


GetCompletionsOptions interface

De configuratiegegevens voor een voltooiingsaanvraag. Voltooiingen ondersteunen een breed scala aan taken en genereren tekst die wordt voortgezet op basis van of 'voltooit' verstrekte promptgegevens.

Extends

Eigenschappen

bestOf

Een waarde die bepaalt hoeveel voltooiingen er intern worden gegenereerd vóór de antwoordformulering. Als u samen met n gebruikt, bepaalt best_of het aantal voltooiingen van kandidaten en moet deze groter zijn dan n. Omdat deze instelling veel voltooiingen kan genereren, kan het tokenquotum snel worden verbruikt. Gebruik zorgvuldig en zorg voor redelijke instellingen voor max_tokens en stop.

echo

Een waarde die aangeeft of voltooiingsreacties invoerprompts moeten bevatten als voorvoegsels voor de gegenereerde uitvoer.

frequencyPenalty

Een waarde die van invloed is op de waarschijnlijkheid dat gegenereerde tokens worden weergegeven op basis van hun cumulatieve frequentie in gegenereerde tekst. Positieve waarden zorgen ervoor dat tokens minder snel worden weergegeven naarmate de frequentie toeneemt en de kans dat het model dezelfde instructies letterlijk herhaalt.

logitBias

Een toewijzing tussen GPT-token-id's en bias-scores die van invloed zijn op de waarschijnlijkheid van specifieke tokens die worden weergegeven in een voltooiingsantwoord. Token-id's worden berekend via externe tokenizer-hulpprogramma's, terwijl bias-scores zich bevinden in het bereik van -100 tot 100 met respectievelijk minimum- en maximumwaarden die overeenkomen met een volledige ban of exclusieve selectie van een token. Het exacte gedrag van een bepaalde bias-score verschilt per model.

logprobs

Een waarde die de emissie van logboekkansen bepaalt voor het opgegeven aantal meest waarschijnlijke tokens binnen een voltooiingsreactie.

maxTokens

Het maximum aantal tokens dat moet worden gegenereerd.

n

Het aantal voltooiingsopties dat per opgegeven prompt moet worden gegenereerd als onderdeel van een algemeen voltooiingsantwoord. Omdat deze instelling veel voltooiingen kan genereren, kan het tokenquotum snel worden verbruikt. Gebruik zorgvuldig en zorg voor redelijke instellingen voor max_tokens en stop.

presencePenalty

Een waarde die van invloed is op de waarschijnlijkheid dat gegenereerde tokens worden weergegeven op basis van hun bestaande aanwezigheid in gegenereerde tekst. Positieve waarden zorgen ervoor dat tokens minder snel worden weergegeven wanneer ze al bestaan en vergroten de kans dat het model nieuwe onderwerpen uitvoert.

stop

Een verzameling tekstreeksen die het genereren van voltooiingen beëindigen.

temperature

De te gebruiken bemonsteringstemperatuur die de schijnbare creativiteit van gegenereerde voltooiingen bepaalt. Met hogere waarden wordt de uitvoer willekeuriger, terwijl lagere waarden de resultaten meer gericht en deterministisch maken. Het wordt niet aanbevolen om de temperatuur en top_p te wijzigen voor dezelfde voltooiingsaanvraag, omdat de interactie van deze twee instellingen moeilijk te voorspellen is.

topP

Een alternatief voor steekproeven met temperatuur, ook wel kernsampling genoemd. Deze waarde zorgt ervoor dat het model rekening houdt met de resultaten van tokens met de opgegeven kansdichtheid. Een waarde van 0,15 zorgt er bijvoorbeeld voor dat alleen de tokens die de bovenste 15% van de kansmassa omvatten, in aanmerking worden genomen. Het wordt niet aanbevolen om de temperatuur en top_p te wijzigen voor dezelfde voltooiingsaanvraag, omdat de interactie van deze twee instellingen moeilijk te voorspellen is.

user

Een id voor de beller of eindgebruiker van de bewerking. Dit kan worden gebruikt voor tracerings- of snelheidsbeperkingsdoeleinden.

Overgenomen eigenschappen

abortSignal

Het signaal dat kan worden gebruikt om aanvragen af te breken.

onResponse

Een functie die moet worden aangeroepen telkens wanneer er een antwoord van de server wordt ontvangen tijdens het uitvoeren van de aangevraagde bewerking. Kan meerdere keren worden aangeroepen.

requestOptions

Opties die worden gebruikt bij het maken en verzenden van HTTP-aanvragen voor deze bewerking.

tracingOptions

Opties die worden gebruikt wanneer tracering is ingeschakeld.

Eigenschapdetails

bestOf

Een waarde die bepaalt hoeveel voltooiingen er intern worden gegenereerd vóór de antwoordformulering. Als u samen met n gebruikt, bepaalt best_of het aantal voltooiingen van kandidaten en moet deze groter zijn dan n. Omdat deze instelling veel voltooiingen kan genereren, kan het tokenquotum snel worden verbruikt. Gebruik zorgvuldig en zorg voor redelijke instellingen voor max_tokens en stop.

bestOf?: number

Waarde van eigenschap

number

echo

Een waarde die aangeeft of voltooiingsreacties invoerprompts moeten bevatten als voorvoegsels voor de gegenereerde uitvoer.

echo?: boolean

Waarde van eigenschap

boolean

frequencyPenalty

Een waarde die van invloed is op de waarschijnlijkheid dat gegenereerde tokens worden weergegeven op basis van hun cumulatieve frequentie in gegenereerde tekst. Positieve waarden zorgen ervoor dat tokens minder snel worden weergegeven naarmate de frequentie toeneemt en de kans dat het model dezelfde instructies letterlijk herhaalt.

frequencyPenalty?: number

Waarde van eigenschap

number

logitBias

Een toewijzing tussen GPT-token-id's en bias-scores die van invloed zijn op de waarschijnlijkheid van specifieke tokens die worden weergegeven in een voltooiingsantwoord. Token-id's worden berekend via externe tokenizer-hulpprogramma's, terwijl bias-scores zich bevinden in het bereik van -100 tot 100 met respectievelijk minimum- en maximumwaarden die overeenkomen met een volledige ban of exclusieve selectie van een token. Het exacte gedrag van een bepaalde bias-score verschilt per model.

logitBias?: Record<string, number>

Waarde van eigenschap

Record<string, number>

logprobs

Een waarde die de emissie van logboekkansen bepaalt voor het opgegeven aantal meest waarschijnlijke tokens binnen een voltooiingsreactie.

logprobs?: number

Waarde van eigenschap

number

maxTokens

Het maximum aantal tokens dat moet worden gegenereerd.

maxTokens?: number

Waarde van eigenschap

number

n

Het aantal voltooiingsopties dat per opgegeven prompt moet worden gegenereerd als onderdeel van een algemeen voltooiingsantwoord. Omdat deze instelling veel voltooiingen kan genereren, kan het tokenquotum snel worden verbruikt. Gebruik zorgvuldig en zorg voor redelijke instellingen voor max_tokens en stop.

n?: number

Waarde van eigenschap

number

presencePenalty

Een waarde die van invloed is op de waarschijnlijkheid dat gegenereerde tokens worden weergegeven op basis van hun bestaande aanwezigheid in gegenereerde tekst. Positieve waarden zorgen ervoor dat tokens minder snel worden weergegeven wanneer ze al bestaan en vergroten de kans dat het model nieuwe onderwerpen uitvoert.

presencePenalty?: number

Waarde van eigenschap

number

stop

Een verzameling tekstreeksen die het genereren van voltooiingen beëindigen.

stop?: string[]

Waarde van eigenschap

string[]

temperature

De te gebruiken bemonsteringstemperatuur die de schijnbare creativiteit van gegenereerde voltooiingen bepaalt. Met hogere waarden wordt de uitvoer willekeuriger, terwijl lagere waarden de resultaten meer gericht en deterministisch maken. Het wordt niet aanbevolen om de temperatuur en top_p te wijzigen voor dezelfde voltooiingsaanvraag, omdat de interactie van deze twee instellingen moeilijk te voorspellen is.

temperature?: number

Waarde van eigenschap

number

topP

Een alternatief voor steekproeven met temperatuur, ook wel kernsampling genoemd. Deze waarde zorgt ervoor dat het model rekening houdt met de resultaten van tokens met de opgegeven kansdichtheid. Een waarde van 0,15 zorgt er bijvoorbeeld voor dat alleen de tokens die de bovenste 15% van de kansmassa omvatten, in aanmerking worden genomen. Het wordt niet aanbevolen om de temperatuur en top_p te wijzigen voor dezelfde voltooiingsaanvraag, omdat de interactie van deze twee instellingen moeilijk te voorspellen is.

topP?: number

Waarde van eigenschap

number

user

Een id voor de beller of eindgebruiker van de bewerking. Dit kan worden gebruikt voor tracerings- of snelheidsbeperkingsdoeleinden.

user?: string

Waarde van eigenschap

string

Details van overgenomen eigenschap

abortSignal

Het signaal dat kan worden gebruikt om aanvragen af te breken.

abortSignal?: AbortSignalLike

Waarde van eigenschap

Overgenomen van OperationOptions.abortSignal

onResponse

Een functie die moet worden aangeroepen telkens wanneer er een antwoord van de server wordt ontvangen tijdens het uitvoeren van de aangevraagde bewerking. Kan meerdere keren worden aangeroepen.

onResponse?: RawResponseCallback

Waarde van eigenschap

Overgenomen van OperationOptions.onResponse

requestOptions

Opties die worden gebruikt bij het maken en verzenden van HTTP-aanvragen voor deze bewerking.

requestOptions?: OperationRequestOptions

Waarde van eigenschap

Overgenomen van OperationOptions.requestOptions

tracingOptions

Opties die worden gebruikt wanneer tracering is ingeschakeld.

tracingOptions?: OperationTracingOptions

Waarde van eigenschap

Overgenomen van OperationOptions.tracingOptions