GetCompletionsOptions interface
De configuratiegegevens voor een voltooiingsaanvraag. Voltooiingen ondersteunen een breed scala aan taken en genereren tekst die wordt voortgezet op basis van of 'voltooit' verstrekte promptgegevens.
- Extends
Eigenschappen
best |
Een waarde die bepaalt hoeveel voltooiingen er intern worden gegenereerd vóór de antwoordformulering. Als u samen met n gebruikt, bepaalt best_of het aantal voltooiingen van kandidaten en moet deze groter zijn dan n. Omdat deze instelling veel voltooiingen kan genereren, kan het tokenquotum snel worden verbruikt. Gebruik zorgvuldig en zorg voor redelijke instellingen voor max_tokens en stop. |
echo | Een waarde die aangeeft of voltooiingsreacties invoerprompts moeten bevatten als voorvoegsels voor de gegenereerde uitvoer. |
frequency |
Een waarde die van invloed is op de waarschijnlijkheid dat gegenereerde tokens worden weergegeven op basis van hun cumulatieve frequentie in gegenereerde tekst. Positieve waarden zorgen ervoor dat tokens minder snel worden weergegeven naarmate de frequentie toeneemt en de kans dat het model dezelfde instructies letterlijk herhaalt. |
logit |
Een toewijzing tussen GPT-token-id's en bias-scores die van invloed zijn op de waarschijnlijkheid van specifieke tokens die worden weergegeven in een voltooiingsantwoord. Token-id's worden berekend via externe tokenizer-hulpprogramma's, terwijl bias-scores zich bevinden in het bereik van -100 tot 100 met respectievelijk minimum- en maximumwaarden die overeenkomen met een volledige ban of exclusieve selectie van een token. Het exacte gedrag van een bepaalde bias-score verschilt per model. |
logprobs | Een waarde die de emissie van logboekkansen bepaalt voor het opgegeven aantal meest waarschijnlijke tokens binnen een voltooiingsreactie. |
max |
Het maximum aantal tokens dat moet worden gegenereerd. |
n | Het aantal voltooiingsopties dat per opgegeven prompt moet worden gegenereerd als onderdeel van een algemeen voltooiingsantwoord. Omdat deze instelling veel voltooiingen kan genereren, kan het tokenquotum snel worden verbruikt. Gebruik zorgvuldig en zorg voor redelijke instellingen voor max_tokens en stop. |
presence |
Een waarde die van invloed is op de waarschijnlijkheid dat gegenereerde tokens worden weergegeven op basis van hun bestaande aanwezigheid in gegenereerde tekst. Positieve waarden zorgen ervoor dat tokens minder snel worden weergegeven wanneer ze al bestaan en vergroten de kans dat het model nieuwe onderwerpen uitvoert. |
stop | Een verzameling tekstreeksen die het genereren van voltooiingen beëindigen. |
temperature | De te gebruiken bemonsteringstemperatuur die de schijnbare creativiteit van gegenereerde voltooiingen bepaalt. Met hogere waarden wordt de uitvoer willekeuriger, terwijl lagere waarden de resultaten meer gericht en deterministisch maken. Het wordt niet aanbevolen om de temperatuur en top_p te wijzigen voor dezelfde voltooiingsaanvraag, omdat de interactie van deze twee instellingen moeilijk te voorspellen is. |
topP | Een alternatief voor steekproeven met temperatuur, ook wel kernsampling genoemd. Deze waarde zorgt ervoor dat het model rekening houdt met de resultaten van tokens met de opgegeven kansdichtheid. Een waarde van 0,15 zorgt er bijvoorbeeld voor dat alleen de tokens die de bovenste 15% van de kansmassa omvatten, in aanmerking worden genomen. Het wordt niet aanbevolen om de temperatuur en top_p te wijzigen voor dezelfde voltooiingsaanvraag, omdat de interactie van deze twee instellingen moeilijk te voorspellen is. |
user | Een id voor de beller of eindgebruiker van de bewerking. Dit kan worden gebruikt voor tracerings- of snelheidsbeperkingsdoeleinden. |
Overgenomen eigenschappen
abort |
Het signaal dat kan worden gebruikt om aanvragen af te breken. |
on |
Een functie die moet worden aangeroepen telkens wanneer er een antwoord van de server wordt ontvangen tijdens het uitvoeren van de aangevraagde bewerking. Kan meerdere keren worden aangeroepen. |
request |
Opties die worden gebruikt bij het maken en verzenden van HTTP-aanvragen voor deze bewerking. |
tracing |
Opties die worden gebruikt wanneer tracering is ingeschakeld. |
Eigenschapdetails
bestOf
Een waarde die bepaalt hoeveel voltooiingen er intern worden gegenereerd vóór de antwoordformulering. Als u samen met n gebruikt, bepaalt best_of het aantal voltooiingen van kandidaten en moet deze groter zijn dan n. Omdat deze instelling veel voltooiingen kan genereren, kan het tokenquotum snel worden verbruikt. Gebruik zorgvuldig en zorg voor redelijke instellingen voor max_tokens en stop.
bestOf?: number
Waarde van eigenschap
number
echo
Een waarde die aangeeft of voltooiingsreacties invoerprompts moeten bevatten als voorvoegsels voor de gegenereerde uitvoer.
echo?: boolean
Waarde van eigenschap
boolean
frequencyPenalty
Een waarde die van invloed is op de waarschijnlijkheid dat gegenereerde tokens worden weergegeven op basis van hun cumulatieve frequentie in gegenereerde tekst. Positieve waarden zorgen ervoor dat tokens minder snel worden weergegeven naarmate de frequentie toeneemt en de kans dat het model dezelfde instructies letterlijk herhaalt.
frequencyPenalty?: number
Waarde van eigenschap
number
logitBias
Een toewijzing tussen GPT-token-id's en bias-scores die van invloed zijn op de waarschijnlijkheid van specifieke tokens die worden weergegeven in een voltooiingsantwoord. Token-id's worden berekend via externe tokenizer-hulpprogramma's, terwijl bias-scores zich bevinden in het bereik van -100 tot 100 met respectievelijk minimum- en maximumwaarden die overeenkomen met een volledige ban of exclusieve selectie van een token. Het exacte gedrag van een bepaalde bias-score verschilt per model.
logitBias?: Record<string, number>
Waarde van eigenschap
Record<string, number>
logprobs
Een waarde die de emissie van logboekkansen bepaalt voor het opgegeven aantal meest waarschijnlijke tokens binnen een voltooiingsreactie.
logprobs?: number
Waarde van eigenschap
number
maxTokens
Het maximum aantal tokens dat moet worden gegenereerd.
maxTokens?: number
Waarde van eigenschap
number
n
Het aantal voltooiingsopties dat per opgegeven prompt moet worden gegenereerd als onderdeel van een algemeen voltooiingsantwoord. Omdat deze instelling veel voltooiingen kan genereren, kan het tokenquotum snel worden verbruikt. Gebruik zorgvuldig en zorg voor redelijke instellingen voor max_tokens en stop.
n?: number
Waarde van eigenschap
number
presencePenalty
Een waarde die van invloed is op de waarschijnlijkheid dat gegenereerde tokens worden weergegeven op basis van hun bestaande aanwezigheid in gegenereerde tekst. Positieve waarden zorgen ervoor dat tokens minder snel worden weergegeven wanneer ze al bestaan en vergroten de kans dat het model nieuwe onderwerpen uitvoert.
presencePenalty?: number
Waarde van eigenschap
number
stop
Een verzameling tekstreeksen die het genereren van voltooiingen beëindigen.
stop?: string[]
Waarde van eigenschap
string[]
temperature
De te gebruiken bemonsteringstemperatuur die de schijnbare creativiteit van gegenereerde voltooiingen bepaalt. Met hogere waarden wordt de uitvoer willekeuriger, terwijl lagere waarden de resultaten meer gericht en deterministisch maken. Het wordt niet aanbevolen om de temperatuur en top_p te wijzigen voor dezelfde voltooiingsaanvraag, omdat de interactie van deze twee instellingen moeilijk te voorspellen is.
temperature?: number
Waarde van eigenschap
number
topP
Een alternatief voor steekproeven met temperatuur, ook wel kernsampling genoemd. Deze waarde zorgt ervoor dat het model rekening houdt met de resultaten van tokens met de opgegeven kansdichtheid. Een waarde van 0,15 zorgt er bijvoorbeeld voor dat alleen de tokens die de bovenste 15% van de kansmassa omvatten, in aanmerking worden genomen. Het wordt niet aanbevolen om de temperatuur en top_p te wijzigen voor dezelfde voltooiingsaanvraag, omdat de interactie van deze twee instellingen moeilijk te voorspellen is.
topP?: number
Waarde van eigenschap
number
user
Een id voor de beller of eindgebruiker van de bewerking. Dit kan worden gebruikt voor tracerings- of snelheidsbeperkingsdoeleinden.
user?: string
Waarde van eigenschap
string
Details van overgenomen eigenschap
abortSignal
Het signaal dat kan worden gebruikt om aanvragen af te breken.
abortSignal?: AbortSignalLike
Waarde van eigenschap
Overgenomen van OperationOptions.abortSignal
onResponse
Een functie die moet worden aangeroepen telkens wanneer er een antwoord van de server wordt ontvangen tijdens het uitvoeren van de aangevraagde bewerking. Kan meerdere keren worden aangeroepen.
onResponse?: RawResponseCallback
Waarde van eigenschap
Overgenomen van OperationOptions.onResponse
requestOptions
Opties die worden gebruikt bij het maken en verzenden van HTTP-aanvragen voor deze bewerking.
requestOptions?: OperationRequestOptions
Waarde van eigenschap
Overgenomen van OperationOptions.requestOptions
tracingOptions
Opties die worden gebruikt wanneer tracering is ingeschakeld.
tracingOptions?: OperationTracingOptions
Waarde van eigenschap
Overgenomen van OperationOptions.tracingOptions
Azure SDK for JavaScript