GetChatCompletionsOptions interface
Deze module bevat modellen die we naast de bijbehorende gegenereerde modellen willen gebruiken. Dit is handig voor het leveren van klantgerichte modellen met andere namen/typen dan de gegenereerde modellen.
- Extends
Eigenschappen
azure |
De configuratie-vermeldingen voor Azure OpenAI-chatextensies die deze gebruiken. Deze aanvullende specificatie is alleen compatibel met Azure OpenAI. |
frequency |
Een waarde die van invloed is op de waarschijnlijkheid van gegenereerde tokens die worden weergegeven op basis van hun cumulatieve frequentie in gegenereerde tekst. Positieve waarden zorgen ervoor dat tokens minder snel worden weergegeven naarmate hun frequentie toeneemt en de kans dat het model dezelfde instructies letterlijk herhaalt. |
function |
Hiermee bepaalt u hoe het model reageert op functie-aanroepen. 'geen' betekent dat het model geen functie aanroept en reageert op de eindgebruiker. 'auto' betekent dat het model kan kiezen tussen een eindgebruiker of het aanroepen van een functie.
Het opgeven van een bepaalde functie via |
functions | Een lijst met functies waarvoor het model JSON-invoer kan genereren. |
logit |
Een toewijzing tussen GPT-token-id's en bias-scores die van invloed zijn op de waarschijnlijkheid van specifieke tokens die worden weergegeven in een voltooiingsreactie. Token-id's worden berekend via externe tokenizer-hulpprogramma's, terwijl biasscores zich respectievelijk in het bereik van -100 tot 100 bevinden met een minimum- en maximumwaarde die overeenkomt met een volledige ban of exclusieve selectie van een token. Het exacte gedrag van een bepaalde bias-score verschilt per model. |
max |
Het maximum aantal tokens dat moet worden gegenereerd. |
n | Het aantal opties voor het voltooien van chats dat moet worden gegenereerd voor een antwoord op voltooiing van een chat. Omdat deze instelling veel voltooiingen kan genereren, kan het tokenquotum snel worden verbruikt. Gebruik zorgvuldig en zorg voor redelijke instellingen voor maxTokens en stop. |
presence |
Een waarde die van invloed is op de waarschijnlijkheid van gegenereerde tokens die worden weergegeven op basis van hun bestaande aanwezigheid in gegenereerde tekst. Positieve waarden zorgen ervoor dat tokens minder snel worden weergegeven wanneer ze al bestaan en vergroten de kans dat het model nieuwe onderwerpen uitvoert. |
response |
Een object dat de indeling aangeeft die het model moet uitvoeren. Wordt gebruikt om de JSON-modus in te schakelen. |
seed | Indien opgegeven, zal het systeem proberen deterministisch steekproeven te nemen, zodat herhaalde aanvragen met dezelfde seed en parameters hetzelfde resultaat moeten retourneren. Determinisme wordt niet gegarandeerd en u moet verwijzen naar de parameter system_fingerprint antwoord om wijzigingen in de back-end te bewaken. |
stop | Een verzameling tekstreeksen waarmee het genereren van voltooiingen wordt beƫindigd. |
temperature | De te gebruiken steekproeftemperatuur die de schijnbare creativiteit van gegenereerde voltooiingen bepaalt. Met hogere waarden wordt de uitvoer willekeuriger, terwijl lagere waarden de resultaten meer gericht en deterministisch maken. Het wordt niet aanbevolen om temperatuur en topP te wijzigen voor dezelfde voltooiingsaanvraag, omdat de interactie van deze twee instellingen moeilijk te voorspellen is. |
tool |
Indien opgegeven, configureert het model welke van de opgegeven hulpprogramma's het kan gebruiken voor het antwoord op voltooiing van de chat. |
tools | De beschikbare hulpprogrammadefinities die de chat-voltooiingsaanvraag kan gebruiken, inclusief door de beller gedefinieerde functies. |
topP | Een alternatief voor monstername met temperatuur, ook wel kernmonsters genomen. Deze waarde zorgt ervoor dat het model rekening houdt met de resultaten van tokens met de opgegeven waarschijnlijkheidsmassa. Een waarde van 0,15 zorgt er bijvoorbeeld voor dat alleen de tokens die de bovenste 15% van de waarschijnlijkheidsmassa omvatten, in aanmerking worden genomen. Het wordt niet aanbevolen om temperatuur en topP te wijzigen voor dezelfde voltooiingsaanvraag, omdat de interactie van deze twee instellingen moeilijk te voorspellen is. |
user | Een id voor de beller of eindgebruiker van de bewerking. Dit kan worden gebruikt voor tracerings- of snelheidsbeperkingsdoeleinden. |
Overgenomen eigenschappen
abort |
Het signaal dat kan worden gebruikt om aanvragen af te breken. |
on |
Een functie die telkens wordt aangeroepen wanneer er een antwoord van de server wordt ontvangen tijdens het uitvoeren van de aangevraagde bewerking. Kan meerdere keren worden aangeroepen. |
request |
Opties die worden gebruikt bij het maken en verzenden van HTTP-aanvragen voor deze bewerking. |
tracing |
Opties die worden gebruikt wanneer tracering is ingeschakeld. |
Eigenschapdetails
azureExtensionOptions
De configuratie-vermeldingen voor Azure OpenAI-chatextensies die deze gebruiken. Deze aanvullende specificatie is alleen compatibel met Azure OpenAI.
azureExtensionOptions?: AzureExtensionsOptions
Waarde van eigenschap
frequencyPenalty
Een waarde die van invloed is op de waarschijnlijkheid van gegenereerde tokens die worden weergegeven op basis van hun cumulatieve frequentie in gegenereerde tekst. Positieve waarden zorgen ervoor dat tokens minder snel worden weergegeven naarmate hun frequentie toeneemt en de kans dat het model dezelfde instructies letterlijk herhaalt.
frequencyPenalty?: number
Waarde van eigenschap
number
functionCall
Hiermee bepaalt u hoe het model reageert op functie-aanroepen. 'geen' betekent dat het model geen functie aanroept en reageert op de eindgebruiker. 'auto' betekent dat het model kan kiezen tussen een eindgebruiker of het aanroepen van een functie.
Het opgeven van een bepaalde functie via {"name": "my_function"}
dwingt het model om die functie aan te roepen.
'none' is de standaardwaarde wanneer er geen functies aanwezig zijn. 'auto' is de standaardwaarde als er functies aanwezig zijn.
functionCall?: string | FunctionName
Waarde van eigenschap
string | FunctionName
functions
Een lijst met functies waarvoor het model JSON-invoer kan genereren.
functions?: FunctionDefinition[]
Waarde van eigenschap
logitBias
Een toewijzing tussen GPT-token-id's en bias-scores die van invloed zijn op de waarschijnlijkheid van specifieke tokens die worden weergegeven in een voltooiingsreactie. Token-id's worden berekend via externe tokenizer-hulpprogramma's, terwijl biasscores zich respectievelijk in het bereik van -100 tot 100 bevinden met een minimum- en maximumwaarde die overeenkomt met een volledige ban of exclusieve selectie van een token. Het exacte gedrag van een bepaalde bias-score verschilt per model.
logitBias?: Record<string, number>
Waarde van eigenschap
Record<string, number>
maxTokens
Het maximum aantal tokens dat moet worden gegenereerd.
maxTokens?: number
Waarde van eigenschap
number
n
Het aantal opties voor het voltooien van chats dat moet worden gegenereerd voor een antwoord op voltooiing van een chat. Omdat deze instelling veel voltooiingen kan genereren, kan het tokenquotum snel worden verbruikt. Gebruik zorgvuldig en zorg voor redelijke instellingen voor maxTokens en stop.
n?: number
Waarde van eigenschap
number
presencePenalty
Een waarde die van invloed is op de waarschijnlijkheid van gegenereerde tokens die worden weergegeven op basis van hun bestaande aanwezigheid in gegenereerde tekst. Positieve waarden zorgen ervoor dat tokens minder snel worden weergegeven wanneer ze al bestaan en vergroten de kans dat het model nieuwe onderwerpen uitvoert.
presencePenalty?: number
Waarde van eigenschap
number
responseFormat
Een object dat de indeling aangeeft die het model moet uitvoeren. Wordt gebruikt om de JSON-modus in te schakelen.
responseFormat?: ChatCompletionsResponseFormat
Waarde van eigenschap
seed
Indien opgegeven, zal het systeem proberen deterministisch steekproeven te nemen, zodat herhaalde aanvragen met dezelfde seed en parameters hetzelfde resultaat moeten retourneren. Determinisme wordt niet gegarandeerd en u moet verwijzen naar de parameter system_fingerprint antwoord om wijzigingen in de back-end te bewaken.
seed?: number
Waarde van eigenschap
number
stop
Een verzameling tekstreeksen waarmee het genereren van voltooiingen wordt beƫindigd.
stop?: string[]
Waarde van eigenschap
string[]
temperature
De te gebruiken steekproeftemperatuur die de schijnbare creativiteit van gegenereerde voltooiingen bepaalt. Met hogere waarden wordt de uitvoer willekeuriger, terwijl lagere waarden de resultaten meer gericht en deterministisch maken. Het wordt niet aanbevolen om temperatuur en topP te wijzigen voor dezelfde voltooiingsaanvraag, omdat de interactie van deze twee instellingen moeilijk te voorspellen is.
temperature?: number
Waarde van eigenschap
number
toolChoice
Indien opgegeven, configureert het model welke van de opgegeven hulpprogramma's het kan gebruiken voor het antwoord op voltooiing van de chat.
toolChoice?: ChatCompletionsNamedToolSelectionUnion
Waarde van eigenschap
tools
De beschikbare hulpprogrammadefinities die de chat-voltooiingsaanvraag kan gebruiken, inclusief door de beller gedefinieerde functies.
tools?: ChatCompletionsToolDefinitionUnion[]
Waarde van eigenschap
topP
Een alternatief voor monstername met temperatuur, ook wel kernmonsters genomen. Deze waarde zorgt ervoor dat het model rekening houdt met de resultaten van tokens met de opgegeven waarschijnlijkheidsmassa. Een waarde van 0,15 zorgt er bijvoorbeeld voor dat alleen de tokens die de bovenste 15% van de waarschijnlijkheidsmassa omvatten, in aanmerking worden genomen. Het wordt niet aanbevolen om temperatuur en topP te wijzigen voor dezelfde voltooiingsaanvraag, omdat de interactie van deze twee instellingen moeilijk te voorspellen is.
topP?: number
Waarde van eigenschap
number
user
Een id voor de beller of eindgebruiker van de bewerking. Dit kan worden gebruikt voor tracerings- of snelheidsbeperkingsdoeleinden.
user?: string
Waarde van eigenschap
string
Details van overgenomen eigenschap
abortSignal
Het signaal dat kan worden gebruikt om aanvragen af te breken.
abortSignal?: AbortSignalLike
Waarde van eigenschap
Overgenomen van OperationOptions.abortSignal
onResponse
Een functie die telkens wordt aangeroepen wanneer er een antwoord van de server wordt ontvangen tijdens het uitvoeren van de aangevraagde bewerking. Kan meerdere keren worden aangeroepen.
onResponse?: RawResponseCallback
Waarde van eigenschap
Overgenomen van OperationOptions.onResponse
requestOptions
Opties die worden gebruikt bij het maken en verzenden van HTTP-aanvragen voor deze bewerking.
requestOptions?: OperationRequestOptions
Waarde van eigenschap
Overgenomen van OperationOptions.requestOptions
tracingOptions
Opties die worden gebruikt wanneer tracering is ingeschakeld.
tracingOptions?: OperationTracingOptions
Waarde van eigenschap
Overgenomen van OperationOptions.tracingOptions
Azure SDK for JavaScript