Naslaginformatie: Voltooiingen | Azure AI Studio
Belangrijk
Sommige van de functies die in dit artikel worden beschreven, zijn mogelijk alleen beschikbaar in de preview-versie. Deze preview wordt aangeboden zonder een service level agreement en we raden deze niet aan voor productieworkloads. Misschien worden bepaalde functies niet ondersteund of zijn de mogelijkheden ervan beperkt. Zie Aanvullende gebruiksvoorwaarden voor Microsoft Azure-previews voor meer informatie.
Hiermee maakt u een voltooiing voor de opgegeven prompt en parameters.
POST /completions?api-version=2024-04-01-preview
Naam | In | Vereist | Type | Description |
---|---|---|---|---|
api-versie | query | Waar | tekenreeks | De versie van de API in de indeling 'JJJJ-MM-DD' of 'JJJJ-MM-DD-preview'. |
Aanvraagkoptekst
Naam | Vereist | Type | Description |
---|---|---|---|
extra parameters | tekenreeks | Het gedrag van de API wanneer extra parameters worden aangegeven in de nettolading. Als pass-through u de API gebruikt om de parameter door te geven aan het onderliggende model. Gebruik deze waarde als u parameters wilt doorgeven die u kent die door het onderliggende model kunnen worden ondersteund. Als u de API gebruikt ignore om een niet-ondersteunde parameter te verwijderen. Gebruik deze waarde wanneer u dezelfde nettolading voor verschillende modellen moet gebruiken, maar een van de extra parameters kan een model tot een fout maken als dit niet wordt ondersteund. Door de API te gebruiken error om eventuele extra parameters in de nettolading te weigeren. Alleen parameters die in deze API zijn opgegeven, kunnen worden aangegeven of er wordt een 400-fout geretourneerd. |
|
azureml-model-deployment | tekenreeks | De naam van de implementatie waarnaar u de aanvraag wilt routeren. Ondersteund voor eindpunten die ondersteuning bieden voor meerdere implementaties. |
Aanvraagbody
Naam | Vereist | Type | Description |
---|---|---|---|
vraag | Waar | De prompts voor het genereren van voltooiingen voor, gecodeerd als een tekenreeks, matrix van tekenreeksen, matrix van tokens of matrix van tokenmatrices. Let op: <\|endoftext\|> het documentscheidingsteken dat het model tijdens de training ziet, dus als er geen prompt is opgegeven, wordt het model gegenereerd alsof het vanaf het begin van een nieuw document wordt gegenereerd. |
|
frequency_penalty | Nummer | Positieve waarden bestraffen nieuwe tokens op basis van hun bestaande frequentie in de tekst, waardoor de kans dat het model dezelfde regelzin herhaalt, afneemt. | |
max_tokens | geheel getal | Het maximum aantal tokens dat kan worden gegenereerd in de voltooiing. Het tokenaantal van uw prompt plus max_tokens mag de contextlengte van het model niet overschrijden. |
|
presence_penalty | Nummer | Positieve waarden bestraffen nieuwe tokens op basis van of ze tot nu toe worden weergegeven in de tekst, waardoor de kans op het model groter wordt om over nieuwe onderwerpen te praten. | |
seed | geheel getal | Indien opgegeven, doet het model er alles aan om een steekproef deterministisch uit te voeren, zodat herhaalde aanvragen met hetzelfde seed resultaat moeten retourneren.Determinisme is niet gegarandeerd en u moet verwijzen naar de system_fingerprint antwoordparameter om wijzigingen in de back-end te controleren. |
|
stoppen | Reeksen waarbij de API stopt met het genereren van verdere tokens. De geretourneerde tekst bevat niet de stopvolgorde. | ||
stroom | boolean | Of gedeeltelijke voortgang moet worden gestreamd. Als deze optie is ingesteld, worden tokens verzonden als gebeurtenissen die alleen door de server worden verzonden zodra ze beschikbaar komen, waarbij de stream wordt beƫindigd door een data: [DONE] bericht. |
|
temperatuur | Nummer | Welke steekproeftemperatuur moet worden gebruikt, tussen 0 en 2. Hogere waarden zoals 0,8 zorgen ervoor dat de uitvoer willekeuriger wordt, terwijl lagere waarden zoals 0,2 ervoor zorgen dat de uitvoer meer gericht en deterministisch wordt. Over het algemeen raden we aan om beide temperature te wijzigen of top_p niet beide. |
|
top_p | Nummer | Een alternatief voor steekproeven met temperatuur, zogenaamde kernsampling, waarbij het model rekening houdt met de resultaten van de tokens met top_p waarschijnlijkheidsmassa. 0,1 betekent dus dat alleen de tokens die de top 10% kansdichtheid omvatten, worden beschouwd. Over het algemeen raden we aan om beide top_p te wijzigen of temperature niet beide. |
Antwoorden
Name | Type | Description |
---|---|---|
200 OK | CreateCompletionResponse | OK |
401 Onbevoegd | UnauthorizedError | Toegangstoken ontbreekt of is ongeldig Kopteksten x-ms-error-code: tekenreeks |
404 Niet gevonden | NotFoundError | Modaliteit wordt niet ondersteund door het model. Raadpleeg de documentatie van het model om te zien welke routes beschikbaar zijn. Kopteksten x-ms-error-code: tekenreeks |
422 Niet-verwerkte entiteit | UnprocessableContentError | De aanvraag bevat niet-verwerkte inhoud Kopteksten x-ms-error-code: tekenreeks |
429 Te veel aanvragen | TooManyRequestsError | U hebt uw toegewezen frequentielimiet bereikt en uw aanvraag moet worden aangepast. Kopteksten x-ms-error-code: tekenreeks |
Overige statuscodes | ContentFilterError | Ongeldige aanvraag Kopteksten x-ms-error-code: tekenreeks |
Beveiliging
Autorisatie
Het token met het Bearer:
voorvoegsel, bijvoorbeeld Bearer abcde12345
Type: apiKey
In: koptekst
AADToken
Azure Active Directory OAuth2-verificatie
Type: oauth2
Stroom: toepassing
Token-URL: https://login.microsoftonline.com/common/oauth2/v2.0/token
Voorbeelden
Hiermee maakt u een voltooiing voor de opgegeven prompt en parameters
Voorbeeldaanvraag
POST /completions?api-version=2024-04-01-preview
{
"prompt": "This is a very good text",
"frequency_penalty": 0,
"presence_penalty": 0,
"max_tokens": 256,
"seed": 42,
"stop": "<|endoftext|>",
"stream": false,
"temperature": 0,
"top_p": 1
}
Voorbeeldantwoord
Statuscode: 200
{
"id": "1234567890",
"model": "llama2-7b",
"choices": [
{
"index": 0,
"finish_reason": "stop",
"text": ", indeed it is a good one."
}
],
"created": 1234567890,
"object": "text_completion",
"usage": {
"prompt_tokens": 15,
"completion_tokens": 8,
"total_tokens": 23
}
}
Definities
Name | Beschrijving |
---|---|
Keuzen | Een lijst met opties voor chatvoltooiing. |
CompletionFinishReason | De reden waarom het model geen tokens meer genereert. Dit is stop als het model een natuurlijk stoppunt of een opgegeven stopreeks bereikt, length als het maximum aantal tokens dat is opgegeven in de aanvraag is bereikt, content_filter als inhoud is weggelaten vanwege een vlag van onze inhoudsfilters. |
CompletionUsage | Gebruiksstatistieken voor de voltooiingsaanvraag. |
ContentFilterError | De API-aanroep mislukt wanneer de prompt een inhoudsfilter activeert zoals geconfigureerd. Wijzig de prompt en probeer het opnieuw. |
CreateCompletionRequest | |
CreateCompletionResponse | Vertegenwoordigt een voltooiingsantwoord van de API. |
Detail | |
TextCompletionObject | Het objecttype, dat altijd 'text_completion' is |
UnprocessableContentError |
Keuzen
Een lijst met opties voor chatvoltooiing.
Name | Type | Description |
---|---|---|
finish_reason | CompletionFinishReason | De reden waarom het model geen tokens meer genereert. Dit is stop als het model een natuurlijk stoppunt of een opgegeven stopreeks bereikt, length als het maximum aantal tokens dat is opgegeven in de aanvraag is bereikt, content_filter als inhoud is weggelaten vanwege een vlag van onze inhoudsfilters, tool_calls als het model een hulpprogramma wordt genoemd. |
index | geheel getal | De index van de keuze in de lijst met keuzes. |
sms verzenden | tekenreeks | De gegenereerde tekst. |
CompletionFinishReason
De reden waarom het model geen tokens meer genereert. Dit is stop
als het model een natuurlijk stoppunt of een opgegeven stopreeks bereikt, length
als het maximum aantal tokens dat is opgegeven in de aanvraag is bereikt, content_filter
als inhoud is weggelaten vanwege een vlag van onze inhoudsfilters.
Name | Type | Description |
---|---|---|
content_filter | tekenreeks | |
length | tekenreeks | |
stoppen | tekenreeks |
CompletionUsage
Gebruiksstatistieken voor de voltooiingsaanvraag.
Name | Type | Description |
---|---|---|
completion_tokens | geheel getal | Aantal tokens in de gegenereerde voltooiing. |
prompt_tokens | geheel getal | Aantal tokens in de prompt. |
total_tokens | geheel getal | Het totale aantal tokens dat wordt gebruikt in de aanvraag (prompt + voltooiing). |
ContentFilterError
De API-aanroep mislukt wanneer de prompt een inhoudsfilter activeert zoals geconfigureerd. Wijzig de prompt en probeer het opnieuw.
Name | Type | Description |
---|---|---|
code | tekenreeks | De foutcode. |
error | tekenreeks | De foutbeschrijving. |
bericht | tekenreeks | Het foutbericht. |
param | tekenreeks | De parameter die het inhoudsfilter heeft geactiveerd. |
status | geheel getal | De HTTP-statuscode. |
CreateCompletionRequest
Name | Type | Standaardwaarde | Beschrijving |
---|---|---|---|
frequency_penalty | Nummer | 0 | Positieve waarden bestraffen nieuwe tokens op basis van hun bestaande frequentie in de tekst, waardoor de kans dat het model dezelfde regelzin herhaalt, afneemt. |
max_tokens | geheel getal | 256 | Het maximum aantal tokens dat kan worden gegenereerd in de voltooiing. Het tokenaantal van uw prompt plus max_tokens mag de contextlengte van het model niet overschrijden. |
presence_penalty | Nummer | 0 | Positieve waarden bestraffen nieuwe tokens op basis van of ze tot nu toe worden weergegeven in de tekst, waardoor de kans op het model groter wordt om over nieuwe onderwerpen te praten. |
vraag | <\|endoftext\|> |
De prompts voor het genereren van voltooiingen voor, gecodeerd als een tekenreeks, matrix van tekenreeksen, matrix van tokens of matrix van tokenmatrices. Let op: <\|endoftext\|> het documentscheidingsteken dat het model tijdens de training ziet, dus als er geen prompt is opgegeven, wordt het model gegenereerd alsof het vanaf het begin van een nieuw document wordt gegenereerd. |
|
seed | geheel getal | Indien opgegeven, zal ons systeem een best inspanning leveren om de steekproef deterministisch uit te voeren, zodat herhaalde aanvragen met hetzelfde seed en parameters hetzelfde resultaat moeten retourneren.Determinisme is niet gegarandeerd en u moet verwijzen naar de system_fingerprint antwoordparameter om wijzigingen in de back-end te controleren. |
|
stoppen | Reeksen waarbij de API stopt met het genereren van verdere tokens. De geretourneerde tekst bevat niet de stopvolgorde. | ||
stroom | boolean | Onwaar | Of gedeeltelijke voortgang moet worden gestreamd. Als deze optie is ingesteld, worden tokens verzonden als gebeurtenissen die alleen door de server worden verzonden zodra ze beschikbaar komen, waarbij de stream wordt beƫindigd door een data: [DONE] bericht. |
temperatuur | Nummer | 1 | Welke steekproeftemperatuur moet worden gebruikt, tussen 0 en 2. Hogere waarden zoals 0,8 zorgen ervoor dat de uitvoer willekeuriger wordt, terwijl lagere waarden zoals 0,2 ervoor zorgen dat de uitvoer meer gericht en deterministisch wordt. Over het algemeen raden we u aan dit of top_p niet beide te wijzigen. |
top_p | Nummer | 1 | Een alternatief voor steekproeven met temperatuur, zogenaamde kernsampling, waarbij het model rekening houdt met de resultaten van de tokens met top_p waarschijnlijkheidsmassa. 0,1 betekent dus dat alleen de tokens die de top 10% kansdichtheid omvatten, worden beschouwd. Over het algemeen raden we u aan dit of temperature niet beide te wijzigen. |
CreateCompletionResponse
Vertegenwoordigt een voltooiingsantwoord van de API. Opmerking: zowel de gestreamde als niet-gestreamde antwoordobjecten delen dezelfde vorm (in tegenstelling tot het chateindpunt).
Name | Type | Description |
---|---|---|
Keuzes | Keuzes[] | De lijst met voltooiingskeuzen die het model heeft gegenereerd voor de invoerprompt. |
aangemaakt | geheel getal | De Unix-tijdstempel (in seconden) van het moment waarop de voltooiing is gemaakt. |
Id | tekenreeks | Een unieke id voor de voltooiing. |
model | tekenreeks | Het model dat wordt gebruikt voor voltooiing. |
object | TextCompletionObject | Het objecttype, dat altijd 'text_completion' is |
system_fingerprint | tekenreeks | Deze vingerafdruk vertegenwoordigt de back-endconfiguratie waarmee het model wordt uitgevoerd. Kan worden gebruikt met de seed aanvraagparameter om te begrijpen wanneer er back-endwijzigingen zijn aangebracht die van invloed kunnen zijn op determinisme. |
gebruikt | CompletionUsage | Gebruiksstatistieken voor de voltooiingsaanvraag. |
Detail
Name | Type | Description |
---|---|---|
LOC | tekenreeks[] | De parameter die het probleem veroorzaakt |
waarde | tekenreeks | De waarde die is doorgegeven aan de parameter die problemen veroorzaakt. |
TextCompletionObject
Het objecttype, dat altijd 'text_completion' is
Name | Type | Description |
---|---|---|
text_completion | tekenreeks |
ListObject
Het objecttype, dat altijd 'list' is.
Name | Type | Omschrijving |
---|---|---|
lijst | tekenreeks |
NotFoundError
Name | Type | Description |
---|---|---|
error | tekenreeks | De foutbeschrijving. |
bericht | tekenreeks | Het foutbericht. |
status | geheel getal | De HTTP-statuscode. |
TooManyRequestsError
Name | Type | Description |
---|---|---|
error | tekenreeks | De foutbeschrijving. |
bericht | tekenreeks | Het foutbericht. |
status | geheel getal | De HTTP-statuscode. |
UnauthorizedError
Name | Type | Description |
---|---|---|
error | tekenreeks | De foutbeschrijving. |
bericht | tekenreeks | Het foutbericht. |
status | geheel getal | De HTTP-statuscode. |
UnprocessableContentError
Name | Type | Description |
---|---|---|
code | tekenreeks | De foutcode. |
gedetailleerd | Detail | |
error | tekenreeks | De foutbeschrijving. |
bericht | tekenreeks | Het foutbericht. |
status | geheel getal | De HTTP-statuscode. |