Naslaginformatie: Voltooiingen | Azure AI Studio

Artikel
09/02/2024

Belangrijk

Sommige van de functies die in dit artikel worden beschreven, zijn mogelijk alleen beschikbaar in de preview-versie. Deze preview wordt aangeboden zonder een service level agreement en we raden deze niet aan voor productieworkloads. Misschien worden bepaalde functies niet ondersteund of zijn de mogelijkheden ervan beperkt. Zie Aanvullende gebruiksvoorwaarden voor Microsoft Azure-previews voor meer informatie.

Hiermee maakt u een voltooiing voor de opgegeven prompt en parameters.

POST /completions?api-version=2024-04-01-preview

Naam	In	Vereist	Type	Description
api-versie	query	Waar	tekenreeks	De versie van de API in de indeling 'JJJJ-MM-DD' of 'JJJJ-MM-DD-preview'.

Aanvraagkoptekst

Naam	Vereist	Type	Description
extra parameters		tekenreeks	Het gedrag van de API wanneer extra parameters worden aangegeven in de nettolading. Als `pass-through` u de API gebruikt om de parameter door te geven aan het onderliggende model. Gebruik deze waarde als u parameters wilt doorgeven die u kent die door het onderliggende model kunnen worden ondersteund. Als u de API gebruikt `ignore` om een niet-ondersteunde parameter te verwijderen. Gebruik deze waarde wanneer u dezelfde nettolading voor verschillende modellen moet gebruiken, maar een van de extra parameters kan een model tot een fout maken als dit niet wordt ondersteund. Door de API te gebruiken `error` om eventuele extra parameters in de nettolading te weigeren. Alleen parameters die in deze API zijn opgegeven, kunnen worden aangegeven of er wordt een 400-fout geretourneerd.
azureml-model-deployment		tekenreeks	De naam van de implementatie waarnaar u de aanvraag wilt routeren. Ondersteund voor eindpunten die ondersteuning bieden voor meerdere implementaties.

Aanvraagbody

Naam	Vereist	Type	Description
vraag	Waar		De prompts voor het genereren van voltooiingen voor, gecodeerd als een tekenreeks, matrix van tekenreeksen, matrix van tokens of matrix van tokenmatrices. Let op: `<\\|endoftext\\|>` het documentscheidingsteken dat het model tijdens de training ziet, dus als er geen prompt is opgegeven, wordt het model gegenereerd alsof het vanaf het begin van een nieuw document wordt gegenereerd.
frequency_penalty		Nummer	Positieve waarden bestraffen nieuwe tokens op basis van hun bestaande frequentie in de tekst, waardoor de kans dat het model dezelfde regelzin herhaalt, afneemt.
max_tokens		geheel getal	Het maximum aantal tokens dat kan worden gegenereerd in de voltooiing. Het tokenaantal van uw prompt plus `max_tokens` mag de contextlengte van het model niet overschrijden.
presence_penalty		Nummer	Positieve waarden bestraffen nieuwe tokens op basis van of ze tot nu toe worden weergegeven in de tekst, waardoor de kans op het model groter wordt om over nieuwe onderwerpen te praten.
seed		geheel getal	Indien opgegeven, doet het model er alles aan om een steekproef deterministisch uit te voeren, zodat herhaalde aanvragen met hetzelfde `seed` resultaat moeten retourneren. Determinisme is niet gegarandeerd en u moet verwijzen naar de `system_fingerprint` antwoordparameter om wijzigingen in de back-end te controleren.
stoppen			Reeksen waarbij de API stopt met het genereren van verdere tokens. De geretourneerde tekst bevat niet de stopvolgorde.
stroom		boolean	Of gedeeltelijke voortgang moet worden gestreamd. Als deze optie is ingesteld, worden tokens verzonden als gebeurtenissen die alleen door de server worden verzonden zodra ze beschikbaar komen, waarbij de stream wordt beëindigd door een `data: [DONE]` bericht.
temperatuur		Nummer	Welke steekproeftemperatuur moet worden gebruikt, tussen 0 en 2. Hogere waarden zoals 0,8 zorgen ervoor dat de uitvoer willekeuriger wordt, terwijl lagere waarden zoals 0,2 ervoor zorgen dat de uitvoer meer gericht en deterministisch wordt. Over het algemeen raden we aan om beide `temperature` te wijzigen of `top_p` niet beide.
top_p		Nummer	Een alternatief voor steekproeven met temperatuur, zogenaamde kernsampling, waarbij het model rekening houdt met de resultaten van de tokens met top_p waarschijnlijkheidsmassa. 0,1 betekent dus dat alleen de tokens die de top 10% kansdichtheid omvatten, worden beschouwd. Over het algemeen raden we aan om beide `top_p` te wijzigen of `temperature` niet beide.

Antwoorden

Name	Type	Description
200 OK	CreateCompletionResponse	OK
401 Onbevoegd	UnauthorizedError	Toegangstoken ontbreekt of is ongeldig Kopteksten x-ms-error-code: tekenreeks
404 Niet gevonden	NotFoundError	Modaliteit wordt niet ondersteund door het model. Raadpleeg de documentatie van het model om te zien welke routes beschikbaar zijn. Kopteksten x-ms-error-code: tekenreeks
422 Niet-verwerkte entiteit	UnprocessableContentError	De aanvraag bevat niet-verwerkte inhoud Kopteksten x-ms-error-code: tekenreeks
429 Te veel aanvragen	TooManyRequestsError	U hebt uw toegewezen frequentielimiet bereikt en uw aanvraag moet worden aangepast. Kopteksten x-ms-error-code: tekenreeks
Overige statuscodes	ContentFilterError	Ongeldige aanvraag Kopteksten x-ms-error-code: tekenreeks

Beveiliging

Autorisatie

Het token met het Bearer: voorvoegsel, bijvoorbeeld Bearer abcde12345

Type: apiKey
In: koptekst

AADToken

Azure Active Directory OAuth2-verificatie

Type: oauth2
Stroom: toepassing
Token-URL: https://login.microsoftonline.com/common/oauth2/v2.0/token

Voorbeelden

Hiermee maakt u een voltooiing voor de opgegeven prompt en parameters

Voorbeeldaanvraag

POST /completions?api-version=2024-04-01-preview

{
  "prompt": "This is a very good text",
  "frequency_penalty": 0,
  "presence_penalty": 0,
  "max_tokens": 256,
  "seed": 42,
  "stop": "<|endoftext|>",
  "stream": false,
  "temperature": 0,
  "top_p": 1
}

Voorbeeldantwoord

Statuscode: 200

{
  "id": "1234567890",
  "model": "llama2-7b",
  "choices": [
    {
      "index": 0,
      "finish_reason": "stop",
      "text": ", indeed it is a good one."
    }
  ],
  "created": 1234567890,
  "object": "text_completion",
  "usage": {
    "prompt_tokens": 15,
    "completion_tokens": 8,
    "total_tokens": 23
  }
}

Definities

Name	Beschrijving
Keuzen	Een lijst met opties voor chatvoltooiing.
CompletionFinishReason	De reden waarom het model geen tokens meer genereert. Dit is `stop` als het model een natuurlijk stoppunt of een opgegeven stopreeks bereikt, `length` als het maximum aantal tokens dat is opgegeven in de aanvraag is bereikt, `content_filter` als inhoud is weggelaten vanwege een vlag van onze inhoudsfilters.
CompletionUsage	Gebruiksstatistieken voor de voltooiingsaanvraag.
ContentFilterError	De API-aanroep mislukt wanneer de prompt een inhoudsfilter activeert zoals geconfigureerd. Wijzig de prompt en probeer het opnieuw.
CreateCompletionRequest
CreateCompletionResponse	Vertegenwoordigt een voltooiingsantwoord van de API.
Detail
TextCompletionObject	Het objecttype, dat altijd 'text_completion' is
UnprocessableContentError

Keuzen

Een lijst met opties voor chatvoltooiing.

Name	Type	Description
finish_reason	CompletionFinishReason	De reden waarom het model geen tokens meer genereert. Dit is `stop` als het model een natuurlijk stoppunt of een opgegeven stopreeks bereikt, `length` als het maximum aantal tokens dat is opgegeven in de aanvraag is bereikt, `content_filter` als inhoud is weggelaten vanwege een vlag van onze inhoudsfilters, `tool_calls` als het model een hulpprogramma wordt genoemd.
index	geheel getal	De index van de keuze in de lijst met keuzes.
sms verzenden	tekenreeks	De gegenereerde tekst.

CompletionFinishReason

De reden waarom het model geen tokens meer genereert. Dit is stop als het model een natuurlijk stoppunt of een opgegeven stopreeks bereikt, length als het maximum aantal tokens dat is opgegeven in de aanvraag is bereikt, content_filter als inhoud is weggelaten vanwege een vlag van onze inhoudsfilters.

Name	Type	Description
content_filter	tekenreeks
length	tekenreeks
stoppen	tekenreeks

CompletionUsage

Gebruiksstatistieken voor de voltooiingsaanvraag.

Name	Type	Description
completion_tokens	geheel getal	Aantal tokens in de gegenereerde voltooiing.
prompt_tokens	geheel getal	Aantal tokens in de prompt.
total_tokens	geheel getal	Het totale aantal tokens dat wordt gebruikt in de aanvraag (prompt + voltooiing).

ContentFilterError

De API-aanroep mislukt wanneer de prompt een inhoudsfilter activeert zoals geconfigureerd. Wijzig de prompt en probeer het opnieuw.

Name	Type	Description
code	tekenreeks	De foutcode.
error	tekenreeks	De foutbeschrijving.
bericht	tekenreeks	Het foutbericht.
param	tekenreeks	De parameter die het inhoudsfilter heeft geactiveerd.
status	geheel getal	De HTTP-statuscode.

CreateCompletionRequest

Name	Type	Standaardwaarde	Beschrijving
frequency_penalty	Nummer	0	Positieve waarden bestraffen nieuwe tokens op basis van hun bestaande frequentie in de tekst, waardoor de kans dat het model dezelfde regelzin herhaalt, afneemt.
max_tokens	geheel getal	256	Het maximum aantal tokens dat kan worden gegenereerd in de voltooiing. Het tokenaantal van uw prompt plus `max_tokens` mag de contextlengte van het model niet overschrijden.
presence_penalty	Nummer	0	Positieve waarden bestraffen nieuwe tokens op basis van of ze tot nu toe worden weergegeven in de tekst, waardoor de kans op het model groter wordt om over nieuwe onderwerpen te praten.
vraag		`<\\|endoftext\\|>`	De prompts voor het genereren van voltooiingen voor, gecodeerd als een tekenreeks, matrix van tekenreeksen, matrix van tokens of matrix van tokenmatrices. Let op: `<\\|endoftext\\|>` het documentscheidingsteken dat het model tijdens de training ziet, dus als er geen prompt is opgegeven, wordt het model gegenereerd alsof het vanaf het begin van een nieuw document wordt gegenereerd.
seed	geheel getal		Indien opgegeven, zal ons systeem een best inspanning leveren om de steekproef deterministisch uit te voeren, zodat herhaalde aanvragen met hetzelfde `seed` en parameters hetzelfde resultaat moeten retourneren. Determinisme is niet gegarandeerd en u moet verwijzen naar de `system_fingerprint` antwoordparameter om wijzigingen in de back-end te controleren.
stoppen			Reeksen waarbij de API stopt met het genereren van verdere tokens. De geretourneerde tekst bevat niet de stopvolgorde.
stroom	boolean	Onwaar	Of gedeeltelijke voortgang moet worden gestreamd. Als deze optie is ingesteld, worden tokens verzonden als gebeurtenissen die alleen door de server worden verzonden zodra ze beschikbaar komen, waarbij de stream wordt beëindigd door een `data: [DONE]` bericht.
temperatuur	Nummer	1	Welke steekproeftemperatuur moet worden gebruikt, tussen 0 en 2. Hogere waarden zoals 0,8 zorgen ervoor dat de uitvoer willekeuriger wordt, terwijl lagere waarden zoals 0,2 ervoor zorgen dat de uitvoer meer gericht en deterministisch wordt. Over het algemeen raden we u aan dit of `top_p` niet beide te wijzigen.
top_p	Nummer	1	Een alternatief voor steekproeven met temperatuur, zogenaamde kernsampling, waarbij het model rekening houdt met de resultaten van de tokens met top_p waarschijnlijkheidsmassa. 0,1 betekent dus dat alleen de tokens die de top 10% kansdichtheid omvatten, worden beschouwd. Over het algemeen raden we u aan dit of `temperature` niet beide te wijzigen.

CreateCompletionResponse

Vertegenwoordigt een voltooiingsantwoord van de API. Opmerking: zowel de gestreamde als niet-gestreamde antwoordobjecten delen dezelfde vorm (in tegenstelling tot het chateindpunt).

Name	Type	Description
Keuzes	Keuzes[]	De lijst met voltooiingskeuzen die het model heeft gegenereerd voor de invoerprompt.
aangemaakt	geheel getal	De Unix-tijdstempel (in seconden) van het moment waarop de voltooiing is gemaakt.
Id	tekenreeks	Een unieke id voor de voltooiing.
model	tekenreeks	Het model dat wordt gebruikt voor voltooiing.
object	TextCompletionObject	Het objecttype, dat altijd 'text_completion' is
system_fingerprint	tekenreeks	Deze vingerafdruk vertegenwoordigt de back-endconfiguratie waarmee het model wordt uitgevoerd. Kan worden gebruikt met de `seed` aanvraagparameter om te begrijpen wanneer er back-endwijzigingen zijn aangebracht die van invloed kunnen zijn op determinisme.
gebruikt	CompletionUsage	Gebruiksstatistieken voor de voltooiingsaanvraag.

Detail

Name	Type	Description
LOC	tekenreeks[]	De parameter die het probleem veroorzaakt
waarde	tekenreeks	De waarde die is doorgegeven aan de parameter die problemen veroorzaakt.

TextCompletionObject

Het objecttype, dat altijd 'text_completion' is

Name	Type	Description
text_completion	tekenreeks

ListObject

Het objecttype, dat altijd 'list' is.

Name	Type	Omschrijving
lijst	tekenreeks

NotFoundError

Name	Type	Description
error	tekenreeks	De foutbeschrijving.
bericht	tekenreeks	Het foutbericht.
status	geheel getal	De HTTP-statuscode.

TooManyRequestsError

Name	Type	Description
error	tekenreeks	De foutbeschrijving.
bericht	tekenreeks	Het foutbericht.
status	geheel getal	De HTTP-statuscode.

UnauthorizedError

Name	Type	Description
error	tekenreeks	De foutbeschrijving.
bericht	tekenreeks	Het foutbericht.
status	geheel getal	De HTTP-statuscode.

UnprocessableContentError

Name	Type	Description
code	tekenreeks	De foutcode.
gedetailleerd	Detail
error	tekenreeks	De foutbeschrijving.
bericht	tekenreeks	Het foutbericht.
status	geheel getal	De HTTP-statuscode.

Delen via