Referencia: Befejezések | Azure Machine Learning
Befejezést hoz létre a megadott parancssorhoz és paraméterekhez.
POST /completions?api-version=2024-04-01-preview
Név | In | Kötelező | Típus | Leírás |
---|---|---|---|---|
api-verzió | Lekérdezés | Igaz | húr | Az API verziója "YYYY-MM-DD" vagy "YYYY-MM-DD-preview" formátumban. |
Kérelem fejléce
Név | Kötelező | Típus | Leírás |
---|---|---|---|
extra paraméterek | húr | Az API viselkedése, amikor a hasznos adatok további paramétereket jeleznek. A használatával pass-through az API átadja a paramétert a mögöttes modellnek. Ezt az értéket akkor használja, ha olyan paramétereket szeretne átadni, amelyeket az alapul szolgáló modell támogat. Az API használatával ignore elveti a nem támogatott paramétereket. Ezt az értéket akkor használja, ha ugyanazokat a hasznos adatokat kell használnia a különböző modelleken, de az egyik extra paraméter miatt előfordulhat, hogy a modell hibát jelez, ha nem támogatott. A használatával error az API elutasítja a hasznos adatokban lévő további paramétereket. Csak az API-ban megadott paraméterek jelezhetők, vagy 400-es hiba jelenik meg. |
|
azureml-model-deployment | húr | Annak az üzemelő példánynak a neve, amelyhez a kérést irányítani szeretné. Több üzembe helyezést támogató végpontok esetén támogatott. |
Kérelem törzse
Név | Kötelező | Típus | Leírás |
---|---|---|---|
haladéktalan | Igaz | A rendszer kéri a befejezések létrehozására, sztringként kódolva, sztringek tömbjeként, jogkivonatok tömbjeként vagy tokentömbök tömbjeként. Vegye figyelembe, hogy <\|endoftext\|> ez a dokumentumelválasztó, amelyet a modell a betanítás során lát, így ha nincs megadva egy kérés, a modell úgy jön létre, mintha egy új dokumentum elejétől származna. |
|
frequency_penalty | szám | A pozitív értékek a szövegben meglévő gyakoriságuk alapján büntetik az új jogkivonatokat, így csökken annak a valószínűsége, hogy a modell ugyanazt a sort szó szerint megismételi. | |
max_tokens | egész szám | A befejezés során létrehozható jogkivonatok maximális száma. A prompt plus max_tokens tokenszáma nem haladhatja meg a modell környezethosszát. |
|
presence_penalty | szám | A pozitív értékek büntetik az új jogkivonatokat attól függően, hogy az eddig megjelennek-e a szövegben, növelve a modell valószínűségét, hogy új témakörökről beszéljenek. | |
mag | egész szám | Ha meg van adva, a modell mindent megtesz annak érdekében, hogy determinisztikus módon mintát adjon, így az azonos seed és paraméterekkel rendelkező ismétlődő kérelmeknek ugyanazt az eredményt kell visszaadnia.A determinizmus nem garantált, és a háttérrendszer változásainak figyeléséhez tekintse meg a system_fingerprint válaszparamétert. |
|
állj | Olyan sorozatok, amelyekben az API leállítja a további jogkivonatok generálását. A visszaadott szöveg nem tartalmazza a leállítási sorozatot. | ||
patak | Logikai | Azt határozza meg, hogy vissza szeretné-e streamelni a részleges előrehaladást. Ha be van állítva, a jogkivonatok csak a kiszolgáló által küldött eseményekként lesznek elküldve, amint elérhetővé válnak, és a streamet egy data: [DONE] üzenet leállítja. |
|
hőmérséklet | szám | Milyen mintavételi hőmérsékletet kell használni, 0 és 2 között. A magasabb értékek, például a 0,8 véletlenszerűbbé teszik a kimenetet, míg az alacsonyabb értékek, például a 0,2, koncentráltabbá és determinisztikusabbá teszik a kimenetet. Általában azt javasoljuk, hogy módosítsa vagy temperature top_p ne mindkettőt. |
|
top_p | szám | A hőmérséklettel történő mintavételezés alternatíva, az úgynevezett magmintavétel, ahol a modell a tokenek eredményeit top_p valószínűségi tömeggel veszi figyelembe. A 0.1 tehát csak a felső 10%-os valószínűségi tömeget tartalmazó jogkivonatokat jelenti. Általában azt javasoljuk, hogy módosítsa vagy top_p temperature ne mindkettőt. |
Válaszok
Név | Típus | Leírás |
---|---|---|
200 OK | CreateCompletionResponse | OK |
401 Nem engedélyezett | UnauthorizedError | A hozzáférési jogkivonat hiányzik vagy érvénytelen Fejlécek x-ms-error-code: sztring |
404 Nem található | NotFoundError | A modell nem támogatja a modalitást. Ellenőrizze a modell dokumentációját, hogy mely útvonalak érhetők el. Fejlécek x-ms-error-code: sztring |
422 Feldolgozhatatlan entitás | UnprocessableContentError | A kérelem feldolgozhatatlan tartalmat tartalmaz Fejlécek x-ms-error-code: sztring |
429 – Túl sok kérelem | TooManyRequestsError | Elérte a hozzárendelt sebességkorlátot, és a kérést tempóba kell helyeznie. Fejlécek x-ms-error-code: sztring |
Egyéb állapotkódok | ContentFilterError | Hibás kérés Fejlécek x-ms-error-code: sztring |
Biztonság
Engedélyezés
A jogkivonat az Bearer:
előtaggal, például: Bearer abcde12345
Típus: apiKey
In: header
AADToken
Azure Active Directory OAuth2-hitelesítés
Típus: oauth2
Folyamat: alkalmazás
Jogkivonat URL-címe: https://login.microsoftonline.com/common/oauth2/v2.0/token
Példák
Befejezést hoz létre a megadott parancssorhoz és paraméterekhez
Kérésminta
POST /completions?api-version=2024-04-01-preview
{
"prompt": "This is a very good text",
"frequency_penalty": 0,
"presence_penalty": 0,
"max_tokens": 256,
"seed": 42,
"stop": "<|endoftext|>",
"stream": false,
"temperature": 0,
"top_p": 1
}
Mintaválasz
Állapotkód: 200
{
"id": "1234567890",
"model": "llama2-7b",
"choices": [
{
"index": 0,
"finish_reason": "stop",
"text": ", indeed it is a good one."
}
],
"created": 1234567890,
"object": "text_completion",
"usage": {
"prompt_tokens": 15,
"completion_tokens": 8,
"total_tokens": 23
}
}
Definíciók
Név | Leírás |
---|---|
Választás | A csevegés befejezésének lehetőségeinek listája. |
CompletionFinishReason | A modell leállította a jogkivonatok létrehozásának leállítását. Ez az, stop ha a modell egy természetes leállítási pontra vagy egy megadott leállítási sorozatra ütközik, length ha elérte a kérelemben megadott jogkivonatok maximális számát, content_filter ha a tartalom a tartalomszűrők egyik jelölője miatt kimaradt. |
CompletionUsage | A befejezési kérelem használati statisztikái. |
ContentFilterError | Az API-hívás meghiúsul, ha a parancssor a konfigurált tartalomszűrőt aktiválja. Módosítsa a kérést, és próbálkozzon újra. |
CreateCompletionRequest | |
CreateCompletionResponse | Az API befejezési válaszát jelöli. |
Részlet | |
TextCompletionObject | Az objektum típusa, amely mindig "text_completion" |
UnprocessableContentError |
Choices
A csevegés befejezésének lehetőségeinek listája.
Név | Típus | Leírás |
---|---|---|
finish_reason | CompletionFinishReason | A modell leállította a jogkivonatok létrehozásának leállítását. Ez az, stop ha a modell egy természetes leállítási pontra vagy egy megadott leállítási sorozatra ütközik, length ha elérte a kérelemben megadott jogkivonatok maximális számát, content_filter ha a tartalom a tartalomszűrők jelölője miatt kimaradt, tool_calls ha a modell eszközt hívott. |
index | egész szám | A választás indexe a választási lehetőségek listájában. |
text | húr | A létrehozott szöveg. |
CompletionFinishReason
A modell leállította a jogkivonatok létrehozásának leállítását. Ez az, stop
ha a modell egy természetes leállítási pontra vagy egy megadott leállítási sorozatra ütközik, length
ha elérte a kérelemben megadott jogkivonatok maximális számát, content_filter
ha a tartalom a tartalomszűrők egyik jelölője miatt kimaradt.
Név | Típus | Leírás |
---|---|---|
content_filter | húr | |
length (hossz) | húr | |
állj | húr |
CompletionUsage
A befejezési kérelem használati statisztikái.
Név | Típus | Leírás |
---|---|---|
completion_tokens | egész szám | A létrehozott befejezésben lévő tokenek száma. |
prompt_tokens | egész szám | A jogkivonatok száma a parancssorban. |
total_tokens | egész szám | A kérelemben használt tokenek teljes száma (parancssor + befejezés). |
ContentFilterError
Az API-hívás meghiúsul, ha a parancssor a konfigurált tartalomszűrőt aktiválja. Módosítsa a kérést, és próbálkozzon újra.
Név | Típus | Leírás |
---|---|---|
code | húr | A hibakód. |
hiba | húr | A hiba leírása. |
üzenet | húr | A hibaüzenet. |
Param | húr | A tartalomszűrőt aktiváló paraméter. |
status | egész szám | A HTTP-állapotkód. |
CreateCompletionRequest
Név | Típus | Alapértelmezett érték | Leírás |
---|---|---|---|
frequency_penalty | szám | 0 | A pozitív értékek a szövegben meglévő gyakoriságuk alapján büntetik az új jogkivonatokat, így csökken annak a valószínűsége, hogy a modell ugyanazt a sort szó szerint megismételi. |
max_tokens | egész szám | 256 | A befejezés során létrehozható jogkivonatok maximális száma. A prompt plus max_tokens tokenszáma nem haladhatja meg a modell környezethosszát. |
presence_penalty | szám | 0 | A pozitív értékek büntetik az új jogkivonatokat attól függően, hogy az eddig megjelennek-e a szövegben, növelve a modell valószínűségét, hogy új témakörökről beszéljenek. |
haladéktalan | <\|endoftext\|> |
A rendszer kéri a befejezések létrehozására, sztringként kódolva, sztringek tömbjeként, jogkivonatok tömbjeként vagy tokentömbök tömbjeként. Vegye figyelembe, hogy <\|endoftext\|> ez a dokumentumelválasztó, amelyet a modell a betanítás során lát, így ha nincs megadva egy kérés, a modell úgy jön létre, mintha egy új dokumentum elejétől származna. |
|
mag | egész szám | Ha meg van adva, a rendszerünk mindent megtesz annak érdekében, hogy determinisztikus mintát hozzon létre, így az azonos seed és paraméterekkel rendelkező ismétlődő kérelmeknek ugyanazt az eredményt kell visszaadnia.A determinizmus nem garantált, és a háttérrendszer változásainak figyeléséhez tekintse meg a system_fingerprint válaszparamétert. |
|
állj | Olyan sorozatok, amelyekben az API leállítja a további jogkivonatok generálását. A visszaadott szöveg nem tartalmazza a leállítási sorozatot. | ||
patak | Logikai | Hamis | Azt határozza meg, hogy vissza szeretné-e streamelni a részleges előrehaladást. Ha be van állítva, a jogkivonatok csak a kiszolgáló által küldött eseményekként lesznek elküldve, amint elérhetővé válnak, és a streamet egy data: [DONE] üzenet leállítja. |
hőmérséklet | szám | 0 | Milyen mintavételi hőmérsékletet kell használni, 0 és 2 között. A magasabb értékek, például a 0,8 véletlenszerűbbé teszik a kimenetet, míg az alacsonyabb értékek, például a 0,2, koncentráltabbá és determinisztikusabbá teszik a kimenetet. Általában azt javasoljuk, hogy módosítsa ezt vagy top_p mindkettőt, de nem mindkettőt. |
top_p | szám | 0 | A hőmérséklettel történő mintavételezés alternatíva, az úgynevezett magmintavétel, ahol a modell a tokenek eredményeit top_p valószínűségi tömeggel veszi figyelembe. A 0.1 tehát csak a felső 10%-os valószínűségi tömeget tartalmazó jogkivonatokat jelenti. Általában azt javasoljuk, hogy módosítsa ezt vagy temperature mindkettőt, de nem mindkettőt. |
CreateCompletionResponse
Az API befejezési válaszát jelöli. Megjegyzés: a streamelt és a nem streamelt válaszobjektumok is ugyanazt az alakzatot adják meg (a csevegési végponttól eltérően).
Név | Típus | Leírás |
---|---|---|
Választás | Választási lehetőségek[] | A bemeneti kéréshez létrehozott modell által létrehozott befejezési lehetőségek listája. |
létrehozva | egész szám | A befejezés létrehozásának unix-időbélyege (másodpercben). |
ID (Azonosító) | húr | A befejezés egyedi azonosítója. |
modell | húr | A befejezéshez használt modell. |
object | TextCompletionObject | Az objektum típusa, amely mindig "text_completion" |
system_fingerprint | húr | Ez az ujjlenyomat azt a háttérkonfigurációt jelöli, amellyel a modell fut. A kérelemparaméterrel seed megérthető, hogy mikor történtek olyan háttérbeli módosítások, amelyek hatással lehetnek a determinizmusra. |
használat | CompletionUsage | A befejezési kérelem használati statisztikái. |
Részlet
Név | Típus | Leírás |
---|---|---|
Loc | sztring[] | A problémát okozó paraméter |
Érték | húr | A problémát okozó paraméternek átadott érték. |
TextCompletionObject
Az objektum típusa, amely mindig "text_completion"
Név | Típus | Leírás |
---|---|---|
text_completion | húr |
ListObject
Az objektum típusa, amely mindig "lista".
Név | Típus | Leírás |
---|---|---|
list | húr |
NotFoundError
Név | Típus | Leírás |
---|---|---|
hiba | húr | A hiba leírása. |
üzenet | húr | A hibaüzenet. |
status | egész szám | A HTTP-állapotkód. |
TooManyRequestsError
Név | Típus | Leírás |
---|---|---|
hiba | húr | A hiba leírása. |
üzenet | húr | A hibaüzenet. |
status | egész szám | A HTTP-állapotkód. |
UnauthorizedError
Név | Típus | Leírás |
---|---|---|
hiba | húr | A hiba leírása. |
üzenet | húr | A hibaüzenet. |
status | egész szám | A HTTP-állapotkód. |
UnprocessableContentError
Név | Típus | Leírás |
---|---|---|
code | húr | A hibakód. |
részlet | Részlet | |
hiba | húr | A hiba leírása. |
üzenet | húr | A hibaüzenet. |
status | egész szám | A HTTP-állapotkód. |