Azure OpenAI Service-modeller
Azure OpenAI Service drivs av flera olika modeller med olika funktioner och priser. Modelltillgängligheten varierar beroende på region.
Modeller | beskrivning |
---|---|
GPT-4o & GPT-4 Turbo NY | De senaste mest kompatibla Azure OpenAI-modellerna med multimodala versioner, som kan acceptera både text och bilder som indata. |
GPT-4 | En uppsättning modeller som förbättrar GPT-3.5 och som kan förstå och generera naturligt språk och kod. |
GPT-3.5 | En uppsättning modeller som förbättrar GPT-3 och kan förstå och generera naturligt språk och kod. |
Inbäddningar | En uppsättning modeller som kan konvertera text till numerisk vektorform för att underlätta textlikhet. |
DALL-E | En serie modeller som kan generera ursprungliga bilder från naturligt språk. |
Viska | En serie modeller i förhandsversion som kan transkribera och översätta tal till text. |
Text till tal (förhandsversion) | En serie modeller i förhandsversionen som kan syntetisera text till tal. |
GPT-4o och GPT-4 Turbo
GPT-4o är den senaste modellen från OpenAI. GPT-4o integrerar text och bilder i en enda modell, vilket gör att den kan hantera flera datatyper samtidigt. Den här multimodala metoden förbättrar noggrannheten och svarstiden i interaktioner mellan människa och dator. GPT-4o matchar GPT-4 Turbo i engelska text- och kodningsuppgifter samtidigt som det ger överlägsen prestanda i icke-engelska språk och visionsuppgifter, vilket sätter nya riktmärken för AI-funktioner.
Hur kommer jag åt GPT-4o-modellen?
GPT-4o är tillgängligt för standard- och global standardmodelldistribution.
Du måste skapa eller använda en befintlig resurs i en standard - eller global standardregion som stöds där modellen är tillgänglig.
När resursen har skapats kan du distribuera GPT-4o-modellen. Om du utför en programmatisk distribution är gpt-4o
modellnamnet och versionen är 2024-05-13
.
GPT-4 Turbo
GPT-4 Turbo är en stor multimodal modell (som accepterar text- eller bildindata och genererar text) som kan lösa svåra problem med större noggrannhet än någon av OpenAI:s tidigare modeller. Liksom GPT-3.5 Turbo, och äldre GPT-4 modeller GPT-4 Turbo är optimerad för chatt och fungerar bra för traditionella slutförande uppgifter.
Den senaste GA-versionen av GPT-4 Turbo är:
gpt-4
Version:turbo-2024-04-09
Detta är ersättningen för följande förhandsversionsmodeller:
gpt-4
Version:1106-Preview
gpt-4
Version:0125-Preview
gpt-4
Version:vision-preview
Skillnader mellan OpenAI- och Azure OpenAI GPT-4 Turbo GA-modeller
- OpenAI:s version av den senaste
0409
turbomodellen stöder JSON-läge och funktionsanrop för alla slutsatsdragningsbegäranden. - Azure OpenAI:s version av den senaste
turbo-2024-04-09
stöder för närvarande inte användning av JSON-läge och funktionsanrop när du gör slutsatsdragningsbegäranden med bildindata (vision). Textbaserade indatabegäranden (begäranden utanimage_url
och infogade bilder) stöder JSON-läge och funktionsanrop.
Skillnader från gpt-4 vision-preview
- Integrering av Azure AI-specifika visionsförbättringar med GPT-4 Turbo med Vision stöds inte för
gpt-4
version:turbo-2024-04-09
. Detta inkluderar optisk teckenigenkänning (OCR), objekt grounding, video prompts och förbättrad hantering av dina data med bilder.
GPT-4 Turbo-etablerad hanterad tillgänglighet
gpt-4
Version:turbo-2024-04-09
är tillgängligt för både standarddistributioner och etablerade distributioner. Den etablerade versionen av den här modellen stöder för närvarande inte begäranden om bild-/syninferens. Etablerade distributioner av den här modellen accepterar endast textinmatning. Standardmodelldistributioner accepterar både begäranden om text- och bild-/visionsinferens.
Region tillgänglighet
Information om regional tillgänglighet för modeller finns i modellmatrisen för standarddistributioner och etablerade distributioner.
Distribuera GPT-4 Turbo med Vision GA
Om du vill distribuera GA-modellen från Studio-användargränssnittet väljer du GPT-4
och väljer turbo-2024-04-09
sedan versionen på den nedrullningsbara menyn. Standardkvoten för gpt-4-turbo-2024-04-09
modellen är samma som den aktuella kvoten för GPT-4-Turbo. Se de regionala kvotgränserna.
GPT-4
GPT-4 är föregångaren till GPT-4 Turbo. Både GPT-4- och GPT-4 Turbo-modellerna har basmodellnamnet gpt-4
. Du kan skilja mellan MODELLERNA GPT-4 och Turbo genom att undersöka modellversionen.
gpt-4
Version0314
gpt-4
Version0613
gpt-4-32k
Version0613
Du kan se den tokenkontextlängd som stöds av varje modell i tabellen för modellsammanfattning.
GPT-4- och GPT-4 Turbo-modeller
- Dessa modeller kan endast användas med API:et för chattslutsättning.
Se modellversioner för att lära dig hur Azure OpenAI Service hanterar modellversionsuppgraderingar och arbeta med modeller för att lära dig hur du visar och konfigurerar modellversionsinställningarna för dina GPT-4-distributioner.
Model ID | beskrivning | Maximal begäran (token) | Träningsdata (upp till) |
---|---|---|---|
gpt-4o (2024-05-13) GPT-4o (Omni) |
Senaste GA-modellen - Text, bildbearbetning – JSON-läge – parallell funktionsanrop – Förbättrad noggrannhet och svarstider - Paritet med engelska text- och kodningsuppgifter jämfört med GPT-4 Turbo med Vision - Överlägsen prestanda i icke-engelska språk och i visionsuppgifter - Stöder inte förbättringar |
Indata: 128 000 Utdata: 4 096 |
Okt 2023 |
gpt-4 (turbo-2024-04-09) GPT-4 Turbo med vision |
Ny GA-modell – Ersättning för alla tidigare GPT-4-förhandsversionsmodeller ( vision-preview , 1106-Preview , 0125-Preview ). - Funktionstillgänglighet skiljer sig för närvarande beroende på indatametod och distributionstyp. - Stöder inte förbättringar. |
Indata: 128 000 Utdata: 4 096 |
Dec. 2023 |
gpt-4 (0125-Preview)*GPT-4 Turbo Förhandsversion |
Förhandsversionsmodell -Ersätter 1106-Preview – Bättre prestanda för kodgenerering – Minskar fall där modellen inte slutför en uppgift – JSON-läge – parallell funktionsanrop – reproducerbara utdata (förhandsversion) |
Indata: 128 000 Utdata: 4 096 |
Dec. 2023 |
gpt-4 (vision-preview)GPT-4 Turbo med Vision Preview |
Förhandsgranskningsmodell – Accepterar text- och bildinmatning. – Stöder förbättringar – JSON-läge – parallell funktionsanrop – reproducerbara utdata (förhandsversion) |
Indata: 128 000 Utdata: 4 096 |
april 2023 |
gpt-4 (1106-förhandsversion)GPT-4 Turbo Förhandsversion |
Förhandsversionsmodell – JSON-läge – parallell funktionsanrop – reproducerbara utdata (förhandsversion) |
Indata: 128 000 Utdata: 4 096 |
april 2023 |
gpt-4-32k (0613) |
Äldre GA-modell – Grundläggande funktionsanrop med verktyg |
32,768 | Sep 2021 |
gpt-4 (0613) |
Äldre GA-modell – Grundläggande funktionsanrop med verktyg |
8,192 | Sep 2021 |
gpt-4-32k (0314) |
Äldre GA-modell - Information om pensionering |
32,768 | Sep 2021 |
gpt-4 (0314) |
Äldre GA-modell - Information om pensionering |
8,192 | Sep 2021 |
Varning
Vi rekommenderar inte att du använder förhandsgranskningsmodeller i produktion. Vi uppgraderar alla distributioner av förhandsversioner till antingen framtida förhandsversioner eller till den senaste stabila/GA-versionen. Modeller som är avsedda för förhandsversion följer inte standardlivscykeln för Azure OpenAI-modellen.
- GPT-4 version 0125-preview är en uppdaterad version av GPT-4 Turbo-förhandsversionen som tidigare släpptes som version 1106-preview.
- GPT-4 version 0125-preview slutför uppgifter som kodgenerering mer fullständigt jämfört med gpt-4-1106-preview. Beroende på uppgiften kan kunderna se att GPT-4-0125-preview genererar mer utdata jämfört med gpt-4-1106-preview. Vi rekommenderar att kunderna jämför utdata från den nya modellen. GPT-4-0125-preview hanterar även buggar i gpt-4-1106-preview med UTF-8-hantering för icke-engelska språk.
- GPT-4-versionen
turbo-2024-04-09
är den senaste ga-versionen och ersätter0125-Preview
,1106-preview
ochvision-preview
.
Viktigt!
gpt-4
versionerna 1106-Preview, 0125-Preview och vision-preview uppgraderas med en stabil version avgpt-4
i framtiden. Distributioner avgpt-4
version 1106-Preview, 0125-Preview och vision-preview inställda på "Automatisk uppdatering till standard" och "Uppgradera när den har upphört att gälla" börjar uppgraderas när den stabila versionen har släppts. För varje distribution sker en modellversionsuppgradering utan avbrott i tjänsten för API-anrop. Uppgraderingar mellanlagras efter region och den fullständiga uppgraderingsprocessen förväntas ta 2 veckor. Distributioner avgpt-4
version 1106-Preview, 0125-Preview och vision-preview inställda på "No autoupgrade" uppgraderas inte och slutar fungera när förhandsversionen uppgraderas i regionen. Mer information om tidpunkten för uppgraderingen finns i Azure OpenAI-modellavgångar och utfasningar .
GPT-3.5
GPT-3.5-modeller kan förstå och generera naturligt språk eller kod. Den mest kompatibla och kostnadseffektiva modellen i GPT-3.5-familjen är GPT-3.5 Turbo, som har optimerats för chatt och fungerar bra för traditionella slutförandeuppgifter också. GPT-3.5 Turbo är tillgängligt för användning med API:et för chattavslut. GPT-3.5 Turbo Instruct har liknande funktioner som att text-davinci-003
använda API:et Completions i stället för API:et för chattavslut. Vi rekommenderar att du använder GPT-3.5 Turbo- och GPT-3.5 Turbo Instruct över äldre GPT-3.5- och GPT-3-modeller.
Model ID | beskrivning | Maximal begäran (token) | Träningsdata (upp till) |
---|---|---|---|
gpt-35-turbo (0125) NY |
Senaste GA-modellen – JSON-läge – parallell funktionsanrop – reproducerbara utdata (förhandsversion) – Högre noggrannhet vid svar i begärda format. – Korrigering för ett fel som orsakade ett problem med textkodning för funktionsanrop som inte är engelska. |
Indata: 16 385 Utdata: 4 096 |
Sep 2021 |
gpt-35-turbo (1106) |
Äldre GA-modell – JSON-läge – parallell funktionsanrop – reproducerbara utdata (förhandsversion) |
Indata: 16 385 Utdata: 4 096 |
Sep 2021 |
gpt-35-turbo-instruct (0914) |
Slutpunkt för slutförande – Ersättning för äldre slutförandemodeller |
4,097 | Sep 2021 |
gpt-35-turbo-16k (0613) |
Äldre GA-modell – Grundläggande funktionsanrop med verktyg |
16,384 | Sep 2021 |
gpt-35-turbo (0613) |
Äldre GA-modell – Grundläggande funktionsanrop med verktyg |
4,096 | Sep 2021 |
gpt-35-turbo 1 (0301) |
Äldre GA-modell - Information om pensionering |
4,096 | Sep 2021 |
Om du vill veta mer om hur du interagerar med GPT-3.5 Turbo och API:et för chattslutsättningar kan du läsa vår detaljerade instruktioner.
1 Den här modellen accepterar begäranden > om 4 096 token. Vi rekommenderar inte att överskrida gränsen på 4 096 indatatoken eftersom den nyare versionen av modellen är begränsad till 4 096 token. Om du får problem när du överskrider 4 096 indatatoken med den här modellen stöds inte den här konfigurationen officiellt.
Inbäddningar
text-embedding-3-large
är den senaste och mest kompatibla inbäddningsmodellen. Det går inte att uppgradera mellan inbäddningsmodeller. Om du vill gå från att använda text-embedding-ada-002
till text-embedding-3-large
måste du generera nya inbäddningar.
text-embedding-3-large
text-embedding-3-small
text-embedding-ada-002
Vid testning rapporterar OpenAI att både den stora och den lilla tredje generationens inbäddningsmodeller ger bättre genomsnittlig prestanda för flerspråkshämtning med MIRACL-riktmärket samtidigt som prestandan för engelska uppgifter bibehålls med MTEB-riktmärket .
Utvärderingsmått | text-embedding-ada-002 |
text-embedding-3-small |
text-embedding-3-large |
---|---|---|---|
MIRACL-genomsnitt | 31.4 | 44.0 | 54.9 |
MTEB-genomsnitt | 61,0 | 62.3 | 64.6 |
Den tredje generationens inbäddningsmodeller har stöd för att minska storleken på inbäddningen via en ny dimensions
parameter. Vanligtvis är större inbäddningar dyrare ur ett beräknings-, minnes- och lagringsperspektiv. Att kunna justera antalet dimensioner ger mer kontroll över den totala kostnaden och prestandan. Parametern dimensions
stöds inte i alla versioner av OpenAI 1.x Python-biblioteket, för att dra nytta av den här parametern rekommenderar vi att du uppgraderar till den senaste versionen: pip install openai --upgrade
.
OpenAI:s MTEB-benchmarktestning visade att även när den tredje generationens modells dimensioner reduceras till mindre än text-embeddings-ada-002
1 536 dimensioner är prestandan fortfarande något bättre.
DALL-E
DALL-E-modellerna genererar bilder från textanvisningarna som användaren tillhandahåller. DALL-E 3 är allmänt tillgängligt för användning med REST-API:er. DALL-E 2 och DALL-E 3 med klient-SDK:er finns i förhandsversion.
Viska
Whisper-modellerna kan användas för tal till text.
Du kan också använda Whisper-modellen via Azure AI Speech batch transcription API. Ta en titt på Vad är Whisper-modellen? för att lära dig mer om när du ska använda Azure AI Speech jämfört med Azure OpenAI Service.
Text till tal (förhandsversion)
OpenAI-text till tal-modeller, som för närvarande är i förhandsversion, kan användas för att syntetisera text till tal.
Du kan också använda OpenAI-texten till talröster via Azure AI Speech. Mer information finns i OpenAI-text till talröster via Azure OpenAI Service eller via Azure AI Speech-guide .
Modellsammanfattningstabell och regionstillgänglighet
Kommentar
Den här artikeln beskriver främst modell-/regiontillgänglighet som gäller för alla Azure OpenAI-kunder med distributionstyper av Standard. Vissa utvalda kunder har åtkomst till modell-/regionkombinationer som inte visas i den enhetliga tabellen nedan. Mer information om etablerade distributioner finns i vår etablerade vägledning.
Standarddistributionsmodelltillgänglighet
Region | gpt-4, 0613 | gpt-4, 1106-Preview | gpt-4, 0125-Preview | gpt-4, vision-preview | gpt-4, turbo-2024-04-09 | gpt-4o, 2024-05-13 | gpt-4-32k, 0613 | gpt-35-turbo, 0301 | gpt-35-turbo, 0613 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 | gpt-35-turbo-16k, 0613 | gpt-35-turbo-instruct, 0914 | text-embedding-ada-002, 1 | text-embedding-ada-002, 2 | text-embedding-3-small, 1 | text-embedding-3-large, 1 | dall-e-2, 2.0 | dall-e-3, 3.0 | babbage-002, 1 | davinci-002, 1 | tts, 001 | tts-hd, 001 | viska, 001 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
australiaeast | ✅ | ✅ | - | ✅ | - | - | ✅ | - | ✅ | ✅ | - | ✅ | - | - | ✅ | - | - | - | ✅ | - | - | - | - | - |
Brasilien, södra | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - | - |
canadaeast | ✅ | ✅ | - | - | - | - | ✅ | - | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
eastus | - | - | ✅ | - | - | ✅ | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - |
eastus2 | - | ✅ | - | - | ✅ | ✅ | - | - | ✅ | - | - | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | ✅ |
francecentral | ✅ | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | - | ✅ | - | - | - | - | - | - | - |
Japan, östra | - | - | - | ✅ | - | - | - | - | ✅ | - | - | ✅ | - | - | ✅ | - | ✅ | - | - | - | - | - | - | - |
northcentralus | - | - | ✅ | - | - | ✅ | - | - | ✅ | - | ✅ | ✅ | - | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ |
norwayeast | - | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - | ✅ |
southafricanorth | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - | - |
USA, södra centrala | - | - | ✅ | - | - | ✅ | - | ✅ | - | - | ✅ | - | - | ✅ | ✅ | - | - | - | - | - | - | - | - | - |
southindia | - | ✅ | - | - | - | - | - | - | - | ✅ | - | - | - | - | ✅ | - | ✅ | - | - | - | - | - | - | ✅ |
swedencentral | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | - | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
switzerlandnorth | ✅ | - | - | ✅ | - | - | ✅ | - | ✅ | - | - | ✅ | - | - | ✅ | - | - | - | - | - | - | - | - | - |
uksouth | - | ✅ | ✅ | - | - | - | - | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | - | ✅ | - | - | - | - | - | - | - |
Europa, västra | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - | ✅ |
westus | - | ✅ | - | ✅ | - | ✅ | - | - | - | ✅ | - | - | - | - | ✅ | - | - | - | - | - | - | - | - | - |
westus3 | - | ✅ | - | - | - | ✅ | - | - | - | - | - | - | - | - | ✅ | - | ✅ | - | - | - | - | - | - | - |
Den här tabellen innehåller inte finjustering av regional tillgänglighet. Mer information finns i avsnittet om dedikerad finjustering.
Standarddistributionsmodellkvot
Region | GPT-4 | GPT-4-32K | GPT-4-Turbo | GPT-4-Turbo-V | gpt-4o | gpt-4o – GlobalStandard | GPT-35-Turbo | GPT-35-Turbo-Instruct | Text-Inbäddning-Ada-002 | text-embedding-3-small | text-embedding-3-large | Babbage-002 | Babbage-002 - finetune | Davinci-002 | Davinci-002 - finetune | GPT-35-Turbo - finetune | GPT-35-Turbo-1106 - finetune | GPT-35-Turbo-0125 - finetune | GPT-4 – finetune |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
australiaeast | 40 K | 80 K | 80 K | 30 K | - | - | 300 K | - | 350 K | - | - | - | - | - | - | - | - | - | - |
Brasilien, södra | - | - | - | - | - | - | - | - | 350 K | - | - | - | - | - | - | - | - | - | - |
canadaeast | 40 K | 80 K | 80 K | - | - | - | 300 K | - | 350 K | 350 K | 350 K | - | - | - | - | - | - | - | - |
eastus | - | - | 80 K | - | 150 K 1 M |
450 K 10 M |
240 K | 240 K | 240 K | 350 K | 350 K | - | - | - | - | - | - | - | - |
eastus2 | - | - | 80 K | - | 150 K 1 M |
450 K 10 M |
300 K | - | 350 K | 350 K | 350 K | - | - | - | - | 250 K | 250 K | 250 K | - |
francecentral | 20 K | 60 K | 80 K | - | - | - | 240 K | - | 240 K | - | 350 K | - | - | - | - | - | - | - | - |
Japan, östra | - | - | - | 30 K | - | - | 300 K | - | 350 K | - | 350 K | - | - | - | - | - | - | - | - |
northcentralus | - | - | 80 K | - | 150 K 1 M |
450 K 10 M |
300 K | - | 350 K | - | - | 240 K | 250 K | 240 K | 250 K | 250 K | 250 K | 250 K | 100 K |
norwayeast | - | - | 150 K | - | - | - | - | - | 350 K | - | - | - | - | - | - | - | - | - | - |
southafricanorth | - | - | - | - | - | - | - | - | 350 K | - | - | - | - | - | - | - | - | - | - |
USA, södra centrala | - | - | 80 K | - | 150 K 1 M |
450 K 10 M |
240 K | - | 240 K | - | - | - | - | - | - | - | - | - | - |
southindia | - | - | 150 K | - | - | - | 300 K | - | 350 K | - | 350 K | - | - | - | - | - | - | - | - |
swedencentral | 40 K | 80 K | 150 K | 30 K | 150 K 1 M |
- | 300 K | 240 K | 350 K | - | 350 K | 240 K | 250 K | 240 K | 250 K | 250 K | 250 K | 250 K | 100 K |
switzerlandnorth | 40 K | 80 K | - | 30 K | - | - | 300 K | - | 350 K | - | - | - | - | - | - | - | - | - | - |
switzerlandwest | - | - | - | - | - | - | - | - | - | - | - | - | 250 K | - | 250 K | 250 K | 250 K | 250 K | - |
uksouth | - | - | 80 K | - | - | - | 240 K | - | 350 K | - | 350 K | - | - | - | - | - | - | - | - |
Europa, västra | - | - | - | - | - | - | 240 K | - | 240 K | - | - | - | - | - | - | - | - | - | - |
westus | - | - | 80 K | 30 K | 150 K 1 M |
450 K 10 M |
300 K | - | 350 K | - | - | - | - | - | - | - | - | - | - |
westus3 | - | - | 80 K | - | 150 K 1 M |
450 K 10 M |
- | - | 350 K | - | 350 K | - | - | - | - | - | - | - | - |
Tillgänglighet för etablerad distributionsmodell
Region | gpt-4, 0613 | gpt-4, 1106-Preview | gpt-4, 0125-Preview | gpt-4, turbo-2024-04-09 | gpt-4o, 2024-05-13 | gpt-4-32k, 0613 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 |
---|---|---|---|---|---|---|---|---|
australiaeast | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
Brasilien, södra | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - |
canadacentral | ✅ | - | - | - | - | ✅ | - | ✅ |
canadaeast | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | - |
eastus | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ |
eastus2 | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ |
francecentral | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ |
germanywestcentral | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | - |
Japan, östra | - | ✅ | ✅ | ✅ | ✅ | - | - | ✅ |
koreacentral | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | - |
northcentralus | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ |
norwayeast | ✅ | - | ✅ | - | - | ✅ | - | - |
polencentral | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ |
southafricanorth | ✅ | ✅ | - | - | - | ✅ | ✅ | - |
USA, södra centrala | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
southindia | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ |
swedencentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
switzerlandnorth | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
switzerlandwest | - | - | - | - | - | - | - | ✅ |
uksouth | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ |
westus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
westus3 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
Kommentar
Den etablerade versionen av gpt-4
version: turbo-2024-04-09
är för närvarande begränsad till endast text.
Hur får jag åtkomst till Etablerad?
Du måste tala med ditt Microsoft-sälj-/kontoteam för att hämta etablerat dataflöde. Om du inte har ett sälj-/kontoteam kan du tyvärr inte köpa etablerat dataflöde just nu.
Mer information om etablerade distributioner finns i vår etablerade vägledning.
Global standardmodelltillgänglighet
Modeller som stöds:
gpt-4o
Version:2024-05-13
Regioner som stöds:
- eastus
- eastus2
- northcentralus
- USA, södra centrala
- westus
- westus3
GPT-4- och GPT-4 Turbo-modelltillgänglighet
Offentliga molnregioner
Region | gpt-4, 0613 | gpt-4, 1106-Preview | gpt-4, 0125-Preview | gpt-4, vision-preview | gpt-4, turbo-2024-04-09 | gpt-4o, 2024-05-13 | gpt-4-32k, 0613 |
---|---|---|---|---|---|---|---|
australiaeast | ✅ | ✅ | - | ✅ | - | - | ✅ |
canadaeast | ✅ | ✅ | - | - | - | - | ✅ |
eastus | - | - | ✅ | - | - | ✅ | - |
eastus2 | - | ✅ | - | - | ✅ | ✅ | - |
francecentral | ✅ | ✅ | - | - | - | - | ✅ |
Japan, östra | - | - | - | ✅ | - | - | - |
northcentralus | - | - | ✅ | - | - | ✅ | - |
norwayeast | - | ✅ | - | - | - | - | - |
USA, södra centrala | - | - | ✅ | - | - | ✅ | - |
southindia | - | ✅ | - | - | - | - | - |
swedencentral | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ |
switzerlandnorth | ✅ | - | - | ✅ | - | - | ✅ |
uksouth | - | ✅ | ✅ | - | - | - | - |
westus | - | ✅ | - | ✅ | - | ✅ | - |
westus3 | - | ✅ | - | - | - | ✅ | - |
Välj kundåtkomst
Förutom de regioner ovan som är tillgängliga för alla Azure OpenAI-kunder har vissa utvalda befintliga kunder beviljats åtkomst till versioner av GPT-4 i ytterligare regioner:
Modell | Region |
---|---|
gpt-4 (0314) gpt-4-32k (0314) |
USA, östra Frankrike, centrala USA, södra centrala Södra Storbritannien |
gpt-4 (0613) gpt-4-32k (0613) |
USA, östra USA, östra 2 Japan, östra Södra Storbritannien |
Azure Government-regioner
Följande GPT-4-modeller är tillgängliga med Azure Government:
Model ID | Modelltillgänglighet |
---|---|
gpt-4 (1106-förhandsversion) |
US Gov, Virginia US Gov, Arizona |
GPT-3.5-modeller
Viktigt!
NEW-modellen gpt-35-turbo (0125)
har olika förbättringar, bland annat högre noggrannhet vid svar i begärda format och en korrigering för ett fel som orsakade ett textkodningsproblem för funktionsanrop som inte är engelska.
GPT-3.5 Turbo används med Completions-API för chatt. GPT-3.5 Turbo version 0301 kan också användas med API:et Completions, men detta rekommenderas inte. GPT-3.5 Turbo version 0613 och 1106 stöder endast API:et för chattslutsättningar.
GPT-3.5 Turbo version 0301 är den första versionen av modellen som släpptes. Version 0613 är den andra versionen av modellen och lägger till stöd för funktionsanrop.
Se modellversioner för att lära dig hur Azure OpenAI Service hanterar modellversionsuppgraderingar och arbeta med modeller för att lära dig hur du visar och konfigurerar modellversionsinställningarna för dina GPT-3.5 Turbo-distributioner.
GPT-3.5-Turbo-modelltillgänglighet
Offentliga molnregioner
Region | gpt-35-turbo, 0301 | gpt-35-turbo, 0613 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 | gpt-35-turbo-16k, 0613 | gpt-35-turbo-instruct, 0914 |
---|---|---|---|---|---|---|
australiaeast | - | ✅ | ✅ | - | ✅ | - |
canadaeast | - | ✅ | ✅ | ✅ | ✅ | - |
eastus | ✅ | ✅ | - | - | ✅ | ✅ |
eastus2 | - | ✅ | - | - | ✅ | - |
francecentral | ✅ | ✅ | ✅ | - | ✅ | - |
Japan, östra | - | ✅ | - | - | ✅ | - |
northcentralus | - | ✅ | - | ✅ | ✅ | - |
USA, södra centrala | ✅ | - | - | ✅ | - | - |
southindia | - | - | ✅ | - | - | - |
swedencentral | - | ✅ | ✅ | - | ✅ | ✅ |
switzerlandnorth | - | ✅ | - | - | ✅ | - |
uksouth | ✅ | ✅ | ✅ | - | ✅ | - |
Europa, västra | ✅ | - | - | - | - | - |
westus | - | - | ✅ | - | - | - |
Azure Government-regioner
Följande GPT-3.5 turbomodeller är tillgängliga med Azure Government:
Model ID | Modelltillgänglighet |
---|---|
gpt-35-turbo (1106-förhandsversion) |
US Gov, Virginia |
Inbäddningsmodeller
Dessa modeller kan bara användas med API-begäranden för inbäddning.
Kommentar
text-embedding-3-large
är den senaste och mest kompatibla inbäddningsmodellen. Det går inte att uppgradera mellan inbäddningsmodeller. För att kunna migrera från att använda text-embedding-ada-002
till text-embedding-3-large
måste du generera nya inbäddningar.
Model ID | Maximal begäran (token) | Utdatadimensioner | Träningsdata (upp till) |
---|---|---|---|
text-embedding-ada-002 (version 2) |
8,191 | 1,536 | Sep 2021 |
text-embedding-ada-002 (version 1) |
2,046 | 1,536 | Sep 2021 |
text-embedding-3-large |
8,191 | 3,072 | Sep 2021 |
text-embedding-3-small |
8,191 | 1,536 | Sep 2021 |
Kommentar
När du skickar en matris med indata för inbäddning är det maximala antalet indataobjekt i matrisen per anrop till inbäddningsslutpunkten 2048.
Offentliga molnregioner
Region | text-embedding-ada-002, 1 | text-embedding-ada-002, 2 | text-embedding-3-small, 1 | text-embedding-3-large, 1 |
---|---|---|---|---|
australiaeast | - | ✅ | - | - |
Brasilien, södra | - | ✅ | - | - |
canadaeast | - | ✅ | ✅ | ✅ |
eastus | ✅ | ✅ | ✅ | ✅ |
eastus2 | - | ✅ | ✅ | ✅ |
francecentral | - | ✅ | - | ✅ |
Japan, östra | - | ✅ | - | ✅ |
northcentralus | - | ✅ | - | - |
norwayeast | - | ✅ | - | - |
southafricanorth | - | ✅ | - | - |
USA, södra centrala | ✅ | ✅ | - | - |
southindia | - | ✅ | - | ✅ |
swedencentral | - | ✅ | - | ✅ |
switzerlandnorth | - | ✅ | - | - |
uksouth | - | ✅ | - | ✅ |
Europa, västra | - | ✅ | - | - |
westus | - | ✅ | - | - |
westus3 | - | ✅ | - | ✅ |
Azure Government-regioner
Följande inbäddningsmodeller är tillgängliga med Azure Government:
Model ID | Modelltillgänglighet |
---|---|
text-embedding-ada-002 (version 2) |
US Gov, Virginia US Gov, Arizona |
DALL-E-modeller
Model ID | Tillgänglighet för funktioner | Maximal begäran (tecken) |
---|---|---|
dalle2 (förhandsversion) | USA, östra | 1 000 |
dall-e-3 | USA, östra, Australien, östra, Sverige, centrala | 4 000 |
Finjusteringsmodeller
babbage-002
och davinci-002
har inte tränats att följa instruktionerna. Du bör bara köra frågor mot dessa basmodeller som referens till en finjusterad version för att utvärdera förloppet för träningen.
gpt-35-turbo
- Finjustering av den här modellen är begränsad till en delmängd av regioner och är inte tillgänglig i varje region som basmodellen är tillgänglig.
Model ID | Finjusteringsregioner | Maximal begäran (token) | Träningsdata (upp till) |
---|---|---|---|
babbage-002 |
USA, norra centrala Sverige, centrala Schweiz, västra |
16,384 | Sep 2021 |
davinci-002 |
USA, norra centrala Sverige, centrala Schweiz, västra |
16,384 | Sep 2021 |
gpt-35-turbo (0613) |
USA, östra 2 USA, norra centrala Sverige, centrala Schweiz, västra |
4,096 | Sep 2021 |
gpt-35-turbo (1106) |
USA, östra 2 USA, norra centrala Sverige, centrala Schweiz, västra |
Indata: 16 385 Utdata: 4 096 |
Sep 2021 |
gpt-35-turbo (0125) |
USA, östra 2 USA, norra centrala Sverige, centrala Schweiz, västra |
16,385 | Sep 2021 |
gpt-4 (0613) 1 |
USA, norra centrala Sverige, centrala |
8192 | Sep 2021 |
11 GPT-4 finjustering är för närvarande i offentlig förhandsversion. Mer information finns i vår vägledning för gpt-4-finjusteringssäkerhetsutvärdering.
Whisper-modeller
Model ID | Modelltillgänglighet | Maxbegäran (ljudfilstorlek) |
---|---|---|
whisper |
USA, östra 2 USA, norra centrala Norge, östra Indien, södra Sverige, centrala Västeuropa |
25 MB |
Text till tal-modeller (förhandsversion)
Model ID | Modelltillgänglighet |
---|---|
tts-1 |
USA, norra centrala Sverige, centrala |
tts-1-hd |
USA, norra centrala Sverige, centrala |
Assistenter (förhandsversion)
För assistenter behöver du en kombination av en modell som stöds och en region som stöds. Vissa verktyg och funktioner kräver de senaste modellerna. Följande modeller är tillgängliga i Assistants API, SDK, Azure AI Studio och Azure OpenAI Studio. Följande tabell är för betala per användning. Information om PTU-tillgänglighet (Provisioned Throughput Unit) finns i etablerat dataflöde.
Region | gpt-35-turbo (0613) |
gpt-35-turbo (1106) |
fine tuned gpt-3.5-turbo-0125 |
gpt-4 (0613) |
gpt-4 (1106) |
gpt-4 (0125) |
gpt-4o (2024-05-13) |
---|---|---|---|---|---|---|---|
Australien, östra | ✅ | ✅ | ✅ | ✅ | |||
East US | ✅ | ✅ | ✅ | ||||
USA, östra 2 | ✅ | ✅ | ✅ | ✅ | ✅ | ||
Centrala Frankrike | ✅ | ✅ | ✅ | ✅ | |||
Japan, östra | ✅ | ||||||
Norge, östra | ✅ | ||||||
Sverige, centrala | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | |
Södra Storbritannien | ✅ | ✅ | ✅ | ✅ | |||
Västra USA | ✅ | ✅ | ✅ | ||||
USA, västra 3 | ✅ | ✅ |
Modellavgång
Den senaste informationen om modellavgångar finns i modellens pensionsguide.
Nästa steg
Feedback
https://aka.ms/ContentUserFeedback.
Kommer snart: Under hela 2024 kommer vi att fasa ut GitHub-problem som feedbackmekanism för innehåll och ersätta det med ett nytt feedbacksystem. Mer information finns i:Skicka och visa feedback för