Azure OpenAI Service-modeller

Azure OpenAI Service drivs av flera olika modeller med olika funktioner och priser. Modelltillgängligheten varierar beroende på region. Information om GPT-3 och andra modeller som dras tillbaka i juli 2024 finns i äldre Azure OpenAI Service-modeller.

Modeller beskrivning
GPT-4 Turbo NY De senaste mest kompatibla Azure OpenAI-modellerna med multimodala versioner, som kan acceptera både text och bilder som indata.
GPT-4 En uppsättning modeller som förbättrar GPT-3.5 och som kan förstå och generera naturligt språk och kod.
GPT-3.5 En uppsättning modeller som förbättrar GPT-3 och kan förstå och generera naturligt språk och kod.
Inbäddningar En uppsättning modeller som kan konvertera text till numerisk vektorform för att underlätta textlikhet.
DALL-E En serie modeller som kan generera ursprungliga bilder från naturligt språk.
Viskning En serie modeller i förhandsversion som kan transkribera och översätta tal till text.
Text till tal (förhandsversion) En serie modeller i förhandsversionen som kan syntetisera text till tal.

GPT-4 Turbo

GPT-4 Turbo är en stor multimodal modell (som accepterar text- eller bildindata och genererar text) som kan lösa svåra problem med större noggrannhet än någon av OpenAI:s tidigare modeller. Liksom GPT-3.5 Turbo, och äldre GPT-4 modeller GPT-4 Turbo är optimerad för chatt och fungerar bra för traditionella slutförande uppgifter.

Den senaste GA-versionen av GPT-4 Turbo är:

  • gpt-4Version:turbo-2024-04-09

Detta är ersättningen för följande förhandsversionsmodeller:

  • gpt-4Version:1106-Preview
  • gpt-4Version:0125-Preview
  • gpt-4Version:vision-preview

Skillnader mellan OpenAI- och Azure OpenAI GPT-4 Turbo GA-modeller

  • OpenAI:s version av den senaste 0409 turbomodellen stöder JSON-läge och funktionsanrop för alla slutsatsdragningsbegäranden.
  • Azure OpenAI:s version av den senaste turbo-2024-04-09 stöder för närvarande inte användning av JSON-läge och funktionsanrop när du gör slutsatsdragningsbegäranden med bildindata (vision). Textbaserade indatabegäranden (begäranden utan image_url och infogade bilder) stöder JSON-läge och funktionsanrop.

Skillnader från gpt-4 vision-preview

  • Integrering av Azure AI-specifika visionsförbättringar med GPT-4 Turbo med Vision stöds inte för gpt-4version:turbo-2024-04-09. Detta inkluderar optisk teckenigenkänning (OCR), objekt grounding, video prompts och förbättrad hantering av dina data med bilder.

GPT-4 Turbo-etablerad hanterad tillgänglighet

  • gpt-4Version:turbo-2024-04-09 är tillgänglig för både standarddistributioner och etablerade distributioner. Den etablerade versionen av den här modellen stöder för närvarande inte begäranden om bild-/syninferens. Etablerade distributioner av den här modellen accepterar endast textinmatning. Standardmodelldistributioner accepterar både begäranden om text- och bild-/visionsinferens.

Region tillgänglighet

Information om regional tillgänglighet för modeller finns i modellmatrisen för standarddistributioner och etablerade distributioner.

Distribuera GPT-4 Turbo med Vision GA

Om du vill distribuera GA-modellen från Studio-användargränssnittet väljer du GPT-4 och väljer turbo-2024-04-09 sedan versionen på den nedrullningsbara menyn. Standardkvoten för gpt-4-turbo-2024-04-09 modellen är samma som den aktuella kvoten för GPT-4-Turbo. Se de regionala kvotgränserna.

GPT-4

GPT-4 är föregångaren till GPT-4 Turbo. Både GPT-4- och GPT-4 Turbo-modellerna har basmodellnamnet gpt-4. Du kan skilja mellan MODELLERNA GPT-4 och Turbo genom att undersöka modellversionen.

  • gpt-4Version:0314
  • gpt-4Version:0613
  • gpt-4-32kVersion:0613

Du kan se den tokenkontextlängd som stöds av varje modell i tabellen för modellsammanfattning.

GPT-4- och GPT-4 Turbo-modeller

  • Dessa modeller kan endast användas med API:et för chattslutsättning.

Se modellversioner för att lära dig hur Azure OpenAI Service hanterar modellversionsuppgraderingar och arbeta med modeller för att lära dig hur du visar och konfigurerar modellversionsinställningarna för dina GPT-4-distributioner.

Model ID beskrivning Maximal begäran (token) Träningsdata (upp till)
gpt-4 (turbo-2024-04-09)
GPT-4 Turbo med vision
Senaste GA-modellen
- Ersättning för alla GPT-4 förhandsversionsmodeller (vision-preview, 1106-Preview, 0125-Preview).
- Funktionstillgänglighet skiljer sig för närvarande beroende på indatametod och distributionstyp.
– Stöder inte förbättringar.
Indata: 128 000
Utdata: 4 096
Dec. 2023
gpt-4 (0125-Preview)*
GPT-4 Turbo Förhandsversion
Förhandsversionsmodell
-Ersätter 1106-Preview
– Bättre prestanda för kodgenerering
– Minskar fall där modellen inte slutför en uppgift
– JSON-läge
– parallell funktionsanrop
– reproducerbara utdata (förhandsversion)
Indata: 128 000
Utdata: 4 096
Dec. 2023
gpt-4 (vision-preview)
GPT-4 Turbo med Vision Preview
Förhandsgranskningsmodell
– Accepterar text- och bildinmatning.
– Stöder förbättringar
– JSON-läge
– parallell funktionsanrop
– reproducerbara utdata (förhandsversion)
Indata: 128 000
Utdata: 4 096
april 2023
gpt-4 (1106-förhandsversion)
GPT-4 Turbo Förhandsversion
Förhandsversionsmodell
– JSON-läge
– parallell funktionsanrop
– reproducerbara utdata (förhandsversion)
Indata: 128 000
Utdata: 4 096
april 2023
gpt-4-32k (0613) Äldre GA-modell
– Grundläggande funktionsanrop med verktyg
32,768 Sep 2021
gpt-4 (0613) Äldre GA-modell
– Grundläggande funktionsanrop med verktyg
8,192 Sep 2021
gpt-4-32k(0314) Äldre GA-modell
- Information om pensionering
32,768 Sep 2021
gpt-4 (0314) Äldre GA-modell
- Information om pensionering
8,192 Sep 2021

Varning

Vi rekommenderar inte att du använder förhandsgranskningsmodeller i produktion. Vi uppgraderar alla distributioner av förhandsversioner till antingen framtida förhandsversioner eller till den senaste stabila/GA-versionen. Modeller som är avsedda för förhandsversion följer inte standardlivscykeln för Azure OpenAI-modellen.

Kommentar

Versionen 0314 av gpt-4 och gpt-4-32k kommer att dras tillbaka senast den 5 juli 2024. Versionen 0613 av gpt-4 och gpt-4-32k kommer att dras tillbaka senast den 30 september 2024. Se modelluppdateringar för modelluppgraderingsbeteende.

  • GPT-4 version 0125-preview är en uppdaterad version av GPT-4 Turbo-förhandsversionen som tidigare släpptes som version 1106-preview.
  • GPT-4 version 0125-preview slutför uppgifter som kodgenerering mer fullständigt jämfört med gpt-4-1106-preview. Beroende på uppgiften kan kunderna se att GPT-4-0125-preview genererar mer utdata jämfört med gpt-4-1106-preview. Vi rekommenderar att kunderna jämför utdata från den nya modellen. GPT-4-0125-preview hanterar även buggar i gpt-4-1106-preview med UTF-8-hantering för icke-engelska språk. GPT-4-versionen turbo-2024-04-09 är den senaste ga-versionen och ersätter 0125-Preview, 1106-previewoch vision-preview.

Viktigt!

  • gpt-4 versionerna 1106-Preview och 0125-Preview uppgraderas med en stabil version av gpt-4 i framtiden. Distributioner av gpt-4 version 1106-Preview och 0125-Preview inställda på "Automatisk uppdatering till standard" och "Uppgradera när den har upphört att gälla" börjar uppgraderas när den stabila versionen har släppts. För varje distribution sker en modellversionsuppgradering utan avbrott i tjänsten för API-anrop. Uppgraderingar mellanlagras efter region och den fullständiga uppgraderingsprocessen förväntas ta 2 veckor. Distributioner av gpt-4 version 1106-Preview och 0125-Preview inställda på "Ingen automatisk uppgradering" kommer inte att uppgraderas och slutar fungera när förhandsversionen uppgraderas i regionen. Mer information om tidpunkten för uppgraderingen finns i Azure OpenAI-modellavgångar och utfasningar .

GPT-3.5

GPT-3.5-modeller kan förstå och generera naturligt språk eller kod. Den mest kompatibla och kostnadseffektiva modellen i GPT-3.5-familjen är GPT-3.5 Turbo, som har optimerats för chatt och fungerar bra för traditionella slutförandeuppgifter också. GPT-3.5 Turbo är tillgängligt för användning med API:et för chattavslut. GPT-3.5 Turbo Instruct har liknande funktioner som att text-davinci-003 använda API:et Completions i stället för API:et för chattavslut. Vi rekommenderar att du använder GPT-3.5 Turbo- och GPT-3.5 Turbo Instruct över äldre GPT-3.5- och GPT-3-modeller.

Model ID beskrivning Maximal begäran (token) Träningsdata (upp till)
gpt-35-turbo (0125) NY Senaste GA-modellen
– JSON-läge
– parallell funktionsanrop
– reproducerbara utdata (förhandsversion)
– Högre noggrannhet vid svar i begärda format.
– Korrigering för ett fel som orsakade ett problem med textkodning för funktionsanrop som inte är engelska.
Indata: 16 385
Utdata: 4 096
Sep 2021
gpt-35-turbo (1106) Äldre GA-modell
– JSON-läge
– parallell funktionsanrop
– reproducerbara utdata (förhandsversion)
Indata: 16 385
Utdata: 4 096
Sep 2021
gpt-35-turbo-instruct (0914) Slutpunkt för slutförande 4,097 Sep 2021
gpt-35-turbo-16k (0613) Äldre GA-modell
– Grundläggande funktionsanrop med verktyg
16,384 Sep 2021
gpt-35-turbo (0613) Äldre GA-modell
– Grundläggande funktionsanrop med verktyg
4,096 Sep 2021
gpt-35-turbo1 (0301) Äldre GA-modell
- Information om pensionering
4,096 Sep 2021

Om du vill veta mer om hur du interagerar med GPT-3.5 Turbo och API:et för chattslutsättningar kan du läsa vår detaljerade instruktioner.

1 Den här modellen accepterar begäranden > om 4 096 token. Vi rekommenderar inte att överskrida gränsen på 4 096 indatatoken eftersom den nyare versionen av modellen är begränsad till 4 096 token. Om du får problem när du överskrider 4 096 indatatoken med den här modellen stöds inte den här konfigurationen officiellt.

Inbäddningar

text-embedding-3-large är den senaste och mest kompatibla inbäddningsmodellen. Det går inte att uppgradera mellan inbäddningsmodeller. Om du vill gå från att använda text-embedding-ada-002 till text-embedding-3-large måste du generera nya inbäddningar.

  • text-embedding-3-large
  • text-embedding-3-small
  • text-embedding-ada-002

Vid testning rapporterar OpenAI att både den stora och den lilla tredje generationens inbäddningsmodeller ger bättre genomsnittlig prestanda för flerspråkshämtning med MIRACL-riktmärket samtidigt som prestandan för engelska uppgifter bibehålls med MTEB-riktmärket .

Utvärderingsmått text-embedding-ada-002 text-embedding-3-small text-embedding-3-large
MIRACL-genomsnitt 31.4 44.0 54.9
MTEB-genomsnitt 61,0 62.3 64.6

Den tredje generationens inbäddningsmodeller har stöd för att minska storleken på inbäddningen via en ny dimensions parameter. Vanligtvis är större inbäddningar dyrare ur ett beräknings-, minnes- och lagringsperspektiv. Att kunna justera antalet dimensioner ger mer kontroll över den totala kostnaden och prestandan. Parametern dimensions stöds inte i alla versioner av OpenAI 1.x Python-biblioteket, för att dra nytta av den här parametern rekommenderar vi att du uppgraderar till den senaste versionen: pip install openai --upgrade.

OpenAI:s MTEB-benchmarktestning visade att även när den tredje generationens modells dimensioner reduceras till mindre än text-embeddings-ada-002 1 536 dimensioner är prestandan fortfarande något bättre.

DALL-E

DALL-E-modellerna genererar bilder från textanvisningarna som användaren tillhandahåller. DALL-E 3 är allmänt tillgängligt för användning med REST-API:er. DALL-E 2 och DALL-E 3 med klient-SDK:er finns i förhandsversion.

Viskning

Whisper-modellerna kan användas för tal till text.

Du kan också använda Whisper-modellen via Azure AI Speech batch transcription API. Ta en titt på Vad är Whisper-modellen? för att lära dig mer om när du ska använda Azure AI Speech jämfört med Azure OpenAI Service.

Text till tal (förhandsversion)

OpenAI-text till tal-modeller, som för närvarande är i förhandsversion, kan användas för att syntetisera text till tal.

Du kan också använda OpenAI-texten till talröster via Azure AI Speech. Mer information finns i OpenAI-text till talröster via Azure OpenAI Service eller via Azure AI Speech-guide .

Modellsammanfattningstabell och regionstillgänglighet

Kommentar

Den här artikeln beskriver främst modell-/regiontillgänglighet som gäller för alla Azure OpenAI-kunder med distributionstyper av Standard. Vissa utvalda kunder har åtkomst till modell-/regionkombinationer som inte visas i den enhetliga tabellen nedan. Mer information om etablerade distributioner finns i vår etablerade vägledning.

Standarddistributionsmodelltillgänglighet

Region gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, vision-preview gpt-4, turbo-2024-04-09 gpt-4-32k, 0613 gpt-35-turbo, 0301 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613 gpt-35-turbo-instruct, 0914 text-embedding-ada-002, 1 text-embedding-ada-002, 2 text-embedding-3-small, 1 text-embedding-3-large, 1 babbage-002, 1 dall-e-3, 3.0 davinci-002, 1 tts, 001 tts-hd, 001 viska, 001
australiaeast - - - - - - - - - - - - -
Brasilien, södra - - - - - - - - - - - - - - - - - - - - -
canadaeast - - - - - - - - - - - -
eastus - - - - - - - - - - - -
eastus2 - - - - - - - - - - - - - -
francecentral - - - - - - - - - - - - - -
Japan, östra - - - - - - - - - - - - - - - - - -
northcentralus - - - - - - - - - - - -
norwayeast - - - - - - - - - - - - - - - - - - -
southafricanorth - - - - - - - - - - - - - - - - - - - - -
USA, södra centrala - - - - - - - - - - - - - - - - -
southindia - - - - - - - - - - - - - - - - - -
swedencentral - - - - - -
switzerlandnorth - - - - - - - - - - - - - - - -
uksouth - - - - - - - - - - - - - - -
Europa, västra - - - - - - - - - - - - - - - - - - -
westus - - - - - - - - - - - - - - - - - -
westus3 - - - - - - - - - - - - - - - - -

Den här tabellen innehåller inte finjustering av regional tillgänglighet. Mer information finns i avsnittet om dedikerad finjustering.

Standarddistributionsmodellkvot

Standardkvoten för modeller varierar beroende på modell och region. Standardkvotgränser kan komma att ändras.

Kvoten för standarddistributioner beskrivs i termer av TPM (Tokens-Per-Minute).

Region GPT-4 GPT-4-32K GPT-4-Turbo GPT-4-Turbo-V GPT-35-Turbo GPT-35-Turbo-Instruct Text-Inbäddning-Ada-002 text-embedding-3-small text-embedding-3-large Babbage-002 Babbage-002 - finetune Davinci-002 Davinci-002 - finetune GPT-35-Turbo - finetune GPT-35-Turbo-1106 - finetune GPT-35-Turbo-0125 - finetune
australiaeast 40 K 80 K 80 K 30 K 300 K - 350 K - - - - - - - - -
Brasilien, södra - - - - - - 350 K - - - - - - - - -
canadaeast 40 K 80 K 80 K - 300 K - 350 K 350 K 350 K - - - - - - -
eastus - - 80 K - 240 K 240 K 240 K 350 K 350 K - - - - - - -
eastus2 - - 80 K - 300 K - 350 K 350 K 350 K - - - - 250 K 250 K 250 K
francecentral 20 K 60 K 80 K - 240 K - 240 K - - - - - - - - -
Japan, östra - - - 30 K 300 K - 350 K - - - - - - - - -
northcentralus - - 80 K - 300 K - 350 K - - 240 K 250 K 240 K 250 K 250 K 250 K 250 K
norwayeast - - 150 K - - - 350 K - - - - - - - - -
southafricanorth - - - - - - 350 K - - - - - - - - -
USA, södra centrala - - 80 K - 240 K - 240 K - - - - - - - - -
southindia - - 150 K - 300 K - 350 K - - - - - - - - -
swedencentral 40 K 80 K 150 K 30 K 300 K 240 K 350 K - - 240 K 250 K 240 K 250 K 250 K 250 K 250 K
switzerlandnorth 40 K 80 K - 30 K 300 K - 350 K - - - - - - - - -
switzerlandwest - - - - - - - - - - 250 K - 250 K 250 K 250 K 250 K
uksouth - - 80 K - 240 K - 350 K - - - - - - - - -
Europa, västra - - - - 240 K - 240 K - - - - - - - - -
westus - - 80 K 30 K 300 K - 350 K - - - - - - - - -
westus3 - - 80 K - - - 350 K - - - - - - - - -

1 K = 1 000 token per minut (TPM). Relationen mellan TPM och begäranden per minut (RPM) definieras för närvarande som 6 RPM per 1 000 TPM.

Tillgänglighet för etablerad distributionsmodell

Region gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, turbo-2024-04-09 gpt-4-32k, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125
australiaeast -
Brasilien, södra - - -
canadacentral - - - -
canadaeast - - - -
eastus -
eastus2 -
francecentral - -
germanywestcentral - -
Japan, östra - - - -
koreacentral - - - -
northcentralus -
norwayeast - - - -
polencentral -
southafricanorth - - -
USA, södra centrala -
southindia -
swedencentral
switzerlandnorth -
switzerlandwest - - - - - -
uksouth -
westus -
westus3

Kommentar

Den etablerade versionen av gpt-4version:turbo-2024-04-09 är för närvarande begränsad till endast text.

Hur gör jag för att få åtkomst till Etablerad?

Du måste tala med ditt Microsoft-sälj-/kontoteam för att hämta etablerat dataflöde. Om du inte har ett sälj-/kontoteam kan du tyvärr inte köpa etablerat dataflöde just nu.

Mer information om etablerade distributioner finns i vår etablerade vägledning.

GPT-4- och GPT-4 Turbo-modelltillgänglighet

Offentliga molnregioner

Region gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, vision-preview gpt-4, turbo-2024-04-09 gpt-4-32k, 0613
australiaeast - -
canadaeast - - -
eastus - - - - -
eastus2 - - - -
francecentral - - -
Japan, östra - - - - -
northcentralus - - - - -
norwayeast - - - - -
USA, södra centrala - - - - -
southindia - - - - -
swedencentral -
switzerlandnorth - - -
uksouth - - - -
westus - - - -
westus3 - - - - -

Välj kundåtkomst

Förutom de regioner ovan som är tillgängliga för alla Azure OpenAI-kunder har vissa utvalda befintliga kunder beviljats åtkomst till versioner av GPT-4 i ytterligare regioner:

Modell Region
gpt-4 (0314) USA, östra
Frankrike, centrala
USA, södra centrala
Södra Storbritannien
gpt-4 (0613) USA, östra
USA, östra 2
Japan, östra
Södra Storbritannien

Azure Government-regioner

Följande GPT-4-modeller är tillgängliga med Azure Government:

Model ID Modelltillgänglighet
gpt-4 (1106-förhandsversion) US Gov, Virginia
US Gov, Arizona

GPT-3.5-modeller

Viktigt!

NEW-modellen gpt-35-turbo (0125) har olika förbättringar, bland annat högre noggrannhet vid svar i begärda format och en korrigering för ett fel som orsakade ett textkodningsproblem för funktionsanrop som inte är engelska.

GPT-3.5 Turbo används med Completions-API för chatt. GPT-3.5 Turbo version 0301 kan också användas med API:et Completions, men detta rekommenderas inte. GPT-3.5 Turbo version 0613 och 1106 stöder endast API:et för chattslutsättningar.

GPT-3.5 Turbo version 0301 är den första versionen av modellen som släpptes. Version 0613 är den andra versionen av modellen och lägger till stöd för funktionsanrop.

Se modellversioner för att lära dig hur Azure OpenAI Service hanterar modellversionsuppgraderingar och arbeta med modeller för att lära dig hur du visar och konfigurerar modellversionsinställningarna för dina GPT-3.5 Turbo-distributioner.

Kommentar

Versionen 0613 av gpt-35-turbo och gpt-35-turbo-16k kommer att dras tillbaka senast den 1 augusti 2024. Versionen 0301 av gpt-35-turbo kommer att dras tillbaka senast den 1 augusti 2024. Se modelluppdateringar för modelluppgraderingsbeteende.

GPT-3.5-Turbo-modelltillgänglighet

Offentliga molnregioner

Region gpt-35-turbo, 0301 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613 gpt-35-turbo-instruct, 0914
australiaeast - - -
canadaeast - -
eastus - -
eastus2 - - - -
francecentral - -
Japan, östra - - - -
northcentralus - - -
USA, södra centrala - - - -
southindia - - - - -
swedencentral - -
switzerlandnorth - - - -
uksouth - -
Europa, västra - - - - -
westus - - - - -

Azure Government-regioner

Följande GPT-3.5 turbomodeller är tillgängliga med Azure Government:

Model ID Modelltillgänglighet
gpt-35-turbo (1106-förhandsversion) US Gov, Virginia

Inbäddningsmodeller

Dessa modeller kan bara användas med API-begäranden för inbäddning.

Kommentar

text-embedding-3-large är den senaste och mest kompatibla inbäddningsmodellen. Det går inte att uppgradera mellan inbäddningsmodeller. För att kunna migrera från att använda text-embedding-ada-002 till text-embedding-3-large måste du generera nya inbäddningar.

Model ID Maximal begäran (token) Utdatadimensioner Träningsdata (upp till)
text-embedding-ada-002 (version 2) 8,191 1,536 Sep 2021
text-embedding-ada-002 (version 1) 2,046 1,536 Sep 2021
text-embedding-3-large 8,191 3,072 Sep 2021
text-embedding-3-small 8,191 1,536 Sep 2021

Kommentar

När du skickar en matris med indata för inbäddning är det maximala antalet indataobjekt i matrisen per anrop till inbäddningsslutpunkten 2048.

Offentliga molnregioner

Region text-embedding-ada-002, 1 text-embedding-ada-002, 2 text-embedding-3-small, 1 text-embedding-3-large, 1
australiaeast - - -
Brasilien, södra - - -
canadaeast -
eastus
eastus2 -
francecentral - - -
Japan, östra - - -
northcentralus - - -
norwayeast - - -
southafricanorth - - -
USA, södra centrala - -
southindia - - -
swedencentral - - -
switzerlandnorth - - -
uksouth - - -
Europa, västra - - -
westus - - -
westus3 - - -

Azure Government-regioner

Följande inbäddningsmodeller är tillgängliga med Azure Government:

Model ID Modelltillgänglighet
text-embedding-ada-002 (version 2) US Gov, Virginia
US Gov, Arizona

DALL-E-modeller

Model ID Tillgänglighet för funktioner Maximal begäran (tecken)
dalle2 (förhandsversion) USA, östra 1 000
dall-e-3 USA, östra, Australien, östra, Sverige, centrala 4 000

Finjusteringsmodeller

babbage-002 och davinci-002 har inte tränats att följa instruktionerna. Du bör bara köra frågor mot dessa basmodeller som referens till en finjusterad version för att utvärdera förloppet för träningen.

gpt-35-turbo - Finjustering av den här modellen är begränsad till en delmängd av regioner och är inte tillgänglig i varje region som basmodellen är tillgänglig.

Model ID Finjusteringsregioner Maximal begäran (token) Träningsdata (upp till)
babbage-002 USA, norra centrala
Sverige, centrala
Schweiz, västra
16,384 Sep 2021
davinci-002 USA, norra centrala
Sverige, centrala
Schweiz, västra
16,384 Sep 2021
gpt-35-turbo (0613) USA, östra 2
USA, norra centrala
Sverige, centrala
Schweiz, västra
4,096 Sep 2021
gpt-35-turbo (1106) USA, östra 2
USA, norra centrala
Sverige, centrala
Schweiz, västra
Indata: 16 385
Utdata: 4 096
Sep 2021
gpt-35-turbo (0125) USA, östra 2
USA, norra centrala
Sverige, centrala
Schweiz, västra
16,385 Sep 2021

Whisper-modeller

Model ID Modelltillgänglighet Maxbegäran (ljudfilstorlek)
whisper USA, östra 2
USA, norra centrala
Norge, östra
Indien, södra
Sverige, centrala
Västeuropa
25 MB

Text till tal-modeller (förhandsversion)

Model ID Modelltillgänglighet
tts-1 USA, norra centrala
Sverige, centrala
tts-1-hd USA, norra centrala
Sverige, centrala

Assistenter (förhandsversion)

För assistenter behöver du en kombination av en modell som stöds och en region som stöds. Vissa verktyg och funktioner kräver de senaste modellerna. Följande modeller är tillgängliga i Assistants API, SDK, Azure AI Studio och Azure OpenAI Studio. Följande tabell är för betala per användning. Information om PTU-tillgänglighet (Provisioned Throughput Unit) finns i etablerat dataflöde.

Region gpt-35-turbo (0613) gpt-35-turbo (1106) gpt-4 (0613) gpt-4 (1106) gpt-4 (0125)
Australien, östra
East US
USA, östra 2
Centrala Frankrike
Norge, östra
Sverige, centrala
Södra Storbritannien

Nästa steg