Dela via


Azure OpenAI i Azure AI Foundry Models

Azure OpenAI drivs av en mängd olika modeller med olika funktioner och prispunkter. Modelltillgängligheten varierar beroende på region och moln. För modellernas tillgänglighet i Azure Government kan du läsa Azure Government OpenAI Service.

Modeller beskrivning
codex-mini Finjusterad version av o4-mini.
GPT-4.1-serien Senaste modellversionen från Azure OpenAI
model-router En modell som intelligent väljer från en uppsättning underliggande chattmodeller för att svara på en viss fråga.
datoranvändningsförhandsgranskning En experimentell modell tränad för att användas med ett verktyg för svars-API:ets datoranvändning.
GPT-4.5 Förhandsversion Den senaste GPT-modellen som utmärker sig för olika text- och bilduppgifter.
o-seriemodeller Resonemangsmodeller med avancerad problemlösning och ökad fokusering och kapacitet.
GPT-4o & GPT-4o mini & GPT-4 Turbo De senaste mest kompatibla Azure OpenAI-modellerna med multimodala versioner, som kan acceptera både text och bilder som indata.
GPT-4 En uppsättning modeller som förbättrar GPT-3.5 och som kan förstå och generera naturligt språk och kod.
GPT-3.5 En uppsättning modeller som förbättrar GPT-3 och kan förstå och generera naturligt språk och kod.
Inbäddningar En uppsättning modeller som kan konvertera text till numerisk vektorform för att underlätta textlikhet.
Bildgenerering En serie modeller som kan generera ursprungliga bilder från naturligt språk.
Ljud En serie modeller för tal till text, översättning och text till tal. GPT-4o-ljudmodeller stöder antingen konversationsinteraktioner med låg svarstid, "tal in, tal ut" eller ljudgenerering.

GPT 4.1-serien

Region tillgänglighet

Modell Region
gpt-4.1 (2025-04-14) Se modelltabellen.
gpt-4.1-nano (2025-04-14) Se modelltabellen.
gpt-4.1-mini (2025-04-14) Se modelltabellen.

Förmågor

Modell-ID beskrivning Kontextfönster Maximalt antal utdatatoken Träningsdata (upp till)
gpt-4.1 (2025-04-14) – Text- och bildinmatning
– Textutgång
– API för chattens slutförande
– Svars-API
-Direktuppspelning
– Funktionsanrop
Strukturerade utdata (chattavslut)
- 1,047,576
– 128 000 (etablerade hanterade distributioner)
– 300 000 (gruppvis distributioner)
32,768 31 maj 2024
gpt-4.1-nano (2025-04-14) – Text- och bildinmatning
– Textutgång
– API för chattens slutförande
– Svars-API
-Direktuppspelning
– Funktionsanrop
Strukturerade utdata (chattavslut)
- 1,047,576
– 128 000 (etablerade hanterade distributioner)
– 300 000 (gruppvis distributioner)
32,768 31 maj 2024
gpt-4.1-mini (2025-04-14) – Text- och bildinmatning
– Textutgång
– API för chattens slutförande
– Svars-API
-Direktuppspelning
– Funktionsanrop
Strukturerade utdata (chattavslut)
- 1,047,576
– 128 000 (etablerade hanterade distributioner)
– 300 000 (gruppvis distributioner)
32,768 31 maj 2024

modellrouter

En modell som intelligent väljer från en uppsättning underliggande chattmodeller för att svara på en viss fråga.

Region tillgänglighet

Modell Region
model-router (2025-05-19) East USA 2 (Global Standard), Sverige Centralt (Global Standard)

Förmågor

Modell-ID beskrivning Kontextfönster Maximalt antal utdatatoken Träningsdata (upp till)
model-router (2025-05-19) En modell som intelligent väljer från en uppsättning underliggande chattmodeller för att svara på en viss fråga. 200,000* 32768 (GPT 4.1-serien)
100 K (o4-mini)
31 maj 2024

*Större kontextfönster är kompatibla med några av de underliggande modellerna, vilket innebär att ett API-anrop med en större kontext endast lyckas om prompten råkar dirigeras till rätt modell, annars misslyckas anropet.

datoranvändningsförhandsgranskning

En experimentell modell tränad för användning med Responses API datoranvändningsverktyget. Den kan användas tillsammans med bibliotek från tredje part så att modellen kan styra mus- och tangentbordsindata samtidigt som kontext hämtas från skärmbilder av den aktuella miljön.

Varning

Vi rekommenderar inte att du använder förhandsgranskningsmodeller i produktion. Vi uppgraderar alla distributioner av förhandsversioner till antingen framtida förhandsversioner eller till den senaste stabila GA-versionen. Modeller som är avsedda för förhandsversion följer inte standardlivscykeln för Azure OpenAI-modellen.

Tillgänglighet

För åtkomst till computer-use-preview registrering krävs och åtkomst beviljas baserat på Microsofts berättigandekriterier. Kunder som har åtkomst till andra modeller för begränsad åtkomst måste fortfarande begära åtkomst för den här modellen.

Begär åtkomst: computer-use-preview program för begränsad åtkomstmodell

När åtkomsten har beviljats måste du skapa en distribution för modellen.

Region tillgänglighet

Modell Region
computer-use-preview Se modelltabellen.

Förmågor

Modell-ID beskrivning Kontextfönster Maximalt antal utdatatoken Träningsdata (upp till)
computer-use-preview (2025-03-11) Specialiserad modell för användning med Responses-API:t i datormiljö

-Arbetsredskap
-Direktuppspelning
-Text(indata/utdata)
– Bild(indata)
8,192 1,024 Okt 2023

GPT-4.5 Förhandsversion

Region tillgänglighet

Modell Region
gpt-4.5-preview Se modelltabellen.

Förmågor

Modell-ID beskrivning Kontextfönster Maximalt antal utdatatoken Träningsdata (upp till)
gpt-4.5-preview (2025-02-27)
GPT-4.5 Förhandsversion
GPT 4.1 är den rekommenderade ersättningen för den här modellen. Utmärkt på olika text- och bilduppgifter.
– Strukturerade utdata
– Fråga cachelagring
-Arbetsredskap
-Direktuppspelning
– Text(indata/utdata)
– Bild(indata)
128,000 16,384 Okt 2023

Anteckning

Det är förväntat att modellen inte kan svara på frågor om sig själv. Om du vill veta när kunskapsavstängningen för modellens träningsdata är eller annan information om modellen bör du läsa modelldokumentationen ovan.

o-seriemodeller

Modellerna i Azure OpenAI o-serien* är särskilt utformade för att hantera resonemang och problemlösningsuppgifter med ökat fokus och ökad kapacitet. Dessa modeller ägnar mer tid åt att bearbeta och förstå användarens begäran, vilket gör dem exceptionellt starka inom områden som vetenskap, kodning och matematik jämfört med tidigare iterationer.

Modell-ID beskrivning Maximalt antal (tokens) Träningsdata (upp till)
codex-mini (2025-05-16) Finjusterad version av o4-mini.
- Api för svar
– Strukturerade utdata
- Text, bildbearbetning
- Funktioner/verktyg
Fullständig sammanfattning av funktioner
Input: 200 000
Utdata: 100 000
31 maj 2024
o3-pro (2025-06-10) - Api för svar
– Strukturerade utdata
- Text, bildbearbetning
- Funktioner/verktyg
Fullständig sammanfattning av funktioner
Input: 200 000
Utdata: 100 000
31 maj 2024
o4-mini (2025-04-16) - NY resonemangsmodell, som erbjuder förbättrade resonemangsförutständanden.

– API för chattens slutförande
- Api för svar
– Strukturerade utdata
- Text, bildbearbetning
- Funktioner/verktyg
Fullständig sammanfattning av funktioner
Input: 200 000
Utdata: 100 000
31 maj 2024
o3 (2025-04-16) - NY resonemangsmodell, som erbjuder förbättrade resonemangsförutständanden.

– API för chattens slutförande
- Api för svar
– Strukturerade utdata
- Text, bildbearbetning
– Funktioner/Verktyg/Parallell verktygskallning
Fullständig sammanfattning av funktioner
Input: 200 000
Utdata: 100 000
31 maj 2024
o3-mini (2025-01-31) - Förbättrade resonemangsförmåga.
– Strukturerade utdata
– Bearbetning endast av text
- Funktioner/verktyg
Input: 200 000
Utdata: 100 000
Okt 2023
o1 (2024-12-17) - Förbättrade resonemangsförmåga.
– Strukturerade utdata
- Text, bildbearbetning
- Funktioner/verktyg
Input: 200 000
Utdata: 100 000
Okt 2023
o1-preview (2024-09-12) Äldre förhandsversion Indata: 128.000
Utdata: 32 768
Okt 2023
o1-mini (2024-09-12) Ett snabbare och mer kostnadseffektivt alternativ i o1-serien, perfekt för kodning av uppgifter som kräver hastighet och lägre resursförbrukning.

Globala standarddistributionen är tillgänglig som standard.

Standarddistributioner (regionala) är för närvarande endast tillgängliga för utvalda kunder som fick åtkomst som en del av den o1-preview begränsade åtkomstversionen.
Indata: 128.000
Utdata: 65 536
Okt 2023

Tillgänglighet

Mer information om de avancerade o-series modellerna finns i Komma igång med resonemangsmodeller.

Region tillgänglighet

Modell Region
codex-mini USA, östra 2 och Sverige, centrala (global standard)
o3-pro USA, östra 2 och Sverige, centrala (global standard)
o4-mini Se modelltabellen.
o3 Se modelltabellen.
o3-mini Se modelltabellen.
o1 Se modelltabellen.
o1-preview Se modelltabellen. Den här modellen är endast tillgänglig för kunder som har beviljats åtkomst som en del av den ursprungliga begränsade åtkomsten
o1-mini Se modelltabellen.

GPT-4o och GPT-4 Turbo

GPT-4o integrerar text och bilder i en enda modell, vilket gör att den kan hantera flera datatyper samtidigt. Den här multimodala metoden förbättrar noggrannheten och svarstiden i interaktioner mellan människa och dator. GPT-4o matchar GPT-4 Turbo i engelska text- och kodningsuppgifter samtidigt som det ger överlägsen prestanda i icke-engelska språk och visionsuppgifter, vilket sätter nya riktmärken för AI-funktioner.

Hur gör jag för att komma åt GPT-4o-modellerna och GPT-4o mini-modellerna?

GPT-4o och GPT-4o mini är tillgängliga för standard - och global standardmodelldistribution .

Du måste skapa eller använda en befintlig resurs i en standard- eller global standardregion som stöds där modellen är tillgänglig.

När resursen har skapats kan du distribuera GPT-4o-modellerna. Om du utför en programmatisk distribution är modellnamnen:

  • gpt-4o Version2024-11-20
  • gpt-4o Version2024-08-06
  • gpt-4o Version2024-05-13
  • gpt-4o-mini Version2024-07-18

GPT-4 Turbo

GPT-4 Turbo är en stor multimodal modell (som accepterar text- eller bildindata och genererar text) som kan lösa svåra problem med större noggrannhet än någon av OpenAI:s tidigare modeller. Liksom GPT-3.5 Turbo, och äldre GPT-4 modeller GPT-4 Turbo är optimerad för chatt och fungerar bra för traditionella slutförande uppgifter.

GPT-4

GPT-4 är föregångaren till GPT-4 Turbo. Både GPT-4- och GPT-4 Turbo-modellerna har basmodellnamnet gpt-4. Du kan skilja mellan MODELLERNA GPT-4 och Turbo genom att undersöka modellversionen.

  • gpt-4 Version0314
  • gpt-4 Version0613
  • gpt-4-32k Version0613

Du kan se den tokenkontextlängd som stöds av varje modell i tabellen för modellsammanfattning.

GPT-4- och GPT-4 Turbo-modeller

  • Dessa modeller kan endast användas med API:et för chattslutsättning.

Se modellversioner för att lära dig hur Azure OpenAI hanterar modellversionsuppgraderingar och arbeta med modeller för att lära dig hur du visar och konfigurerar modellversionsinställningarna för dina GPT-4-distributioner.

Modell-ID beskrivning Maximalt antal (tokens) Träningsdata (upp till)
gpt-4o (2024-11-20)
GPT-4o (Omni)
Senaste stora GA-modellen
– Strukturerade utdata
- Text, bildbearbetning
– JSON-läge
– parallell-funktionsanrop
– Förbättrad noggrannhet och svarstider
- Paritet med engelska text- och kodningsuppgifter jämfört med GPT-4 Turbo med Vision
- Överlägsen prestanda i icke-engelska språk och i visionsuppgifter.
- Förbättrad förmåga till kreativt skrivande
Indata: 128.000
Utdata: 16 384
Okt 2023
gpt-4o (2024-08-06)
GPT-4o (Omni)
– Strukturerade utdata
- Text, bildbearbetning
– JSON-läge
– parallell-funktionsanrop
– Förbättrad noggrannhet och svarstider
- Paritet med engelska text- och kodningsuppgifter jämfört med GPT-4 Turbo med Vision
- Överlägsen prestanda i icke-engelska språk och i visionsuppgifter
Indata: 128.000
Utdata: 16 384
Okt 2023
gpt-4o-mini (2024-07-18)
GPT-4o mini
Nyaste lilla GA-modellen
- Snabb, billig, kapabel modell perfekt för att ersätta GPT-3.5 Turbo-serien modeller.
- Text, bildbearbetning
– JSON-läge
– parallell funktionsanrop
Indata: 128.000
Utdata: 16 384
Okt 2023
gpt-4o (2024-05-13)
GPT-4o (Omni)
Text, bildbearbetning
– JSON-läge
– parallell-funktionsanrop
– Förbättrad noggrannhet och svarstider
- Paritet med engelska text- och kodningsuppgifter jämfört med GPT-4 Turbo med Vision
- Överlägsen prestanda i icke-engelska språk och i visionsuppgifter
Indata: 128.000
Utdata: 4 096
Okt 2023
gpt-4 (turbo-2024-04-09)
GPT-4 Turbo med vision
Ny GA-modell
– Ersättning för alla tidigare GPT-4-förhandsversionsmodeller (vision-preview, 1106-Preview, 0125-Preview).
- Funktionstillgänglighet skiljer sig för närvarande beroende på indatametod och distributionstyp.
Indata: 128.000
Utdata: 4 096
dec 2023
gpt-4-32k (0613) Äldre GA-modell
– Grundläggande funktionsanrop med verktyg
32,768 Sep 2021
gpt-4 (0613) Äldre GA-modell
– Grundläggande funktionsanrop med verktyg
8,192 Sep 2021
gpt-4-32k(0314) Äldre GA-modell
- Information om pensionering
32,768 Sep 2021
gpt-4 (0314) Äldre GA-modell
- Information om pensionering
8,192 Sep 2021

Varning

Vi rekommenderar inte att du använder förhandsgranskningsmodeller i produktion. Vi uppgraderar alla distributioner av förhandsversioner till antingen framtida förhandsversioner eller till den senaste stabila GA-versionen. Modeller som är avsedda för förhandsversion följer inte standardlivscykeln för Azure OpenAI-modellen.

GPT-3.5

GPT-3.5-modeller kan förstå och generera naturligt språk eller kod. Den mest kompatibla och kostnadseffektiva modellen i GPT-3.5-familjen är GPT-3.5 Turbo, som har optimerats för chatt och fungerar bra för traditionella slutförandeuppgifter också. GPT-3.5 Turbo är tillgängligt för användning med API:et för chattavslut. GPT-3.5 Turbo Instruct har liknande funktioner som text-davinci-003, men använder Completions API istället för Chat Completions API. Vi rekommenderar att du använder GPT-3.5 Turbo- och GPT-3.5 Turbo Instruct över äldre GPT-3.5- och GPT-3-modeller.

Modell-ID beskrivning Maximalt antal (tokens) Träningsdata (upp till)
gpt-35-turbo (0125) NY Senaste GA-modellen
– JSON-läge
– parallell-funktionsanrop
– reproducerbara utdata (förhandsvisning)
– Högre noggrannhet vid svar i begärda format.
– Korrigering för ett fel som orsakade ett problem med textkodning för funktionsanrop som inte är engelska.
Indata: 16 385
Utdata: 4 096
Sep 2021
gpt-35-turbo (1106) Äldre GA-modell
– JSON-läge
– parallell-funktionsanrop
– reproducerbart resultat (förhandsgranskning)
Indata: 16 385
Utdata: 4 096
Sep 2021
gpt-35-turbo-instruct (0914) Slutpunkt för slutförande
– Ersättning för äldre kompletteringsmodeller
4,097 Sep 2021

Om du vill veta mer om hur du interagerar med GPT-3.5 Turbo och API:et för chattslutsättningar kan du läsa vår detaljerade instruktioner.

1 Den här modellen accepterar begäranden > om 4 096 token. Vi rekommenderar inte att överskrida gränsen på 4 096 indatatoken eftersom den nyare versionen av modellen är begränsad till 4 096 token. Om du får problem när du överskrider 4 096 indatatoken med den här modellen stöds inte den här konfigurationen officiellt.

Inbäddningar

text-embedding-3-large är den senaste och mest kompatibla inbäddningsmodellen. Det går inte att uppgradera mellan inbäddningsmodeller. Om du vill gå från att använda text-embedding-ada-002 till text-embedding-3-large måste du generera nya inbäddningar.

  • text-embedding-3-large
  • text-embedding-3-small
  • text-embedding-ada-002

Vid testning rapporterar OpenAI att både den stora och den lilla tredje generationens inbäddningsmodeller ger bättre genomsnittlig prestanda för flerspråkshämtning med MIRACL-riktmärket samtidigt som prestandan för engelska uppgifter bibehålls med MTEB-riktmärket .

Utvärderingsriktmärke text-embedding-ada-002 text-embedding-3-small text-embedding-3-large
MIRACL-genomsnitt 31,4 44.0 54.9
MTEB-genomsnitt 61,0 62.3 64.6

Den tredje generationens inbäddningsmodeller har stöd för att minska storleken på inbäddningen via en ny dimensions parameter. Vanligtvis är större inbäddningar dyrare ur ett beräknings-, minnes- och lagringsperspektiv. Att kunna justera antalet dimensioner ger mer kontroll över den totala kostnaden och prestandan. Parametern dimensions stöds inte i alla versioner av OpenAI 1.x Python-biblioteket, för att dra nytta av den här parametern rekommenderar vi att du uppgraderar till den senaste versionen: pip install openai --upgrade.

OpenAI:s MTEB-benchmarktestning visade att även när den tredje generationens modells dimensioner reduceras till mindre än text-embeddings-ada-002 1 536 dimensioner är prestandan fortfarande något bättre.

Modeller för bildgenerering

Bildgenereringsmodellerna genererar bilder från textanvisningarna som användaren tillhandahåller. GPT-image-1 är i en offentlig förhandsversion med begränsad åtkomst. DALL-E 3 är allmänt tillgängligt för användning med REST-API:er. DALL-E 2 och DALL-E 3 med klient-SDK:er finns i förhandsversion.

Tillgänglighet

För åtkomst till gpt-image-1 registrering krävs och åtkomst beviljas baserat på Microsofts berättigandekriterier. Kunder som har åtkomst till andra modeller för begränsad åtkomst måste fortfarande begära åtkomst för den här modellen.

Begär åtkomst: gpt-image-1 program för begränsad åtkomstmodell

När åtkomsten har beviljats måste du skapa en distribution för modellen.

Region tillgänglighet

Modell Region
dall-e-3 östra USA
Australien, östra
Centrala Sverige
gpt-image-1 Väst-USA 3 (Global Standard)
Förenade Arabemiraten Nord (Global standard)

Modeller för videogenerering

Sora är en AI-modell från OpenAI som kan skapa realistiska och fantasifulla videoscener från textinstruktioner. Sora är i offentlig förhandsversion.

Region tillgänglighet

Modell Region
sora Östra USA 2

Ljudmodeller

Ljudmodeller i Azure OpenAI är tillgängliga via API:erna realtime, completionsoch audio .

GPT-4o-ljudmodeller

GPT 4o-ljudmodellerna är en del av GPT-4o-modellfamiljen och stöder antingen låg latens, "tal in, tal ut" konversationsinteraktioner eller ljudgenerering.

Varning

Vi rekommenderar inte att du använder förhandsgranskningsmodeller i produktion. Vi uppgraderar alla distributioner av förhandsversioner till antingen framtida förhandsversioner eller till den senaste stabila GA-versionen. Modeller som är avsedda för förhandsversion följer inte standardlivscykeln för Azure OpenAI-modellen.

Information om maximala begärandetoken och träningsdata finns i följande tabell.

Modell-ID beskrivning Maximalt antal (tokens) Träningsdata (upp till)
gpt-4o-mini-audio-preview (2024-12-17)
GPT-4o Audio
Ljudmodell för ljud- och textgenerering. Indata: 128.000
Utdata: 4 096
Okt 2023
gpt-4o-mini-realtime-preview (2024-12-17)
GPT-4o Audio
Ljudmodell för ljudbearbetning i realtid. Indata: 128.000
Utdata: 4 096
Okt 2023
gpt-4o-audio-preview (2024-12-17)
GPT-4o Audio
Ljudmodell för ljud- och textgenerering. Indata: 128.000
Utdata: 4 096
Okt 2023
gpt-4o-realtime-preview (2024-12-17)
GPT-4o Audio
Ljudmodell för ljudbearbetning i realtid. Indata: 128.000
Utdata: 4 096
Okt 2023
gpt-4o-mini-realtime-preview (2024-12-17)
GPT-4o Audio
Ljudmodell för ljudbearbetning i realtid. Indata: 128.000
Utdata: 4 096
Okt 2023

Information om hur du jämför tillgängligheten för GPT-4o-ljudmodeller i alla regioner finns i modelltabellen.

Ljud-API

Ljudmodellerna via API:et /audio kan användas för tal till text, översättning och text till tal.

Tal-till-textmodeller

Modell-ID beskrivning Maxbegäran (ljudfilstorlek)
whisper Taligenkänningsmodell för generell användning. 25 MB
gpt-4o-transcribe Röst-till-text som drivs av GPT-4o. 25 MB
gpt-4o-mini-transcribe Röst-till-text baserad på GPT-4o mini. 25 MB

Talöversättningsmodeller

Modell-ID beskrivning Maxbegäran (ljudfilstorlek)
whisper Taligenkänningsmodell för generell användning. 25 MB

Text till tal-modeller (förhandsversion)

Modell-ID beskrivning
tts Text till tal optimerad för hastighet.
tts-hd Text till tal optimerad för kvalitet.
gpt-4o-mini-tts Text till tal-modell som drivs av GPT-4o mini.

Du kan vägleda rösten att tala i en stil eller ton.

Mer information finns i Tillgänglighet för ljudmodeller i olika regioner i den här artikeln.

Modellsammanfattningstabell och regionstillgänglighet

Modeller efter distributionstyp

Azure OpenAI ger kunderna val av värdstruktur som passar deras affärs- och användningsmönster. Tjänsten erbjuder två huvudsakliga typer av distribution:

  • Standard erbjuds med ett globalt distributionsalternativ som dirigerar trafik globalt för att ge högre dataflöde.
  • Etablerad erbjuds också med ett globalt distributionsalternativ som gör det möjligt för kunder att köpa och distribuera tilldelade dataflödesenheter i Azures globala infrastruktur.

Alla implementeringar kan utföra exakt samma inferenstjänster, men fakturering, skala och prestanda skiljer sig avsevärt. Mer information om Distributionstyper för Azure OpenAI finns i guiden för distributionstyper.

Global standardmodelltillgänglighet

Region o3-pro, 2025-06-10 codex-mini, 2025-05-16 model-router, 2025-05-19 o3, 2025-04-16 o4-mini, 2025-04-16 gpt-image-1, 2025-04-15 gpt-4.1, 2025-04-14 gpt-4.1-nano, 2025-04-14 gpt-4.1-mini, 2025-04-14 förhandsgranskning av datoranvändning, 2025-03-11 gpt-4.5-preview, 2025-02-27 o3-mini, 2025-01-31 o1, 2024-12-17 o1-preview, 2024-09-12 o1-mini, 2024-09-12 gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o, 2024-11-20 gpt-4o-mini, 2024-07-18 gpt-4, turbo-2024-04-09 text-embedding-3-small, 1 text-embedding-3-large, 1 text-embedding-ada-002, 2 gpt-4o-realtime-preview, 2024-12-17 gpt-4o-audio-preview, 2024-12-17 gpt-4o-mini-realtime-preview, 2024-12-17 gpt-4o-mini-audio-preview, 2024-12-17 gpt-4o-transcribe, 2025-03-20 gpt-4o-mini-tts, 2025-03-20 gpt-4o-mini-transcribe, 2025-03-20
Australia East - - - - - - - - - - - - - - - - - -
Sydbrasilien - - - - - - - - - - - - - - - - -
CanadaEast - - - - - - - - - - - - - - - - -
eastus - - - - - - - - - - - - - - -
eastus2 -
francecentral - - - - - - - - - - - - - - - - -
Tyskland Västcentrala - - - - - - - - - - - - - - - - -
Norra Italien - - - - - - - - - - - - - - - - - - - -
Japaneast - - - - - - - - - - - - - - - - -
koreacentral - - - - - - - - - - - - - - - - -
Centrala norra USA - - - - - - - - - - - - - - -
Norge öst - - - - - - - - - - - - - - - - - -
polencentral - - - - - - - - - - - - - - - - - -
Sydafrika Nord - - - - - - - - - - - - - - - - - -
sydcentrala USA - - - - - - - - - - - - - - - -
Sydindien - - - - - - - - - - - - - - - - -
spaincentral - - - - - - - - - - - - - - - - -
swedencentral - - -
norra Schweiz - - - - - - - - - - - - - - - - -
Uaenorth - - - - - - - - - - - - - - - -
uksouth - - - - - - - - - - - - - - - - -
Europa, västra - - - - - - - - - - - - - - - - -
westus - - - - - - - - - - - - - - -
westus3 - - - - - - - - - - - - - -

Anteckning

o1-mini är för närvarande tillgängligt för alla kunder för global standarddistribution.

Utvalda kunder har beviljats standarddistributionsåtkomst (regional) till o1-mini som en del av den o1-preview begränsade åtkomstversionen. För närvarande utökas inte åtkomsten till o1-mini standardutplaceringar (regionala).

Den här tabellen innehåller inte detaljerad information om regional tillgänglighet. Mer information finns i avsnittet om finjustering .

Standarddistributionsmodeller (regionala) efter slutpunkt

Chatten har slutförts

Region o1-preview, 2024-09-12 o1-mini, 2024-09-12 gpt-4o, 2024-05-13 gpt-4o, 2024-11-20 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4, turbo-2024-04-09 gpt-35-turbo, 1106 gpt-35-turbo, 0125
Australia East - - - - - -
CanadaEast - - - - - -
eastus -
eastus2 -
francecentral - - - - - -
Japaneast - - - - - - -
Centrala norra USA -
Norge öst - - - - - - - -
sydcentrala USA -
Sydindien - - - - - -
swedencentral
norra Schweiz - - - - - - -
uksouth - - - - - -
Europa, västra - - - - - - - -
westus
westus3 -

Anteckning

o1-mini är för närvarande tillgängligt för alla kunder för global standarddistribution.

Utvalda kunder har beviljats standarddistributionsåtkomst (regional) till o1-mini som en del av den o1-preview begränsade åtkomstversionen. För närvarande utökas inte åtkomsten till o1-mini standardutplaceringar (regionala).

GPT-4- och GPT-4 Turbo-modelltillgänglighet

Välj kundåtkomst

Förutom de regioner ovan som är tillgängliga för alla Azure OpenAI-kunder har vissa utvalda befintliga kunder beviljats åtkomst till versioner av GPT-4 i ytterligare regioner:

Modell Region
gpt-4 (0314)
gpt-4-32k (0314)
Östra USA
Centralfrankrike
Södra centrala USA
Södra Storbritannien
gpt-4 (0613)
gpt-4-32k (0613)
Östra USA
Östra USA 2
Japan, östra
Södra Storbritannien

GPT-3.5-modeller

Se modellversioner för att lära dig hur Azure OpenAI hanterar modellversionsuppgraderingar och arbeta med modeller för att lära dig hur du visar och konfigurerar modellversionsinställningarna för dina GPT-3.5 Turbo-distributioner.

Finjusteringsmodeller

Anteckning

gpt-35-turbo – Finjustering av den här modellen är begränsad till en delmängd av regioner och är inte tillgänglig i varje region som basmodellen är tillgänglig.

De regioner som stöds för finjustering kan variera om du använder Azure OpenAI-modeller i ett Azure AI Foundry-projekt jämfört med utanför ett projekt.

Modell-ID Standardträningsregioner Global utbildning (förhandsversion) Maximalt antal förfrågningar (token) Träningsdata (upp till) Modalitet
gpt-35-turbo (1106) Östra USA 2
USA, norra centrala
Sverige Centrala
Schweiz, västra
- Indata: 16 385
Utdata: 4 096
Sep 2021 Text till text
gpt-35-turbo (0125) Östra USA 2
USA, norra centrala
Sverige Centrala
Schweiz, västra
- 16,385 Sep 2021 Text till text
gpt-4o-mini (2024-07-18) USA, norra centrala
Centrala Sverige
- Indata: 128.000
Utdata: 16 384
Kontextlängd för träningsexempel: 65 536
Okt 2023 Text till text
gpt-4o (2024-08-06) Östra USA 2
USA, norra centrala
Centrala Sverige
- Indata: 128.000
Utdata: 16 384
Kontextlängd för träningsexempel: 65 536
Okt 2023 Text och bild till text
gpt-4.1 (2025-04-14) USA, norra centrala
Centrala Sverige
Indata: 128.000
Utdata: 16 384
Kontextlängd för träningsexempel: 65 536
Maj 2024 Text och bild till text
gpt-4.1-mini (2025-04-14) USA, norra centrala
Centrala Sverige
Indata: 128.000
Utdata: 16 384
Kontextlängd för träningsexempel: 65 536
Maj 2024 Text till text
gpt-4.1-nano (2025-04-14) USA, norra centrala
Centrala Sverige
- Indata: 128.000
Utdata: 16 384
Kontextlängd för träningsexempel: 32 768
Maj 2024 Text till text
o4-mini (2025-04-16) Östra USA 2
Centrala Sverige
- Indata: 128.000
Utdata: 16 384
Kontextlängd för träningsexempel: 65 536
Maj 2024 Text till text

Anteckning

Global utbildning (i offentlig förhandsversion) ger mer prisvärd utbildning per token, men erbjuder inte datahemvist. Den är för närvarande tillgänglig för Azure OpenAI-resurser i följande regioner, och fler regioner kommer snart:

  • Australien, östra
  • Syd-Brasilien
  • östra USA
  • Östra USA 2
  • Frankrike Centrala
  • Tyskland Västcentrala
  • Norra Italien
  • Japan, östra (inget visionsstöd)
  • Korea Centrala
  • Norra centrala USA
  • Norge, östra
  • Centrala Polen
  • Sydostasien
  • Sydafrika Nord
  • Södra Centrala USA
  • centrala Spanien
  • Centrala Sverige
  • Schweiz, västra
  • Schweiz, norra
  • Södra Storbritannien
  • Västeuropa
  • Västra USA
  • Västra USA 3

Assistenter (förhandsversion)

För assistenter behöver du en kombination av en modell som stöds och en region som stöds. Vissa verktyg och funktioner kräver de senaste modellerna. Följande modeller är tillgängliga i Assistants API, SDK och Azure AI Foundry. Följande tabell är avsedd för standarddistribution. Information om tillgänglighet för Provisioned Throughput Unit (PTU) finns i provisioned throughput. De listade modellerna och regionerna kan användas med både Assistenter v1 och v2. Du kan använda globala standardmodeller om de stöds i de regioner som anges nedan.

Region gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, turbo-2024-04-09 gpt-4-32k, 0613 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613
Australia East - - - - -
eastus - - - -
eastus2 - - - -
francecentral - - - - - -
Japaneast - - - - - - - - -
Norge öst - - - - - - - - - - -
Sydindien - - - - - - - - -
swedencentral - -
uksouth - - - - - -
westus - - - - -
westus3 - - - - - -

Modellpensionering

Den senaste informationen om modellpensioneringar finns i guide för modellpensionering.

Nästa steg