Sdílet prostřednictvím


Modely Azure OpenAI v integrovaném prostředí Azure AI Foundry

Azure OpenAI využívá různorodou sadu modelů s různými možnostmi a cenovými body. Dostupnost modelu se liší podle oblastí a cloudu. Dostupnost modelu Azure Government najdete ve službě Azure Government OpenAI.

Modely Popis
codex-mini Jemně vyladěná verze o4-mini.
Řada GPT-4.1 Nejnovější vydání modelu od Azure OpenAI
model-router Model, který inteligentně vybírá ze sady podkladových modelů chatu, aby reagoval na danou výzvu.
náhled použití počítače Experimentální model vyvinutý pro použití s rozhraním API pro odpovědi.
GPT-4.5 Preview Nejnovější model GPT, který exceluje v různých textových a obrázkových úkolech.
Modely o-series Modely s pokročilými schopnostmi řešit problémy a se zvýšeným zaměřením a schopnostmi.
GPT-4o & GPT-4o mini & GPT-4 Turbo Nejnovější modely Azure OpenAI s vícemodálními verzemi, které můžou jako vstup přijímat text i obrázky.
GPT-4 Sada modelů, které zlepšují GPT-3.5 a můžou pochopit a generovat přirozený jazyk a kód.
GPT-3.5 Sada modelů, které zlepšují GPT-3 a můžou pochopit a generovat přirozený jazyk a kód.
Vkládání Sada modelů, které mohou převést text do číselné vektorové formy, aby se usnadnila podobnost textu.
Generování obrázků Řada modelů, které můžou generovat původní obrázky z přirozeného jazyka.
Zvuk Řada modelů pro převod řeči na text, překlad a převod textu na řeč. Zvukové modely GPT-4o podporují buď nízkou latenci pro konverzační interakce typu "řeč dovnitř, řeč ven", nebo generování zvuku.

Řada GPT 4.1

Regionální dostupnost

Vzor Región
gpt-4.1 (2025-04-14) Podívejte se na tabulku modelů.
gpt-4.1-nano (2025-04-14) Podívejte se na tabulku modelů.
gpt-4.1-mini (2025-04-14) Podívejte se na tabulku modelů.

Schopnosti

ID modelu Popis Kontextové okno Maximální počet výstupních tokenů Tréninková data (do)
gpt-4.1 (2025-04-14) - Text a obrazový vstup
- Výstup textu
- API pro doplnění chatu
- Odezvy API
- Streamování
- Volání funkcí
Strukturované výstupy (dokončení chatu)
- 1,047,576
– 128 000 (zřízené spravované nasazení)
– 300 000 (dávkové nasazení)
32,768 31. května 2024
gpt-4.1-nano (2025-04-14) - Text a obrazový vstup
- Výstup textu
- API pro doplnění chatu
- Odezvy API
- Streamování
- Volání funkcí
Strukturované výstupy (dokončení chatu)
- 1,047,576
– 128 000 (zřízené spravované nasazení)
– 300 000 (dávkové nasazení)
32,768 31. května 2024
gpt-4.1-mini (2025-04-14) - Text a obrazový vstup
- Výstup textu
- API pro doplnění chatu
- Odezvy API
- Streamování
- Volání funkcí
Strukturované výstupy (dokončení chatu)
- 1,047,576
– 128 000 (zřízené spravované nasazení)
– 300 000 (dávkové nasazení)
32,768 31. května 2024

modelový router

Model, který inteligentně vybírá ze sady podkladových modelů chatu, aby reagoval na danou výzvu.

Regionální dostupnost

Vzor Región
model-router (2025-05-19) USA – východ 2 (globální standard), Švédsko – střed (globální standard)

Schopnosti

ID modelu Popis Kontextové okno Maximální počet výstupních tokenů Tréninková data (do)
model-router (2025-05-19) Model, který inteligentně vybírá ze sady podkladových modelů chatu, aby reagoval na danou výzvu. 200,000* 32768 (ŘADA GPT 4.1)
100 K (o4-mini)
31. května 2024

*Větší kontextová okna jsou kompatibilní s některými podkladovými modely, což znamená, že volání rozhraní API s větším kontextem bude úspěšné pouze v případě, že se výzva přesměruje do správného modelu, jinak volání selže.

náhled použití počítače

Experimentální model vycvičený pro použití s nástrojem Responses API pro počítače. Dá se použít ve spojení s knihovnami třetích stran, aby model mohl řídit vstup myši a klávesnice při získávání kontextu ze snímků obrazovky aktuálního prostředí.

Upozornění

Nedoporučujeme používat modely Preview v produkčním prostředí. Upgradujeme všechna nasazení modelů Preview na budoucí verze Preview nebo na nejnovější stabilní verzi GA. Modely, které jsou určené ve verzi Preview, nedodržují standardní životní cyklus modelu Azure OpenAI.

Dostupnost

Pro přístup k computer-use-preview registraci se vyžaduje a přístup se udělí na základě kritérií způsobilosti microsoftu. Zákazníci, kteří mají přístup k jiným modelům omezeného přístupu, budou muset požádat o přístup k tomuto modelu.

Žádost o přístup: computer-use-preview žádost o model omezeného přístupu

Po udělení přístupu budete muset pro model vytvořit nasazení.

Regionální dostupnost

Vzor Región
computer-use-preview Podívejte se na tabulku modelů.

Schopnosti

ID modelu Popis Kontextové okno Maximální počet výstupních tokenů Tréninková data (do)
computer-use-preview (2025-03-11) Specializovaný model pro použití s počítačem s rozhraním API pro odpovědi

-Nářadí
-Streamování
-Text(vstup/výstup)
- Obraz(vstup)
8,192 1,024 Říjen 2023

GPT-4.5 Preview

Regionální dostupnost

Vzor Región
gpt-4.5-preview Podívejte se na tabulku modelů.

Schopnosti

ID modelu Popis Kontextové okno Maximální počet výstupních tokenů Tréninková data (do)
gpt-4.5-preview (2025-02-27)
GPT-4.5 Preview
GPT 4.1 je doporučená náhrada tohoto modelu. Vyniká v různorodých úkolech s texty a obrázky.
- Strukturované výstupy
– Zobrazení výzvy k ukládání do mezipaměti
-Nářadí
-Streamování
- Text(vstup/výstup)
- Obraz(vstup)
128,000 16,384 Říjen 2023

Poznámka:

Očekávané chování je, že model nedokáže odpovědět na otázky týkající se sebe sama. Pokud chcete vědět, kdy je limit znalostí pro trénovací data modelu, nebo další podrobnosti o modelu, můžete se obrátit na výše uvedenou dokumentaci modelu.

modely řady o-series

Modely řady Azure OpenAI o* jsou speciálně navržené tak, aby řešily logické úvahy a problémové úlohy s větším zaměřením a schopnostmi. Tyto modely tráví více času zpracováním a porozuměním požadavku uživatele, což je mimořádně silné v oblastech, jako jsou věda, kódování a matematika v porovnání s předchozími iteracemi.

ID modelu Popis Maximální počet žádostí (tokeny) Tréninková data (do)
codex-mini (2025-05-16) Jemně vyladěná verze o4-mini.
- Rozhraní API pro odpovědi
- Strukturované výstupy
- Zpracování textu, obrázku
– Funkce/nástroje
Úplný souhrn možností
Input: 200 000
Výstup: 100 000
31. května 2024
o3-pro (2025-06-10) - Rozhraní API pro odpovědi
- Strukturované výstupy
- Zpracování textu, obrázku
– Funkce/nástroje
Úplný souhrn možností
Input: 200 000
Výstup: 100 000
31. května 2024
o4-mini (2025-04-16) - NOVÝ model zdůvodnění, který nabízí vylepšené možnosti zdůvodnění.

– Rozhraní API pro dokončení chatu
- Rozhraní API pro odpovědi
- Strukturované výstupy
- Zpracování textu, obrázku
– Funkce/nástroje
Úplný souhrn možností
Input: 200 000
Výstup: 100 000
31. května 2024
o3 (2025-04-16) - NOVÝ model zdůvodnění, který nabízí vylepšené možnosti zdůvodnění.

– Rozhraní API pro dokončení chatu
- Rozhraní API pro odpovědi
- Strukturované výstupy
- Zpracování textu, obrázku
– Funkce/ Nástroje / Paralelní volání nástrojů
Úplný souhrn možností
Input: 200 000
Výstup: 100 000
31. května 2024
o3-mini (2025-01-31) - Vylepšené možnosti odůvodnění.
- Strukturované výstupy
- Zpracování pouze textu
– Funkce/nástroje
Input: 200 000
Výstup: 100 000
Říjen 2023
o1 (2024-12-17) - Vylepšené možnosti odůvodnění.
- Strukturované výstupy
- Zpracování textu, obrázku
– Funkce/nástroje
Input: 200 000
Výstup: 100 000
Říjen 2023
o1-preview (2024-09-12) Starší verze Preview Vstup: 128 000
Výstup: 32 768
Říjen 2023
o1-mini (2024-09-12) Rychlejší a nákladově efektivnější možnost v řadě o1, která je ideální pro psaní úkolů vyžadujících rychlost a nižší spotřebu prostředků.

Ve výchozím nastavení je k dispozici globální standardní nasazení.

Standardní (regionální) nasazení jsou v současnosti dostupná pouze pro vybrané zákazníky, kteří získali přístup jako součást o1-preview vydání s omezeným přístupem.
Vstup: 128 000
Výstup: 65 536
Říjen 2023

Dostupnost

Další informace o pokročilých o-series modelech najdete v začátcích s modely zdůvodnění.

Regionální dostupnost

Vzor Región
codex-mini USA – východ 2 a Švédsko – střed (globální standard)
o3-pro USA – východ 2 a Švédsko – střed (globální standard)
o4-mini Podívejte se na tabulku modelů.
o3 Podívejte se na tabulku modelů.
o3-mini Podívejte se na tabulku modelů.
o1 Podívejte se na tabulku modelů.
o1-preview Podívejte se na tabulku modelů. Tento model je k dispozici pouze pro zákazníky, kteří měli udělený přístup jako součást původního omezeného přístupu.
o1-mini Podívejte se na tabulku modelů.

GPT-4o a GPT-4 Turbo

GPT-4o integruje text a obrázky v jednom modelu a umožňuje zpracovávat více datových typů současně. Tento multimodální přístup zlepšuje přesnost a rychlost odezvy v interakcích lidského počítače. GPT-4o odpovídá GPT-4 Turbo v anglických textových a programovacích úlohách a zároveň nabízí vynikající výkon v neanglických jazycích a vizuálních úkolech, čímž stanovuje nové standardy pro schopnosti AI.

Jak se dostanu k modelům GPT-4o a GPT-4o mini?

GPT-4o a GPT-4o mini jsou k dispozici pro standardní a globální nasazení modelu.

Potřebujete vytvořit nebo použít existující prostředek v podporované standardní nebo globální standardní oblasti, ve které je model dostupný.

Jakmile je váš prostředek vytvořen, můžete nasadit modely GPT-4o. Pokud provádíte programové nasazení, názvy modelů jsou:

  • gpt-4o Verze2024-11-20
  • gpt-4o Verze2024-08-06
  • gpt-4o Verze2024-05-13
  • gpt-4o-mini Verze2024-07-18

GPT-4 Turbo

GPT-4 Turbo je velký multimodální model (přijímá textové nebo obrazové vstupy a generuje text), který dokáže řešit obtížné problémy s větší přesností než kterýkoli z předchozích modelů OpenAI. Stejně jako GPT-3.5 Turbo a starší modely GPT-4 je GPT-4 Turbo optimalizovaný pro chat a funguje dobře pro tradiční úlohy dokončování.

GPT-4

GPT-4 je předchůdcem GPT-4 Turbo. Oba modely GPT-4 a GPT-4 Turbo mají základní jméno modelu gpt-4. Modely GPT-4 a Turbo můžete rozlišit prozkoumáním verze modelu.

  • gpt-4 Verze0314
  • gpt-4 Verze0613
  • gpt-4-32k Verze0613

V souhrnné tabulce modelu můžete zobrazit délku kontextu tokenu podporovanou každým modelem.

Modely GPT-4 a GPT-4 Turbo

  • Tyto modely lze použít pouze s rozhraním API pro dokončování chatu.

Podívejte se na verze modelů a zjistěte, jak Azure OpenAI zpracovává upgrady verzí modelu a jak pracovat s modely , abyste zjistili, jak zobrazit a nakonfigurovat nastavení verzí modelu nasazení GPT-4.

ID modelu Popis Maximální počet žádostí (tokeny) Tréninková data (do)
gpt-4o (2024-11-20)
GPT-4o (Omni)
Nejnovější velký model GA
- Strukturované výstupy
- Zpracování textu, obrázku
– Režim JSON
– paralelní volání funkcí
- Vyšší přesnost a rychlost odezvy
- Parita s anglickým textem a kódovacími úkoly ve srovnání s GPT-4 Turbo s Vize
- Vynikající výkon v neanglických jazycích a v úkolech souvisejících se zrakem.
- Vylepšená schopnost kreativního psaní
Vstup: 128 000
Výstup: 16 384
Říjen 2023
gpt-4o (2024-08-06)
GPT-4o (Omni)
- Strukturované výstupy
- Zpracování textu, obrázku
– Režim JSON
– paralelní volání funkcí
- Vyšší přesnost a rychlost odezvy
- Parita s anglickým textem a kódovacími úkoly ve srovnání s GPT-4 Turbo s Vize
- Vynikající výkon v neanglických jazycích a v úlohách zpracování obrazu
Vstup: 128 000
Výstup: 16 384
Říjen 2023
gpt-4o-mini (2024-07-18)
GPT-4o mini
Nejnovější malý model GA
- Rychlý, levný a schopný model ideální pro nahrazení modelů SÉRIE GPT-3.5 Turbo.
- Zpracování textu, obrázku
– Režim JSON
- paralelní volání funkcí
Vstup: 128 000
Výstup: 16 384
Říjen 2023
gpt-4o (2024-05-13)
GPT-4o (Omni)
Zpracování textu, obrázku
– Režim JSON
– paralelní volání funkcí
- Vyšší přesnost a rychlost odezvy
- Parita s anglickým textem a kódovacími úkoly ve srovnání s GPT-4 Turbo s Vize
- Vynikající výkon v neanglických jazycích a v úlohách zpracování obrazu
Vstup: 128 000
Výstup: 4 096
Říjen 2023
gpt-4 (turbo-2024-04-09)
GPT-4 Turbo s viděním
Nový model GA
- Náhrada za všechny předchozí modely GPT-4 Preview (vision-preview, 1106-Preview, 0125-Preview).
- Dostupnost funkcí se v současné době liší v závislosti na metodě vstupu a typu nasazení.
Vstup: 128 000
Výstup: 4 096
Prosinec 2023
gpt-4-32k (0613) Starší model GA
- Základní volání funkcí pomocí nástrojů
32,768 Zář 2021
gpt-4 (0613) Starší model GA
- Základní volání funkcí pomocí nástrojů
8,192 Zář 2021
gpt-4-32k(0314) Starší model GA
- Informace o důchodu
32,768 Zář 2021
gpt-4 (0314) Starší model GA
- Informace o důchodu
8,192 Zář 2021

Upozornění

Nedoporučujeme používat modely Preview v produkčním prostředí. Upgradujeme všechna nasazení modelů Preview na budoucí verze Preview nebo na nejnovější stabilní verzi GA. Modely, které jsou určené ve verzi Preview, nedodržují standardní životní cyklus modelu Azure OpenAI.

GPT-3.5

Modely GPT-3.5 můžou pochopit a generovat přirozený jazyk nebo kód. Nejschopnější a nákladově efektivní model v rodině GPT-3.5 je GPT-3.5 Turbo, který je optimalizovaný pro chat a funguje dobře i pro tradiční úkoly dokončení. GPT-3.5 Turbo je k dispozici pro použití s rozhraním API pro dokončování chatu. GPT-3.5 Turbo Instruct má podobné schopnosti jako text-davinci-003 při použití Completions API místo Chat Completions API. Doporučujeme používat GPT-3.5 Turbo a GPT-3.5 Turbo Pokyny pro starší modely GPT-3.5 a GPT-3.

ID modelu Popis Maximální počet žádostí (tokeny) Tréninková data (do)
gpt-35-turbo (0125) NOVÝ Nejnovější model GA
– Režim JSON
– paralelní volání funkcí
- reprodukovatelný výstup (náhled)
- Vyšší přesnost při odpovídání v požadovaných formátech.
- Oprava chyby, která způsobila problém s kódováním textu pro volání jiných než anglické jazykové funkce.
Vstup: 16 385
Výstup: 4 096
Zář 2021
gpt-35-turbo (1106) Starší model GA
– Režim JSON
– paralelní volání funkcí
- reprodukovatelný výstup (náhled)
Vstup: 16 385
Výstup: 4 096
Zář 2021
gpt-35-turbo-instruct (0914) Pouze koncový bod dokončení
- Nahrazení modelů starších dokončení
4,097 Zář 2021

Další informace o interakci s rozhraním GPT-3.5 Turbo a rozhraním API pro dokončování chatu najdete v našich podrobných návodech.

1 Tento model přijme požadavky > 4 096 tokenů. Nedoporučuje se překročit limit vstupního tokenu 4 096, protože novější verze modelu je omezena na 4 096 tokenů. Pokud při překročení 4 096 vstupních tokenů s tímto modelem narazíte na problémy, tato konfigurace se oficiálně nepodporuje.

Vnoření

text-embedding-3-large je nejnovější a nejschopnější model vkládání. Upgrade mezi modely vkládání není možný. Aby bylo možné přejít z použití text-embedding-ada-002 na text-embedding-3-large , budete muset vygenerovat nové vkládání.

  • text-embedding-3-large
  • text-embedding-3-small
  • text-embedding-ada-002

Při testování OpenAI uvádí, že jak velké, tak malé modely zapouzdření třetí generace nabízejí lepší průměrný výkon při vyhledávání v různých jazycích pomocí srovnávacího testu MIRACL, přičemž stále udržují výkon pro anglické úlohy při použití srovnávacího testu MTEB.

Referenční hodnota hodnocení text-embedding-ada-002 text-embedding-3-small text-embedding-3-large
Průměr MIRACL 31,4 44.0 54.9
Průměr MTEB 61.0 62.3 64.6

Modely vkládání třetí generace podporují zmenšení velikosti vkládání pomocí nového dimensions parametru. Větší vkládání jsou obvykle dražší z hlediska výpočetních prostředků, paměti a úložiště. Možnost upravit počet dimenzí umožňuje větší kontrolu nad celkovými náklady a výkonem. Parametr dimensions není podporován ve všech verzích knihovny OpenAI 1.x Python, abyste mohli využít výhod tohoto parametru, doporučujeme upgradovat na nejnovější verzi: pip install openai --upgrade

Testování benchmarku MTEB od OpenAI zjistilo, že i když jsou rozměry modelu třetí generace zmenšeny na méně než text-embeddings-ada-002 1 536 dimenzí, výkon zůstává mírně lepší.

Modely generování obrázků

Modely generování obrázků generují obrázky z textových výzev, které uživatel poskytuje. GPT-image-1 je ve verzi Public Preview s omezeným přístupem. DALL-E 3 je obecně k dispozici pro použití s rozhraními REST API. DALL-E 2 a DALL-E 3 s klientskými sadami SDK jsou ve verzi Preview.

Dostupnost

Pro přístup k gpt-image-1 registraci se vyžaduje a přístup se udělí na základě kritérií způsobilosti microsoftu. Zákazníci, kteří mají přístup k jiným modelům omezeného přístupu, budou muset požádat o přístup k tomuto modelu.

Žádost o přístup: gpt-image-1 žádost o model omezeného přístupu

Po udělení přístupu budete muset pro model vytvořit nasazení.

Regionální dostupnost

Vzor Región
dall-e-3 Východní USA
Austrálie – východ
Švédsko – střed
gpt-image-1 Západní USA 3 (Globální standard)
Spojené arabské emiráty – sever (globální standard)

Modely generování videa

Sora je model AI z OpenAI, který dokáže vytvářet realistické a imaginativní video scény z textových instrukcí. Sora je ve veřejné ukázce.

Regionální dostupnost

Vzor Región
sora Východní USA 2

Zvukové modely

Zvukové modely v Azure OpenAI jsou k dispozici prostřednictvím rozhraní API realtime, completions a audio.

Zvukové modely GPT-4o

Zvukové modely GPT 4o jsou součástí řady modelů GPT-4o a podporují buď nízkou latenci pro "řeč dovnitř, řeč ven" konverzační interakce, nebo generování zvuku.

Upozornění

Nedoporučujeme používat modely Preview v produkčním prostředí. Upgradujeme všechna nasazení modelů Preview na budoucí verze Preview nebo na nejnovější stabilní verzi GA. Modely, které jsou určené ve verzi Preview, nedodržují standardní životní cyklus modelu Azure OpenAI.

Podrobnosti o maximálních tokenech žádostí a trénovacích datech jsou k dispozici v následující tabulce.

ID modelu Popis Maximální počet žádostí (tokeny) Tréninková data (do)
gpt-4o-mini-audio-preview (2024-12-17)
GPT-4o audio
Zvukový model pro generování zvuku a textu Vstup: 128 000
Výstup: 4 096
Říjen 2023
gpt-4o-mini-realtime-preview (2024-12-17)
GPT-4o audio
Zvukový model pro zpracování zvuku v reálném čase. Vstup: 128 000
Výstup: 4 096
Říjen 2023
gpt-4o-audio-preview (2024-12-17)
GPT-4o audio
Zvukový model pro generování zvuku a textu Vstup: 128 000
Výstup: 4 096
Říjen 2023
gpt-4o-realtime-preview (2024-12-17)
GPT-4o audio
Zvukový model pro zpracování zvuku v reálném čase. Vstup: 128 000
Výstup: 4 096
Říjen 2023
gpt-4o-mini-realtime-preview (2024-12-17)
GPT-4o audio
Zvukový model pro zpracování zvuku v reálném čase. Vstup: 128 000
Výstup: 4 096
Říjen 2023

Pokud chcete porovnat dostupnost zvukových modelů GPT-4o ve všech oblastech, podívejte se na tabulku modelů.

Zvukové rozhraní API

Zvukové modely prostřednictvím /audio rozhraní API lze použít pro převod řeči na text, překlad a převod textu na řeč.

Převod řeči na textové modely

ID modelu Popis Maximální počet požadavků (velikost zvukového souboru)
whisper Model rozpoznávání řeči pro obecné účely 25 MB
gpt-4o-transcribe Převod řeči na text s využitím GPT-4o 25 MB
gpt-4o-mini-transcribe Převod řeči na text s využitím GPT-4o mini. 25 MB

Modely překladu řeči

ID modelu Popis Maximální počet požadavků (velikost zvukového souboru)
whisper Model rozpoznávání řeči pro obecné účely 25 MB

Modely převodu textu na řeč (Preview)

ID modelu Popis
tts Převod textu na řeč optimalizovaný pro rychlost
tts-hd Převod textu na řeč optimalizovaný pro vysokou kvalitu.
gpt-4o-mini-tts Model převodu textu na řeč s využitím GPT-4o mini.

Můžete vést hlas tak, aby mluvil v určitém stylu nebo tónu.

Další informace naleznete v tomto článku v části Dostupnost oblastí zvukových modelů.

Souhrnná tabulka modelů a dostupnost oblastí

Modely podle typu nasazení

Azure OpenAI poskytuje zákazníkům volby ve struktuře hostování, která odpovídá jejich obchodním vzorům a vzorům využití. Služba nabízí dva hlavní typy nasazení:

  • Standard se nabízí s možností globálního nasazení a směrováním provozu globálně za účelem zajištění vyšší propustnosti.
  • Zřízené je také nabízeno s možností globálního nasazování, která zákazníkům umožňuje nakupovat a nasazovat zřízené jednotky prostupnosti napříč globální infrastrukturou Azure.

Všechna nasazení mohou provádět shodné predikční operace, avšak fakturace, škálování a výkon se výrazně liší. Další informace o typech nasazení Azure OpenAI najdete v průvodci typy nasazení.

Globální standardní dostupnost modelu

Oblast o3-pro, 2025-06-10 codex-mini, 2025-05-16 model-router, 2025-05-19 o3, 2025-04-16 o4-mini, 2025-04-16 gpt-image-1, 2025-04-15 gpt-4.1, 2025-04-14 gpt-4.1-nano, 2025-04-14 gpt-4.1-mini, 2025-04-14 náhled použití počítače, 11.03.2025 gpt-4.5-preview, 2025-02-27 o3-mini, 2025-01-31 o1, 2024-12-17 o1-preview, 2024-09-12 o1-mini, 2024-09-12 gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o, 2024-11-20 gpt-4o-mini, 2024-07-18 gpt-4, turbo-2024-04-09 text-embedding-3-small, 1 text-embedding-3-large, 1 text-embedding-ada-002, 2 gpt-4o-realtime-preview, 2024-12-17 gpt-4o-audio-preview, 2024-12-17 gpt-4o-mini-realtime-preview, 2024-12-17 gpt-4o-mini-audio-preview, 2024-12-17 gpt-4o-transcribe, 2025-03-20 gpt-4o-mini-tts, 2025-03-20 gpt-4o-mini-přepis, 2025-03-20
Austrálie - východ - - - - - - - - - - - - - - - - - -
brazilsouth (jižní Brazílie) - - - - - - - - - - - - - - - - -
východní Kanada - - - - - - - - - - - - - - - - -
Eastus - - - - - - - - - - - - - - -
eastus2 -
franciecentral - - - - - - - - - - - - - - - - -
Německo – středozápad - - - - - - - - - - - - - - - - -
itálie sever - - - - - - - - - - - - - - - - - - - -
japaneast - - - - - - - - - - - - - - - - -
Korea Central - - - - - - - - - - - - - - - - -
Northcentralus - - - - - - - - - - - - - - -
Norsko – východ - - - - - - - - - - - - - - - - - -
polskocentral - - - - - - - - - - - - - - - - - -
Jižní Afrika – sever - - - - - - - - - - - - - - - - - -
southcentralus - - - - - - - - - - - - - - - -
jižní Indie - - - - - - - - - - - - - - - - -
španělskocentral - - - - - - - - - - - - - - - - -
švédskocentral - - -
Švýcarsko – sever - - - - - - - - - - - - - - - - -
spojené arabské emiráty - - - - - - - - - - - - - - - -
uksouth - - - - - - - - - - - - - - - - -
západní evropa - - - - - - - - - - - - - - - - -
westus - - - - - - - - - - - - - - -
westus3 - - - - - - - - - - - - - -

Poznámka:

o1-mini je aktuálně k dispozici pro všechny zákazníky pro globální standardní nasazení.

Vybraným zákazníkům byl udělen standardní (regionální) přístup k nasazení o1-mini jako součást omezeného přístupu o1-preview. V současné době se nerozšiřuje přístup ke standardním o1-mini (regionálním) nasazením.

Tato tabulka neobsahuje podrobné informace o dostupnosti v jednotlivých oblastech. Informace najdete v části o dolaďování.

Standardní modely nasazení (regionální) podle koncového bodu

Dokončení chatu

Oblast o1-preview, 2024-09-12 o1-mini, 2024-09-12 gpt-4o, 2024-05-13 gpt-4o, 2024-11-20 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4, turbo-2024-04-09 gpt-35-turbo, 1106 gpt-35-turbo, 0125
Austrálie - východ - - - - - -
východní Kanada - - - - - -
Eastus -
eastus2 -
franciecentral - - - - - -
japaneast - - - - - - -
Northcentralus -
Norsko – východ - - - - - - - -
southcentralus -
jižní Indie - - - - - -
švédskocentral
Švýcarsko – sever - - - - - - -
uksouth - - - - - -
západní evropa - - - - - - - -
westus
westus3 -

Poznámka:

o1-mini je aktuálně k dispozici pro všechny zákazníky pro globální standardní nasazení.

Vybraným zákazníkům byl udělen standardní (regionální) přístup k nasazení o1-mini jako součást omezeného přístupu o1-preview. V současné době se nerozšiřuje přístup ke standardním o1-mini (regionálním) nasazením.

Dostupnost modelu GPT-4 a GPT-4 Turbo

Vyberte přístup zákazníka

Kromě výše uvedených oblastí, které jsou dostupné všem zákazníkům Azure OpenAI, byly některým vybraným stávajícím zákazníkům udělen přístup k verzím GPT-4 v dalších oblastech:

Vzor Región
gpt-4 (0314)
gpt-4-32k (0314)
USA – východ
Francie – střed
Středojižní USA
Velká Británie – jih
gpt-4 (0613)
gpt-4-32k (0613)
USA – východ
Východní USA 2
Japonsko – východ
Velká Británie – jih

Modely GPT-3.5

Podívejte se na verze modelu, kde se dozvíte, jak Azure OpenAI zpracovává upgrady verzí modelu, a na práci s modely, kde zjistíte, jak zobrazit a nakonfigurovat nastavení verzí modelu ve vašich nasazeních GPT-3.5 Turbo.

Jemné ladění modelů

Poznámka:

gpt-35-turbo – Vyladění tohoto modelu je omezené na podmnožinu oblastí a není k dispozici v každé oblasti, ve které je základní model k dispozici.

Podporované oblasti pro vyladění se můžou lišit, pokud používáte modely Azure OpenAI v projektu Azure AI Foundry a ne mimo projekt.

ID modelu Standardní oblasti trénování Globální školení (Preview) Maximální počet požadavků (tokeny) Tréninková data (do) Modalita
gpt-35-turbo (1106) Východ USA 2
USA – středosever
Švédsko – střed
Švýcarsko – západ
- Vstup: 16 385
Výstup: 4 096
Zář 2021 Text k textu
gpt-35-turbo (0125) Východ USA 2
USA – středosever
Švédsko – střed
Švýcarsko – západ
- 16,385 Zář 2021 Text k textu
gpt-4o-mini (2024-07-18) USA – středosever
Švédsko – střed
- Vstup: 128 000
Výstup: 16 384
Délka kontextu příkladu trénování: 65 536
Říjen 2023 Text k textu
gpt-4o (2024-08-06) Východ USA 2
USA – středosever
Švédsko – střed
- Vstup: 128 000
Výstup: 16 384
Délka kontextu příkladu trénování: 65 536
Říjen 2023 Text &Vision to Text
gpt-4.1 (2025-04-14) USA – středosever
Švédsko – střed
Vstup: 128 000
Výstup: 16 384
Délka kontextu příkladu trénování: 65 536
Květen 2024 Text &Vision to Text
gpt-4.1-mini (2025-04-14) USA – středosever
Švédsko – střed
Vstup: 128 000
Výstup: 16 384
Délka kontextu příkladu trénování: 65 536
Květen 2024 Text k textu
gpt-4.1-nano (2025-04-14) USA – středosever
Švédsko – střed
- Vstup: 128 000
Výstup: 16 384
Délka kontextu příkladu trénování: 32 768
Květen 2024 Text k textu
o4-mini (2025-04-16) Východ USA 2
Švédsko – střed
- Vstup: 128 000
Výstup: 16 384
Délka kontextu příkladu trénování: 65 536
Květen 2024 Text k textu

Poznámka:

Globální trénování (ve verzi Public Preview) poskytuje cenově dostupné trénování podle tokenu, ale nenabízí rezidenci dat. Aktuálně je k dispozici pro prostředky Azure OpenAI v následujících oblastech, přičemž další oblasti budou brzy přidány.

  • Austrálie – východ
  • Brazílie – jih
  • Východní USA
  • Východní USA 2
  • Francie – střed
  • Německo – středozápad
  • Itálie – sever
  • Japonsko – východ (bez podpory zraku)
  • Jižní Korea – střed
  • Severní střed USA
  • Norsko – východ
  • Střední Polsko
  • Jihovýchodní Asie
  • Jihoafrická republika – sever
  • Jižní střed USA
  • Španělsko – střed
  • Švédsko – střed
  • Švýcarsko – západ
  • Švýcarsko – sever
  • Velká Británie – jih
  • Západní Evropa
  • Západní USA
  • Západ USA3

Asistenti (Náhled)

Pro asistenty potřebujete kombinaci podporovaného modelu a podporované oblasti. Některé nástroje a možnosti vyžadují nejnovější modely. Následující modely jsou k dispozici v rozhraní API asistentů, sadě SDK a Azure AI Foundry. Následující tabulka je určená pro standardní nasazení. Informace o dostupnosti zřízené jednotky propustnosti (PTU) najdete v tématu Zřízená propustnost. Uvedené modely a oblasti je možné použít s asistenty v1 i v2. Globální standardní modely můžete použít, pokud jsou podporované v následujících oblastech.

Oblast gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, turbo-2024-04-09 gpt-4-32k, 0613 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613
Austrálie - východ - - - - -
Eastus - - - -
eastus2 - - - -
franciecentral - - - - - -
japaneast - - - - - - - - -
Norsko – východ - - - - - - - - - - -
jižní Indie - - - - - - - - -
švédskocentral - -
uksouth - - - - - -
westus - - - - -
westus3 - - - - - -

Vyřazení modelu z provozu

Nejnovější informace o vyřazení modelu najdete v průvodci vyřazením modelu.

Další kroky