Poznámka
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Azure OpenAI využívá různorodou sadu modelů s různými možnostmi a cenovými body. Dostupnost modelu se liší podle oblastí a cloudu. Dostupnost modelu Azure Government najdete ve službě Azure Government OpenAI.
Modely | Popis |
---|---|
codex-mini | Jemně vyladěná verze o4-mini. |
Řada GPT-4.1 | Nejnovější vydání modelu od Azure OpenAI |
model-router | Model, který inteligentně vybírá ze sady podkladových modelů chatu, aby reagoval na danou výzvu. |
náhled použití počítače | Experimentální model vyvinutý pro použití s rozhraním API pro odpovědi. |
GPT-4.5 Preview | Nejnovější model GPT, který exceluje v různých textových a obrázkových úkolech. |
Modely o-series | Modely s pokročilými schopnostmi řešit problémy a se zvýšeným zaměřením a schopnostmi. |
GPT-4o & GPT-4o mini & GPT-4 Turbo | Nejnovější modely Azure OpenAI s vícemodálními verzemi, které můžou jako vstup přijímat text i obrázky. |
GPT-4 | Sada modelů, které zlepšují GPT-3.5 a můžou pochopit a generovat přirozený jazyk a kód. |
GPT-3.5 | Sada modelů, které zlepšují GPT-3 a můžou pochopit a generovat přirozený jazyk a kód. |
Vkládání | Sada modelů, které mohou převést text do číselné vektorové formy, aby se usnadnila podobnost textu. |
Generování obrázků | Řada modelů, které můžou generovat původní obrázky z přirozeného jazyka. |
Zvuk | Řada modelů pro převod řeči na text, překlad a převod textu na řeč. Zvukové modely GPT-4o podporují buď nízkou latenci pro konverzační interakce typu "řeč dovnitř, řeč ven", nebo generování zvuku. |
Řada GPT 4.1
Regionální dostupnost
Vzor | Región |
---|---|
gpt-4.1 (2025-04-14) |
Podívejte se na tabulku modelů. |
gpt-4.1-nano (2025-04-14) |
Podívejte se na tabulku modelů. |
gpt-4.1-mini (2025-04-14) |
Podívejte se na tabulku modelů. |
Schopnosti
ID modelu | Popis | Kontextové okno | Maximální počet výstupních tokenů | Tréninková data (do) |
---|---|---|---|---|
gpt-4.1 (2025-04-14) |
- Text a obrazový vstup - Výstup textu - API pro doplnění chatu - Odezvy API - Streamování - Volání funkcí Strukturované výstupy (dokončení chatu) |
- 1,047,576 – 128 000 (zřízené spravované nasazení) – 300 000 (dávkové nasazení) |
32,768 | 31. května 2024 |
gpt-4.1-nano (2025-04-14) |
- Text a obrazový vstup - Výstup textu - API pro doplnění chatu - Odezvy API - Streamování - Volání funkcí Strukturované výstupy (dokončení chatu) |
- 1,047,576 – 128 000 (zřízené spravované nasazení) – 300 000 (dávkové nasazení) |
32,768 | 31. května 2024 |
gpt-4.1-mini (2025-04-14) |
- Text a obrazový vstup - Výstup textu - API pro doplnění chatu - Odezvy API - Streamování - Volání funkcí Strukturované výstupy (dokončení chatu) |
- 1,047,576 – 128 000 (zřízené spravované nasazení) – 300 000 (dávkové nasazení) |
32,768 | 31. května 2024 |
modelový router
Model, který inteligentně vybírá ze sady podkladových modelů chatu, aby reagoval na danou výzvu.
Regionální dostupnost
Vzor | Región |
---|---|
model-router (2025-05-19) |
USA – východ 2 (globální standard), Švédsko – střed (globální standard) |
Schopnosti
ID modelu | Popis | Kontextové okno | Maximální počet výstupních tokenů | Tréninková data (do) |
---|---|---|---|---|
model-router (2025-05-19) |
Model, který inteligentně vybírá ze sady podkladových modelů chatu, aby reagoval na danou výzvu. | 200,000* | 32768 (ŘADA GPT 4.1) 100 K (o4-mini) |
31. května 2024 |
*Větší kontextová okna jsou kompatibilní s některými podkladovými modely, což znamená, že volání rozhraní API s větším kontextem bude úspěšné pouze v případě, že se výzva přesměruje do správného modelu, jinak volání selže.
náhled použití počítače
Experimentální model vycvičený pro použití s nástrojem Responses API pro počítače. Dá se použít ve spojení s knihovnami třetích stran, aby model mohl řídit vstup myši a klávesnice při získávání kontextu ze snímků obrazovky aktuálního prostředí.
Upozornění
Nedoporučujeme používat modely Preview v produkčním prostředí. Upgradujeme všechna nasazení modelů Preview na budoucí verze Preview nebo na nejnovější stabilní verzi GA. Modely, které jsou určené ve verzi Preview, nedodržují standardní životní cyklus modelu Azure OpenAI.
Dostupnost
Pro přístup k computer-use-preview
registraci se vyžaduje a přístup se udělí na základě kritérií způsobilosti microsoftu. Zákazníci, kteří mají přístup k jiným modelům omezeného přístupu, budou muset požádat o přístup k tomuto modelu.
Žádost o přístup: computer-use-preview
žádost o model omezeného přístupu
Po udělení přístupu budete muset pro model vytvořit nasazení.
Regionální dostupnost
Vzor | Región |
---|---|
computer-use-preview |
Podívejte se na tabulku modelů. |
Schopnosti
ID modelu | Popis | Kontextové okno | Maximální počet výstupních tokenů | Tréninková data (do) |
---|---|---|---|---|
computer-use-preview (2025-03-11) |
Specializovaný model pro použití s počítačem s rozhraním API pro odpovědi -Nářadí -Streamování -Text(vstup/výstup) - Obraz(vstup) |
8,192 | 1,024 | Říjen 2023 |
GPT-4.5 Preview
Regionální dostupnost
Vzor | Región |
---|---|
gpt-4.5-preview |
Podívejte se na tabulku modelů. |
Schopnosti
ID modelu | Popis | Kontextové okno | Maximální počet výstupních tokenů | Tréninková data (do) |
---|---|---|---|---|
gpt-4.5-preview (2025-02-27) GPT-4.5 Preview |
GPT 4.1 je doporučená náhrada tohoto modelu. Vyniká v různorodých úkolech s texty a obrázky. - Strukturované výstupy – Zobrazení výzvy k ukládání do mezipaměti -Nářadí -Streamování - Text(vstup/výstup) - Obraz(vstup) |
128,000 | 16,384 | Říjen 2023 |
Poznámka:
Očekávané chování je, že model nedokáže odpovědět na otázky týkající se sebe sama. Pokud chcete vědět, kdy je limit znalostí pro trénovací data modelu, nebo další podrobnosti o modelu, můžete se obrátit na výše uvedenou dokumentaci modelu.
modely řady o-series
Modely řady Azure OpenAI o* jsou speciálně navržené tak, aby řešily logické úvahy a problémové úlohy s větším zaměřením a schopnostmi. Tyto modely tráví více času zpracováním a porozuměním požadavku uživatele, což je mimořádně silné v oblastech, jako jsou věda, kódování a matematika v porovnání s předchozími iteracemi.
ID modelu | Popis | Maximální počet žádostí (tokeny) | Tréninková data (do) |
---|---|---|---|
codex-mini (2025-05-16) |
Jemně vyladěná verze o4-mini. - Rozhraní API pro odpovědi - Strukturované výstupy - Zpracování textu, obrázku – Funkce/nástroje Úplný souhrn možností |
Input: 200 000 Výstup: 100 000 |
31. května 2024 |
o3-pro (2025-06-10) |
-
Rozhraní API pro odpovědi - Strukturované výstupy - Zpracování textu, obrázku – Funkce/nástroje Úplný souhrn možností |
Input: 200 000 Výstup: 100 000 |
31. května 2024 |
o4-mini (2025-04-16) |
-
NOVÝ model zdůvodnění, který nabízí vylepšené možnosti zdůvodnění. – Rozhraní API pro dokončení chatu - Rozhraní API pro odpovědi - Strukturované výstupy - Zpracování textu, obrázku – Funkce/nástroje Úplný souhrn možností |
Input: 200 000 Výstup: 100 000 |
31. května 2024 |
o3 (2025-04-16) |
-
NOVÝ model zdůvodnění, který nabízí vylepšené možnosti zdůvodnění. – Rozhraní API pro dokončení chatu - Rozhraní API pro odpovědi - Strukturované výstupy - Zpracování textu, obrázku – Funkce/ Nástroje / Paralelní volání nástrojů Úplný souhrn možností |
Input: 200 000 Výstup: 100 000 |
31. května 2024 |
o3-mini (2025-01-31) |
-
Vylepšené možnosti odůvodnění. - Strukturované výstupy - Zpracování pouze textu – Funkce/nástroje |
Input: 200 000 Výstup: 100 000 |
Říjen 2023 |
o1 (2024-12-17) |
-
Vylepšené možnosti odůvodnění. - Strukturované výstupy - Zpracování textu, obrázku – Funkce/nástroje |
Input: 200 000 Výstup: 100 000 |
Říjen 2023 |
o1-preview (2024-09-12) |
Starší verze Preview | Vstup: 128 000 Výstup: 32 768 |
Říjen 2023 |
o1-mini (2024-09-12) |
Rychlejší a nákladově efektivnější možnost v řadě o1, která je ideální pro psaní úkolů vyžadujících rychlost a nižší spotřebu prostředků. Ve výchozím nastavení je k dispozici globální standardní nasazení. Standardní (regionální) nasazení jsou v současnosti dostupná pouze pro vybrané zákazníky, kteří získali přístup jako součást o1-preview vydání s omezeným přístupem. |
Vstup: 128 000 Výstup: 65 536 |
Říjen 2023 |
Dostupnost
Další informace o pokročilých o-series
modelech najdete v začátcích s modely zdůvodnění.
Regionální dostupnost
Vzor | Región |
---|---|
codex-mini |
USA – východ 2 a Švédsko – střed (globální standard) |
o3-pro |
USA – východ 2 a Švédsko – střed (globální standard) |
o4-mini |
Podívejte se na tabulku modelů. |
o3 |
Podívejte se na tabulku modelů. |
o3-mini |
Podívejte se na tabulku modelů. |
o1 |
Podívejte se na tabulku modelů. |
o1-preview |
Podívejte se na tabulku modelů. Tento model je k dispozici pouze pro zákazníky, kteří měli udělený přístup jako součást původního omezeného přístupu. |
o1-mini |
Podívejte se na tabulku modelů. |
GPT-4o a GPT-4 Turbo
GPT-4o integruje text a obrázky v jednom modelu a umožňuje zpracovávat více datových typů současně. Tento multimodální přístup zlepšuje přesnost a rychlost odezvy v interakcích lidského počítače. GPT-4o odpovídá GPT-4 Turbo v anglických textových a programovacích úlohách a zároveň nabízí vynikající výkon v neanglických jazycích a vizuálních úkolech, čímž stanovuje nové standardy pro schopnosti AI.
Jak se dostanu k modelům GPT-4o a GPT-4o mini?
GPT-4o a GPT-4o mini jsou k dispozici pro standardní a globální nasazení modelu.
Potřebujete vytvořit nebo použít existující prostředek v podporované standardní nebo globální standardní oblasti, ve které je model dostupný.
Jakmile je váš prostředek vytvořen, můžete nasadit modely GPT-4o. Pokud provádíte programové nasazení, názvy modelů jsou:
-
gpt-4o
Verze2024-11-20
-
gpt-4o
Verze2024-08-06
-
gpt-4o
Verze2024-05-13
-
gpt-4o-mini
Verze2024-07-18
GPT-4 Turbo
GPT-4 Turbo je velký multimodální model (přijímá textové nebo obrazové vstupy a generuje text), který dokáže řešit obtížné problémy s větší přesností než kterýkoli z předchozích modelů OpenAI. Stejně jako GPT-3.5 Turbo a starší modely GPT-4 je GPT-4 Turbo optimalizovaný pro chat a funguje dobře pro tradiční úlohy dokončování.
GPT-4
GPT-4 je předchůdcem GPT-4 Turbo. Oba modely GPT-4 a GPT-4 Turbo mají základní jméno modelu gpt-4
. Modely GPT-4 a Turbo můžete rozlišit prozkoumáním verze modelu.
-
gpt-4
Verze0314
-
gpt-4
Verze0613
-
gpt-4-32k
Verze0613
V souhrnné tabulce modelu můžete zobrazit délku kontextu tokenu podporovanou každým modelem.
Modely GPT-4 a GPT-4 Turbo
- Tyto modely lze použít pouze s rozhraním API pro dokončování chatu.
Podívejte se na verze modelů a zjistěte, jak Azure OpenAI zpracovává upgrady verzí modelu a jak pracovat s modely , abyste zjistili, jak zobrazit a nakonfigurovat nastavení verzí modelu nasazení GPT-4.
ID modelu | Popis | Maximální počet žádostí (tokeny) | Tréninková data (do) |
---|---|---|---|
gpt-4o (2024-11-20) GPT-4o (Omni) |
Nejnovější velký model GA - Strukturované výstupy - Zpracování textu, obrázku – Režim JSON – paralelní volání funkcí - Vyšší přesnost a rychlost odezvy - Parita s anglickým textem a kódovacími úkoly ve srovnání s GPT-4 Turbo s Vize - Vynikající výkon v neanglických jazycích a v úkolech souvisejících se zrakem. - Vylepšená schopnost kreativního psaní |
Vstup: 128 000 Výstup: 16 384 |
Říjen 2023 |
gpt-4o (2024-08-06) GPT-4o (Omni) |
- Strukturované výstupy - Zpracování textu, obrázku – Režim JSON – paralelní volání funkcí - Vyšší přesnost a rychlost odezvy - Parita s anglickým textem a kódovacími úkoly ve srovnání s GPT-4 Turbo s Vize - Vynikající výkon v neanglických jazycích a v úlohách zpracování obrazu |
Vstup: 128 000 Výstup: 16 384 |
Říjen 2023 |
gpt-4o-mini (2024-07-18) GPT-4o mini |
Nejnovější malý model GA - Rychlý, levný a schopný model ideální pro nahrazení modelů SÉRIE GPT-3.5 Turbo. - Zpracování textu, obrázku – Režim JSON - paralelní volání funkcí |
Vstup: 128 000 Výstup: 16 384 |
Říjen 2023 |
gpt-4o (2024-05-13) GPT-4o (Omni) |
Zpracování textu, obrázku – Režim JSON – paralelní volání funkcí - Vyšší přesnost a rychlost odezvy - Parita s anglickým textem a kódovacími úkoly ve srovnání s GPT-4 Turbo s Vize - Vynikající výkon v neanglických jazycích a v úlohách zpracování obrazu |
Vstup: 128 000 Výstup: 4 096 |
Říjen 2023 |
gpt-4 (turbo-2024-04-09) GPT-4 Turbo s viděním |
Nový model GA - Náhrada za všechny předchozí modely GPT-4 Preview ( vision-preview , 1106-Preview , 0125-Preview ). - Dostupnost funkcí se v současné době liší v závislosti na metodě vstupu a typu nasazení. |
Vstup: 128 000 Výstup: 4 096 |
Prosinec 2023 |
gpt-4-32k (0613) |
Starší model GA - Základní volání funkcí pomocí nástrojů |
32,768 | Zář 2021 |
gpt-4 (0613) |
Starší model GA - Základní volání funkcí pomocí nástrojů |
8,192 | Zář 2021 |
gpt-4-32k (0314) |
Starší model GA - Informace o důchodu |
32,768 | Zář 2021 |
gpt-4 (0314) |
Starší model GA - Informace o důchodu |
8,192 | Zář 2021 |
Upozornění
Nedoporučujeme používat modely Preview v produkčním prostředí. Upgradujeme všechna nasazení modelů Preview na budoucí verze Preview nebo na nejnovější stabilní verzi GA. Modely, které jsou určené ve verzi Preview, nedodržují standardní životní cyklus modelu Azure OpenAI.
GPT-3.5
Modely GPT-3.5 můžou pochopit a generovat přirozený jazyk nebo kód. Nejschopnější a nákladově efektivní model v rodině GPT-3.5 je GPT-3.5 Turbo, který je optimalizovaný pro chat a funguje dobře i pro tradiční úkoly dokončení. GPT-3.5 Turbo je k dispozici pro použití s rozhraním API pro dokončování chatu. GPT-3.5 Turbo Instruct má podobné schopnosti jako text-davinci-003
při použití Completions API místo Chat Completions API. Doporučujeme používat GPT-3.5 Turbo a GPT-3.5 Turbo Pokyny pro starší modely GPT-3.5 a GPT-3.
ID modelu | Popis | Maximální počet žádostí (tokeny) | Tréninková data (do) |
---|---|---|---|
gpt-35-turbo (0125) NOVÝ |
Nejnovější model GA – Režim JSON – paralelní volání funkcí - reprodukovatelný výstup (náhled) - Vyšší přesnost při odpovídání v požadovaných formátech. - Oprava chyby, která způsobila problém s kódováním textu pro volání jiných než anglické jazykové funkce. |
Vstup: 16 385 Výstup: 4 096 |
Zář 2021 |
gpt-35-turbo (1106) |
Starší model GA – Režim JSON – paralelní volání funkcí - reprodukovatelný výstup (náhled) |
Vstup: 16 385 Výstup: 4 096 |
Zář 2021 |
gpt-35-turbo-instruct (0914) |
Pouze koncový bod dokončení - Nahrazení modelů starších dokončení |
4,097 | Zář 2021 |
Další informace o interakci s rozhraním GPT-3.5 Turbo a rozhraním API pro dokončování chatu najdete v našich podrobných návodech.
1 Tento model přijme požadavky > 4 096 tokenů. Nedoporučuje se překročit limit vstupního tokenu 4 096, protože novější verze modelu je omezena na 4 096 tokenů. Pokud při překročení 4 096 vstupních tokenů s tímto modelem narazíte na problémy, tato konfigurace se oficiálně nepodporuje.
Vnoření
text-embedding-3-large
je nejnovější a nejschopnější model vkládání. Upgrade mezi modely vkládání není možný. Aby bylo možné přejít z použití text-embedding-ada-002
na text-embedding-3-large
, budete muset vygenerovat nové vkládání.
text-embedding-3-large
text-embedding-3-small
text-embedding-ada-002
Při testování OpenAI uvádí, že jak velké, tak malé modely zapouzdření třetí generace nabízejí lepší průměrný výkon při vyhledávání v různých jazycích pomocí srovnávacího testu MIRACL, přičemž stále udržují výkon pro anglické úlohy při použití srovnávacího testu MTEB.
Referenční hodnota hodnocení | text-embedding-ada-002 |
text-embedding-3-small |
text-embedding-3-large |
---|---|---|---|
Průměr MIRACL | 31,4 | 44.0 | 54.9 |
Průměr MTEB | 61.0 | 62.3 | 64.6 |
Modely vkládání třetí generace podporují zmenšení velikosti vkládání pomocí nového dimensions
parametru. Větší vkládání jsou obvykle dražší z hlediska výpočetních prostředků, paměti a úložiště. Možnost upravit počet dimenzí umožňuje větší kontrolu nad celkovými náklady a výkonem. Parametr dimensions
není podporován ve všech verzích knihovny OpenAI 1.x Python, abyste mohli využít výhod tohoto parametru, doporučujeme upgradovat na nejnovější verzi: pip install openai --upgrade
Testování benchmarku MTEB od OpenAI zjistilo, že i když jsou rozměry modelu třetí generace zmenšeny na méně než text-embeddings-ada-002
1 536 dimenzí, výkon zůstává mírně lepší.
Modely generování obrázků
Modely generování obrázků generují obrázky z textových výzev, které uživatel poskytuje. GPT-image-1 je ve verzi Public Preview s omezeným přístupem. DALL-E 3 je obecně k dispozici pro použití s rozhraními REST API. DALL-E 2 a DALL-E 3 s klientskými sadami SDK jsou ve verzi Preview.
Dostupnost
Pro přístup k gpt-image-1
registraci se vyžaduje a přístup se udělí na základě kritérií způsobilosti microsoftu. Zákazníci, kteří mají přístup k jiným modelům omezeného přístupu, budou muset požádat o přístup k tomuto modelu.
Žádost o přístup: gpt-image-1
žádost o model omezeného přístupu
Po udělení přístupu budete muset pro model vytvořit nasazení.
Regionální dostupnost
Vzor | Región |
---|---|
dall-e-3 |
Východní USA Austrálie – východ Švédsko – střed |
gpt-image-1 |
Západní USA 3 (Globální standard) Spojené arabské emiráty – sever (globální standard) |
Modely generování videa
Sora je model AI z OpenAI, který dokáže vytvářet realistické a imaginativní video scény z textových instrukcí. Sora je ve veřejné ukázce.
Regionální dostupnost
Vzor | Región |
---|---|
sora |
Východní USA 2 |
Zvukové modely
Zvukové modely v Azure OpenAI jsou k dispozici prostřednictvím rozhraní API realtime
, completions
a audio
.
Zvukové modely GPT-4o
Zvukové modely GPT 4o jsou součástí řady modelů GPT-4o a podporují buď nízkou latenci pro "řeč dovnitř, řeč ven" konverzační interakce, nebo generování zvuku.
Upozornění
Nedoporučujeme používat modely Preview v produkčním prostředí. Upgradujeme všechna nasazení modelů Preview na budoucí verze Preview nebo na nejnovější stabilní verzi GA. Modely, které jsou určené ve verzi Preview, nedodržují standardní životní cyklus modelu Azure OpenAI.
Podrobnosti o maximálních tokenech žádostí a trénovacích datech jsou k dispozici v následující tabulce.
ID modelu | Popis | Maximální počet žádostí (tokeny) | Tréninková data (do) |
---|---|---|---|
gpt-4o-mini-audio-preview (2024-12-17) GPT-4o audio |
Zvukový model pro generování zvuku a textu | Vstup: 128 000 Výstup: 4 096 |
Říjen 2023 |
gpt-4o-mini-realtime-preview (2024-12-17) GPT-4o audio |
Zvukový model pro zpracování zvuku v reálném čase. | Vstup: 128 000 Výstup: 4 096 |
Říjen 2023 |
gpt-4o-audio-preview (2024-12-17) GPT-4o audio |
Zvukový model pro generování zvuku a textu | Vstup: 128 000 Výstup: 4 096 |
Říjen 2023 |
gpt-4o-realtime-preview (2024-12-17) GPT-4o audio |
Zvukový model pro zpracování zvuku v reálném čase. | Vstup: 128 000 Výstup: 4 096 |
Říjen 2023 |
gpt-4o-mini-realtime-preview (2024-12-17) GPT-4o audio |
Zvukový model pro zpracování zvuku v reálném čase. | Vstup: 128 000 Výstup: 4 096 |
Říjen 2023 |
Pokud chcete porovnat dostupnost zvukových modelů GPT-4o ve všech oblastech, podívejte se na tabulku modelů.
Zvukové rozhraní API
Zvukové modely prostřednictvím /audio
rozhraní API lze použít pro převod řeči na text, překlad a převod textu na řeč.
Převod řeči na textové modely
ID modelu | Popis | Maximální počet požadavků (velikost zvukového souboru) |
---|---|---|
whisper |
Model rozpoznávání řeči pro obecné účely | 25 MB |
gpt-4o-transcribe |
Převod řeči na text s využitím GPT-4o | 25 MB |
gpt-4o-mini-transcribe |
Převod řeči na text s využitím GPT-4o mini. | 25 MB |
Modely překladu řeči
ID modelu | Popis | Maximální počet požadavků (velikost zvukového souboru) |
---|---|---|
whisper |
Model rozpoznávání řeči pro obecné účely | 25 MB |
Modely převodu textu na řeč (Preview)
ID modelu | Popis |
---|---|
tts |
Převod textu na řeč optimalizovaný pro rychlost |
tts-hd |
Převod textu na řeč optimalizovaný pro vysokou kvalitu. |
gpt-4o-mini-tts |
Model převodu textu na řeč s využitím GPT-4o mini. Můžete vést hlas tak, aby mluvil v určitém stylu nebo tónu. |
Další informace naleznete v tomto článku v části Dostupnost oblastí zvukových modelů.
Souhrnná tabulka modelů a dostupnost oblastí
Modely podle typu nasazení
Azure OpenAI poskytuje zákazníkům volby ve struktuře hostování, která odpovídá jejich obchodním vzorům a vzorům využití. Služba nabízí dva hlavní typy nasazení:
- Standard se nabízí s možností globálního nasazení a směrováním provozu globálně za účelem zajištění vyšší propustnosti.
- Zřízené je také nabízeno s možností globálního nasazování, která zákazníkům umožňuje nakupovat a nasazovat zřízené jednotky prostupnosti napříč globální infrastrukturou Azure.
Všechna nasazení mohou provádět shodné predikční operace, avšak fakturace, škálování a výkon se výrazně liší. Další informace o typech nasazení Azure OpenAI najdete v průvodci typy nasazení.
- Global Standard
- Globální spravované prostředí
- Global Batch
- Standard datové zóny
- Přidělená spravovaná zóna dat
- Dávka pro datovou zónu
- Standard
- Zřízená spravovaná
Globální standardní dostupnost modelu
Oblast | o3-pro, 2025-06-10 | codex-mini, 2025-05-16 | model-router, 2025-05-19 | o3, 2025-04-16 | o4-mini, 2025-04-16 | gpt-image-1, 2025-04-15 | gpt-4.1, 2025-04-14 | gpt-4.1-nano, 2025-04-14 | gpt-4.1-mini, 2025-04-14 | náhled použití počítače, 11.03.2025 | gpt-4.5-preview, 2025-02-27 | o3-mini, 2025-01-31 | o1, 2024-12-17 | o1-preview, 2024-09-12 | o1-mini, 2024-09-12 | gpt-4o, 2024-05-13 | gpt-4o, 2024-08-06 | gpt-4o, 2024-11-20 | gpt-4o-mini, 2024-07-18 | gpt-4, turbo-2024-04-09 | text-embedding-3-small, 1 | text-embedding-3-large, 1 | text-embedding-ada-002, 2 | gpt-4o-realtime-preview, 2024-12-17 | gpt-4o-audio-preview, 2024-12-17 | gpt-4o-mini-realtime-preview, 2024-12-17 | gpt-4o-mini-audio-preview, 2024-12-17 | gpt-4o-transcribe, 2025-03-20 | gpt-4o-mini-tts, 2025-03-20 | gpt-4o-mini-přepis, 2025-03-20 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Austrálie - východ | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
brazilsouth (jižní Brazílie) | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
východní Kanada | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Eastus | - | - | - | - | - | - | ✅ | - | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | ✅ | - | - | - |
eastus2 | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
franciecentral | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Německo – středozápad | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
itálie sever | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
japaneast | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Korea Central | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Northcentralus | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Norsko – východ | - | - | - | - | - | - | ✅ | - | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
polskocentral | - | - | - | - | - | - | ✅ | - | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Jižní Afrika – sever | - | - | - | - | - | - | ✅ | - | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
southcentralus | - | - | - | - | - | - | ✅ | - | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
jižní Indie | - | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
španělskocentral | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
švédskocentral | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | ✅ |
Švýcarsko – sever | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
spojené arabské emiráty | - | - | - | - | - | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
uksouth | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
západní evropa | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
westus | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
westus3 | - | - | - | - | - | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Poznámka:
o1-mini
je aktuálně k dispozici pro všechny zákazníky pro globální standardní nasazení.
Vybraným zákazníkům byl udělen standardní (regionální) přístup k nasazení o1-mini
jako součást omezeného přístupu o1-preview
. V současné době se nerozšiřuje přístup ke standardním o1-mini
(regionálním) nasazením.
Tato tabulka neobsahuje podrobné informace o dostupnosti v jednotlivých oblastech. Informace najdete v části o dolaďování.
Standardní modely nasazení (regionální) podle koncového bodu
Dokončení chatu
Oblast | o1-preview, 2024-09-12 | o1-mini, 2024-09-12 | gpt-4o, 2024-05-13 | gpt-4o, 2024-11-20 | gpt-4o, 2024-08-06 | gpt-4o-mini, 2024-07-18 | gpt-4, turbo-2024-04-09 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 |
---|---|---|---|---|---|---|---|---|---|
Austrálie - východ | - | - | - | ✅ | - | - | - | ✅ | ✅ |
východní Kanada | - | - | - | ✅ | - | - | - | ✅ | ✅ |
Eastus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
eastus2 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
franciecentral | - | - | - | ✅ | - | - | - | ✅ | ✅ |
japaneast | - | - | - | ✅ | - | - | - | - | ✅ |
Northcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
Norsko – východ | - | - | - | ✅ | - | - | - | - | - |
southcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
jižní Indie | - | - | - | ✅ | - | - | - | ✅ | ✅ |
švédskocentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
Švýcarsko – sever | - | - | - | ✅ | - | - | - | - | ✅ |
uksouth | - | - | - | ✅ | - | - | - | ✅ | ✅ |
západní evropa | - | - | - | - | - | - | - | - | ✅ |
westus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
westus3 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
Poznámka:
o1-mini
je aktuálně k dispozici pro všechny zákazníky pro globální standardní nasazení.
Vybraným zákazníkům byl udělen standardní (regionální) přístup k nasazení o1-mini
jako součást omezeného přístupu o1-preview
. V současné době se nerozšiřuje přístup ke standardním o1-mini
(regionálním) nasazením.
Dostupnost modelu GPT-4 a GPT-4 Turbo
Vyberte přístup zákazníka
Kromě výše uvedených oblastí, které jsou dostupné všem zákazníkům Azure OpenAI, byly některým vybraným stávajícím zákazníkům udělen přístup k verzím GPT-4 v dalších oblastech:
Vzor | Región |
---|---|
gpt-4 (0314) gpt-4-32k (0314) |
USA – východ Francie – střed Středojižní USA Velká Británie – jih |
gpt-4 (0613) gpt-4-32k (0613) |
USA – východ Východní USA 2 Japonsko – východ Velká Británie – jih |
Modely GPT-3.5
Podívejte se na verze modelu, kde se dozvíte, jak Azure OpenAI zpracovává upgrady verzí modelu, a na práci s modely, kde zjistíte, jak zobrazit a nakonfigurovat nastavení verzí modelu ve vašich nasazeních GPT-3.5 Turbo.
Jemné ladění modelů
Poznámka:
gpt-35-turbo
– Vyladění tohoto modelu je omezené na podmnožinu oblastí a není k dispozici v každé oblasti, ve které je základní model k dispozici.
Podporované oblasti pro vyladění se můžou lišit, pokud používáte modely Azure OpenAI v projektu Azure AI Foundry a ne mimo projekt.
ID modelu | Standardní oblasti trénování | Globální školení (Preview) | Maximální počet požadavků (tokeny) | Tréninková data (do) | Modalita |
---|---|---|---|---|---|
gpt-35-turbo (1106) |
Východ USA 2 USA – středosever Švédsko – střed Švýcarsko – západ |
- | Vstup: 16 385 Výstup: 4 096 |
Zář 2021 | Text k textu |
gpt-35-turbo (0125) |
Východ USA 2 USA – středosever Švédsko – střed Švýcarsko – západ |
- | 16,385 | Zář 2021 | Text k textu |
gpt-4o-mini (2024-07-18) |
USA – středosever Švédsko – střed |
- | Vstup: 128 000 Výstup: 16 384 Délka kontextu příkladu trénování: 65 536 |
Říjen 2023 | Text k textu |
gpt-4o (2024-08-06) |
Východ USA 2 USA – středosever Švédsko – střed |
- | Vstup: 128 000 Výstup: 16 384 Délka kontextu příkladu trénování: 65 536 |
Říjen 2023 | Text &Vision to Text |
gpt-4.1 (2025-04-14) |
USA – středosever Švédsko – střed |
✅ | Vstup: 128 000 Výstup: 16 384 Délka kontextu příkladu trénování: 65 536 |
Květen 2024 | Text &Vision to Text |
gpt-4.1-mini (2025-04-14) |
USA – středosever Švédsko – střed |
✅ | Vstup: 128 000 Výstup: 16 384 Délka kontextu příkladu trénování: 65 536 |
Květen 2024 | Text k textu |
gpt-4.1-nano (2025-04-14) |
USA – středosever Švédsko – střed |
- | Vstup: 128 000 Výstup: 16 384 Délka kontextu příkladu trénování: 32 768 |
Květen 2024 | Text k textu |
o4-mini (2025-04-16) |
Východ USA 2 Švédsko – střed |
- | Vstup: 128 000 Výstup: 16 384 Délka kontextu příkladu trénování: 65 536 |
Květen 2024 | Text k textu |
Poznámka:
Globální trénování (ve verzi Public Preview) poskytuje cenově dostupné trénování podle tokenu, ale nenabízí rezidenci dat. Aktuálně je k dispozici pro prostředky Azure OpenAI v následujících oblastech, přičemž další oblasti budou brzy přidány.
- Austrálie – východ
- Brazílie – jih
- Východní USA
- Východní USA 2
- Francie – střed
- Německo – středozápad
- Itálie – sever
- Japonsko – východ (bez podpory zraku)
- Jižní Korea – střed
- Severní střed USA
- Norsko – východ
- Střední Polsko
- Jihovýchodní Asie
- Jihoafrická republika – sever
- Jižní střed USA
- Španělsko – střed
- Švédsko – střed
- Švýcarsko – západ
- Švýcarsko – sever
- Velká Británie – jih
- Západní Evropa
- Západní USA
- Západ USA3
Asistenti (Náhled)
Pro asistenty potřebujete kombinaci podporovaného modelu a podporované oblasti. Některé nástroje a možnosti vyžadují nejnovější modely. Následující modely jsou k dispozici v rozhraní API asistentů, sadě SDK a Azure AI Foundry. Následující tabulka je určená pro standardní nasazení. Informace o dostupnosti zřízené jednotky propustnosti (PTU) najdete v tématu Zřízená propustnost. Uvedené modely a oblasti je možné použít s asistenty v1 i v2. Globální standardní modely můžete použít, pokud jsou podporované v následujících oblastech.
Oblast | gpt-4o, 2024-05-13 | gpt-4o, 2024-08-06 | gpt-4o-mini, 2024-07-18 | gpt-4, 0613 | gpt-4, 1106-Preview | gpt-4, 0125-Preview | gpt-4, turbo-2024-04-09 | gpt-4-32k, 0613 | gpt-35-turbo, 0613 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 | gpt-35-turbo-16k, 0613 |
---|---|---|---|---|---|---|---|---|---|---|---|---|
Austrálie - východ | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ |
Eastus | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | ✅ | - | ✅ | ✅ |
eastus2 | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | - | ✅ | - | ✅ | ✅ |
franciecentral | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | ✅ |
japaneast | - | - | - | - | - | - | - | - | ✅ | - | ✅ | ✅ |
Norsko – východ | - | - | - | - | ✅ | - | - | - | - | - | - | - |
jižní Indie | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | - |
švédskocentral | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | - | ✅ |
uksouth | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ |
westus | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | - | - | ✅ | ✅ | - |
westus3 | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | - | - | - | ✅ | - |
Vyřazení modelu z provozu
Nejnovější informace o vyřazení modelu najdete v průvodci vyřazením modelu.