Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Poznámka:
Tento dokument se týká portálu Microsoft Foundry (Classic).
🔄 Pokud používáte nový portál, přepněte na dokumentaci Microsoft Foundry (nová).
Poznámka:
Tento dokument se týká portálu Microsoft Foundry (nový).
Tento článek uvádí výběr modelů Microsoft Foundry prodaných přímo v Azure spolu s jejich možnostmi, typy nasazení a oblastmi dostupnosti, s výjimkou zastaralých a starších modelů. Seznam modelů Azure OpenAI podporovaných službou Foundry Agent Service najdete v tématu Modely podporované službou Agent Service.
Modely prodané přímo v Azure zahrnují všechny modely Azure OpenAI a konkrétní vybrané modely od hlavních poskytovatelů.
V závislosti na druhu projektu , který používáte v Microsoft Foundry, uvidíte jiný výběr modelů. Konkrétně pokud používáte projekt Foundry založený na prostředku Foundry, uvidíte modely, které jsou k dispozici pro standardní nasazení do zdroje Foundry. Případně pokud používáte projekt založený na centru hostovaný centrem Foundry, uvidíte modely, které jsou k dispozici pro nasazení pro spravovaná výpočetní a bezserverová rozhraní API. Tyto výběry modelu se často překrývají, protože mnoho modelů podporuje více možností nasazení.
Modely Foundry jsou k dispozici pro standardní implementaci na zdroj Foundry.
Další informace o atributech modelů Foundry prodaných přímo v Azure najdete v tématu Prozkoumání modelů Foundry.
Poznámka:
Modely Foundry prodané přímo v Azure zahrnují také vybrané modely od následujících hlavních poskytovatelů modelů:
- Black Forest Labs:
FLUX.1-Kontext-pro,FLUX-1.1-pro - Cohere:
Cohere-command-a,embed-v-4-0 - DeepSeek:
DeepSeek-V3.1,DeepSeek-V3-0324,DeepSeek-R1-0528,DeepSeek-R1 - Meta:
Llama-4-Maverick-17B-128E-Instruct-FP8,Llama-3.3-70B-Instruct - Microsoft:
MAI-DS-R1,model-router - Mistral:
mistral-document-ai-2505,Mistral-Large-3 - xAI:
grok-code-fast-1,grok-3,grok-3-mini,grok-4-fast-reasoning,grok-4-fast-non-reasoninggrok-4
Další informace o těchto modelech najdete v horní části tohoto článku v části Další kolekce modelů .
Azure OpenAI v modelech Microsoft Foundry
Azure OpenAI využívá různorodou sadu modelů s různými možnostmi a cenovými body. Dostupnost modelu se liší podle oblastí a cloudu. Dostupnost modelu Azure Government najdete v tématu Azure OpenAI ve službě Azure Government.
| Models | Description |
|---|---|
| Řada GPT-5.1 |
NOVÝgpt-5.1, gpt-5.1-chat, gpt-5.1-codexgpt-5.1-codex-mini |
| Sora | NOVÝ sora-2 |
| Řada GPT-5 | gpt-5, gpt-5-mini, gpt-5-nano, gpt-5-chat |
| gpt-oss | modely s otevřenými váhami |
| codex-mini | Jemně vyladěná verze o4-mini. |
| Řada GPT-4.1 | gpt-4.1, gpt-4.1-mini, gpt-4.1-nano |
| computer-use-preview | Experimentální model vyvinutý pro použití s rozhraním API pro odpovědi. |
| Modely O-series | Modely uvažování s pokročilým řešením problémů, větším zaměřením a schopností. |
| GPT-4o, GPT-4o mini a GPT-4 Turbo | Modely Azure OpenAI s vícemodálními verzemi, které můžou jako vstup přijímat text i obrázky. |
| GPT-4 | Sada modelů, které zlepšují GPT-3.5 a můžou pochopit a generovat přirozený jazyk a kód. |
| GPT-3.5 | Sada modelů, které zlepšují GPT-3 a můžou pochopit a generovat přirozený jazyk a kód. |
| Embeddings | Sada modelů, které mohou převést text do číselné vektorové formy, aby se usnadnila podobnost textu. |
| Generování obrázků | Řada modelů, které můžou generovat původní obrázky z přirozeného jazyka. |
Video generation |
Model, který může generovat původní video scény z textových instrukcí. |
| Zvuk | Řada modelů pro převod řeči na text, překlad a převod textu na řeč. Zvukové modely GPT-4o podporují buď konverzační interakce s řečí s nízkou latencí (vstup řeči, výstup řeči), nebo generování zvuku. |
GPT-5.1
Dostupnost v regionu
| Model | Región |
|---|---|
gpt-5.1 |
USA – východ 2 a Švédsko – střed (Global Standard & DataZone Standard) |
gpt-5.1-chat |
USA – východ 2 a Švédsko – střed (globální standard) |
gpt-5.1-codex |
USA – východ 2 a Švédsko – střed (globální standard) |
gpt-5.1-codex-mini |
USA – východ 2 a Švédsko – střed (globální standard) |
Přístup bude udělen na základě kritérií způsobilosti Microsoftu. Zákazníci, kteří dříve zažádali a získali přístup k modelu omezeného přístupu, nemusí žádat znovu, protože jejich schválená předplatná budou při vydání modelu automaticky poskytnut přístup.
| ID modelu | Description | Kontextové okno | Maximální počet výstupních tokenů | Trénovací data (až do) |
|---|---|---|---|---|
gpt-5.1 (2025-11-13) |
-
Usuzování – Rozhraní API pro dokončování chatů - Rozhraní API pro odpovědi - Strukturované výstupy. - Zpracování textu a obrázku. – Funkce, nástroje a paralelní volání nástrojů. - Úplný souhrn možností |
400 000 Vstup: 272 000 Výstup: 128 000 |
128,000 | 30. září 2024 |
gpt-5.1-chat (2025-11-13) |
-
Usuzování – Rozhraní API pro dokončování chatů - Rozhraní API pro odpovědi - Strukturované výstupy – Funkce, nástroje a paralelní volání nástrojů. |
128,000 Vstup: 111 616 Výstup: 16 384 |
16,384 | 30. září 2024 |
gpt-5.1-codex (2025-11-13) |
- Pouze API pro odpovědi - Zpracování textu a obrázku - Strukturované výstupy. – Funkce, nástroje a paralelní volání nástrojů. - Úplný souhrn možností - Optimalizované pro rozšíření Codex CLI a Codex VS Code |
400 000 Vstup: 272 000 Výstup: 128 000 |
128,000 | 30. září 2024 |
gpt-5.1-codex-mini (2025-11-13) |
- Pouze API pro odpovědi - Zpracování textu a obrázku - Strukturované výstupy. - Zpracování textu a obrázku. – Funkce, nástroje a paralelní volání nástrojů. - Úplný souhrn možností - Optimalizované pro rozšíření Codex CLI a Codex VS Code |
400 000 Vstup: 272 000 Výstup: 128 000 |
128,000 | 30. září 2024 |
Důležité
gpt-5.1reasoning_effortse nastaví na výchozínone. Při upgradu z předchozích modelů odůvodnění nagpt-5.1mějte na paměti, že možná budete muset aktualizovat svůj kód, aby explicitně předával úroveňreasoning_effort, pokud chcete, aby odůvodnění proběhlo.gpt-5.1-chatpřidá integrované možnosti odůvodnění. Stejně jako jiné modely odůvodnění nepodporuje parametry jakotemperature. Pokud upgradujete z použitígpt-5-chat(což není argumentační model) nagpt-5.1-chat, ujistěte se, že jste z kódu odebrali všechny vlastní parametry jakotemperature, které nejsou podporovány argumentačními modely.
GPT-5
Dostupnost v regionu
| Model | Región |
|---|---|
gpt-5 (2025-08-07) |
Podívejte se na tabulku modelů. |
gpt-5-mini (2025-08-07) |
Podívejte se na tabulku modelů. |
gpt-5-nano (2025-08-07) |
Podívejte se na tabulku modelů. |
gpt-5-chat (2025-08-07) |
Podívejte se na tabulku modelů. |
gpt-5-chat (2025-10-03) |
USA – východ 2 (globální standard) a Švédsko – střed (globální standard) |
gpt-5-codex (2025-09-11) |
USA – východ 2 (globální standard) a Švédsko – střed (globální standard) |
gpt-5-pro (2025-10-06) |
USA – východ 2 (globální standard) a Švédsko – střed (globální standard) |
Registrace se vyžaduje pro přístup k modelům gpt-5-pro, gpt-5, &gpt-5-codex.
gpt-5-miniagpt-5-nanogpt-5-chatnevyžadují registraci.
Přístup bude udělen na základě kritérií způsobilosti Microsoftu. Zákazníci, kteří dříve použili a obdrželi přístup, o3nemusí znovu použít, protože jejich schválená předplatná budou po vydání modelu automaticky udělen přístup.
| ID modelu | Description | Kontextové okno | Maximální počet výstupních tokenů | Trénovací data (až do) |
|---|---|---|---|---|
gpt-5 (2025-08-07) |
-
Usuzování – Rozhraní API pro dokončování chatů - Rozhraní API pro odpovědi - Strukturované výstupy. - Zpracování textu a obrázku. – Funkce, nástroje a paralelní volání nástrojů. - Úplný souhrn možností |
400 000 Vstup: 272 000 Výstup: 128 000 |
128,000 | 30. září 2024 |
gpt-5-mini (2025-08-07) |
-
Usuzování – Rozhraní API pro dokončování chatů - Rozhraní API pro odpovědi - Strukturované výstupy. - Zpracování textu a obrázku. – Funkce, nástroje a paralelní volání nástrojů. - Úplný souhrn možností |
400 000 Vstup: 272 000 Výstup: 128 000 |
128,000 | 31. května 2024 |
gpt-5-nano (2025-08-07) |
-
Usuzování – Rozhraní API pro dokončování chatů - Rozhraní API pro odpovědi - Strukturované výstupy. - Zpracování textu a obrázku. – Funkce, nástroje a paralelní volání nástrojů. - Úplný souhrn možností |
400 000 Vstup: 272 000 Výstup: 128 000 |
128,000 | 31. května 2024 |
gpt-5-chat (2025-08-07)Preview |
– Rozhraní API pro dokončování chatů - Rozhraní API pro odpovědi - Vstup: Text/obrázek - Výstup: Pouze text |
128,000 | 16,384 | 30. září 2024 |
gpt-5-chat (2025-10-03)Náhled1 |
– Rozhraní API pro dokončování chatů - Rozhraní API pro odpovědi - Vstup: Text/obrázek - Výstup: Pouze text |
128,000 | 16,384 | 30. září 2024 |
gpt-5-codex (2025-09-11) |
- Pouze API pro odpovědi - Vstup: Text/obrázek - Výstup: Pouze text - Strukturované výstupy. - Zpracování textu a obrázku. – Funkce, nástroje a paralelní volání nástrojů. - Úplný souhrn možností - Optimalizované pro rozšíření Codex CLI a Codex VS Code |
400 000 Vstup: 272 000 Výstup: 128 000 |
128,000 | - |
gpt-5-pro (2025-10-06) |
-
Usuzování - Rozhraní API pro odpovědi - Strukturované výstupy. - Zpracování textu a obrázku. - Funkce a nástroje - Úplný souhrn možností |
400 000 Vstup: 272 000 Výstup: 128 000 |
128,000 | 30. září 2024 |
Poznámka:
1gpt-5-chat verze 2025-10-03 představuje významné vylepšení zaměřené na schopnosti v oblasti emocionální inteligence a duševního zdraví. Tento upgrade integruje specializované datové sady a upřesňující strategie odezvy, aby se zlepšila schopnost modelu:
- Pochopit a interpretovat emocionální kontext přesněji, což umožňuje nuantní a empatitické interakce.
- Poskytovat podporu, zodpovědné reakce v konverzacích souvisejících s duševním zdravím, zajištění citlivosti a dodržování osvědčených postupů.
Cílem těchto vylepšení je zajistit, aby GPT-5-chat byl více kontextově citlivý, zaměřený na člověka a spolehlivý ve scénářích, kde je klíčový emocionální tón a aspekty duševní pohody.
gpt-oss
Dostupnost v regionu
| Model | Región |
|---|---|
gpt-oss-120b |
Všechny oblasti Azure OpenAI |
Capabilities
| ID modelu | Description | Kontextové okno | Maximální počet výstupních tokenů | Trénovací data (až do) |
|---|---|---|---|---|
gpt-oss-120b (Preview) |
- Pouze text v/text ven – Rozhraní API pro dokončení chatu - Streamování - Volání funkcí - Strukturované výstupy -Usuzování – K dispozici pro nasazení1 a přes spravované výpočetní prostředky |
131,072 | 131,072 | 31. května 2024 |
gpt-oss-20b (Preview) |
- Pouze text v/text ven – Rozhraní API pro dokončení chatu - Streamování - Volání funkcí - Strukturované výstupy -Usuzování – K dispozici přes spravované výpočetní prostředky a Foundry Local |
131,072 | 131,072 | 31. května 2024 |
1 Na rozdíl od jiných modelů gpt-oss-120b Azure OpenAI k nasazení modelu vyžaduje projekt Foundry .
Nasazení pomocí kódu
az cognitiveservices account deployment create \
--name "Foundry-project-resource" \
--resource-group "test-rg" \
--deployment-name "gpt-oss-120b" \
--model-name "gpt-oss-120b" \
--model-version "1" \
--model-format "OpenAI-OSS" \
--sku-capacity 10 \
--sku-name "GlobalStandard"
Řada GPT-4.1
Dostupnost v regionu
| Model | Región |
|---|---|
gpt-4.1 (2025-04-14) |
Podívejte se na tabulku modelů. |
gpt-4.1-nano (2025-04-14) |
Podívejte se na tabulku modelů. |
gpt-4.1-mini (2025-04-14) |
Podívejte se na tabulku modelů. |
Capabilities
Důležité
Známý problém ovlivňuje všechny modely řady GPT 4.1. Velké definice volání nástrojů nebo funkcí, které překračují 300 000 tokenů, způsobí selhání, i když nebyl dosažen 1 milion kontextových limitů tokenů modelů.
Chyby se mohou lišit v závislosti na vlastnostech volání rozhraní API a základní datové části.
Tady jsou chybové zprávy rozhraní API pro dokončování chatu:
Error code: 400 - {'error': {'message': "This model's maximum context length is 300000 tokens. However, your messages resulted in 350564 tokens (100 in the messages, 350464 in the functions). Please reduce the length of the messages or functions.", 'type': 'invalid_request_error', 'param': 'messages', 'code': 'context_length_exceeded'}}Error code: 400 - {'error': {'message': "Invalid 'tools[0].function.description': string too long. Expected a string with maximum length 1048576, but got a string with length 2778531 instead.", 'type': 'invalid_request_error', 'param': 'tools[0].function.description', 'code': 'string_above_max_length'}}
Tady je chybová zpráva pro rozhraní API pro odpovědi:
Error code: 500 - {'error': {'message': 'The server had an error processing your request. Sorry about that! You can retry your request, or contact us through an Azure support request at: https://go.microsoft.com/fwlink/?linkid=2213926 if you keep seeing this error. (Please include the request ID d2008353-291d-428f-adc1-defb5d9fb109 in your email.)', 'type': 'server_error', 'param': None, 'code': None}}
| ID modelu | Description | Kontextové okno | Maximální počet výstupních tokenů | Trénovací data (až do) |
|---|---|---|---|---|
gpt-4.1 (2025-04-14) |
- Zadávání textu a obrázku - Výstup textu - API pro doplnění chatu - Odezvy API - Streamování - Volání funkcí - Strukturované výstupy (dokončení chatu) |
- 1,047,576 – 128 000 (zřízené spravované nasazení) – 300 000 (dávkové nasazení) |
32,768 | 31. května 2024 |
gpt-4.1-nano (2025-04-14) |
- Zadávání textu a obrázku - Výstup textu - API pro doplnění chatu - Odezvy API - Streamování - Volání funkcí - Strukturované výstupy (dokončení chatu) |
- 1,047,576 – 128 000 (zřízené spravované nasazení) – 300 000 (dávkové nasazení) |
32,768 | 31. května 2024 |
gpt-4.1-mini (2025-04-14) |
- Zadávání textu a obrázku - Výstup textu - API pro doplnění chatu - Odezvy API - Streamování - Volání funkcí - Strukturované výstupy (dokončení chatu) |
- 1,047,576 – 128 000 (zřízené spravované nasazení) – 300 000 (dávkové nasazení) |
32,768 | 31. května 2024 |
computer-use-preview
Experimentální model vycvičený pro použití s nástrojem Responses API pro počítače.
Dá se použít s knihovnami třetích stran, aby model mohl ovládat vstup myši a klávesnice a zároveň získat kontext ze snímků obrazovky aktuálního prostředí.
Upozornění
Nedoporučujeme používat modely Preview v produkčním prostředí. Upgradujeme všechna nasazení modelů Preview na budoucí verze Preview nebo na nejnovější stabilní obecně dostupnou verzi. Modely, které jsou určené ve verzi Preview, nedodržují standardní životní cyklus modelu Azure OpenAI.
Pro přístup computer-use-previewse vyžaduje registrace . Přístup se uděluje na základě kritérií způsobilosti microsoftu. Zákazníci, kteří mají přístup k jiným modelům omezeného přístupu, stále potřebují požádat o přístup pro tento model.
Pokud chcete požádat o přístup, přejděte do aplikace modelu omezenéhocomputer-use-preview přístupu. Když je udělen přístup, musíte pro model vytvořit nasazení.
Dostupnost v regionu
| Model | Región |
|---|---|
computer-use-preview |
Podívejte se na tabulku modelů. |
Capabilities
| ID modelu | Description | Kontextové okno | Maximální počet výstupních tokenů | Trénovací data (až do) |
|---|---|---|---|---|
computer-use-preview (2025-03-11) |
Specializovaný model pro použití s nástrojem pro používání počítače Responses API -Nářadí -Streamování - Text (vstup/výstup) - Obrázek (vstup) |
8,192 | 1,024 | Říjen 2023 |
modely řady o-series
Modely o-series Azure OpenAI jsou navržené tak, aby řešily důvody a úlohy řešení problémů se zvýšeným zaměřením a schopností. Tyto modely tráví více času zpracováním a porozuměním požadavku uživatele, což je mimořádně silné v oblastech, jako je věda, kódování a matematika v porovnání s předchozími iteracemi.
| ID modelu | Description | Maximální počet požadavků (tokeny) | Trénovací data (až do) |
|---|---|---|---|
codex-mini (2025-05-16) |
Jemně vyladěná verze o4-mini. - Rozhraní API pro odpovědi - Strukturované výstupy. - Zpracování textu a obrázku. - Funkce a nástroje. Úplný souhrn možností |
Vstup: 200 000 Výstup: 100 000 |
31. května 2024 |
o3-pro (2025-06-10) |
-
Rozhraní API pro odpovědi - Strukturované výstupy. - Zpracování textu a obrázku. - Funkce a nástroje. Úplný souhrn možností |
Vstup: 200 000 Výstup: 100 000 |
31. května 2024 |
o4-mini (2025-04-16) |
-
Nový model zdůvodnění, který nabízí vylepšené schopnosti zdůvodnění. – Rozhraní API pro dokončování chatů - Rozhraní API pro odpovědi - Strukturované výstupy. - Zpracování textu a obrázku. - Funkce a nástroje. Úplný souhrn možností |
Vstup: 200 000 Výstup: 100 000 |
31. května 2024 |
o3 (2025-04-16) |
-
Nový model zdůvodnění, který nabízí vylepšené schopnosti zdůvodnění. – Rozhraní API pro dokončování chatů - Rozhraní API pro odpovědi - Strukturované výstupy. - Zpracování textu a obrázku. – Funkce, nástroje a paralelní volání nástrojů. Úplný souhrn možností |
Vstup: 200 000 Výstup: 100 000 |
31. května 2024 |
o3-mini (2025-01-31) |
-
Vylepšené možnosti odůvodnění. - Strukturované výstupy. - Zpracování pouze textu. - Funkce a nástroje. |
Vstup: 200 000 Výstup: 100 000 |
Říjen 2023 |
o1 (2024-12-17) |
-
Vylepšené možnosti odůvodnění. - Strukturované výstupy. - Zpracování textu a obrázku. - Funkce a nástroje. |
Vstup: 200 000 Výstup: 100 000 |
Říjen 2023 |
o1-preview (2024-09-12) |
Starší verze Preview | Vstup: 128 000 Výstup: 32 768 |
Říjen 2023 |
o1-mini (2024-09-12) |
Rychlejší a nákladově efektivnější možnost v řadě o1, která je ideální pro úlohy kódování, které vyžadují rychlost a nižší spotřebu prostředků. – Ve výchozím nastavení je k dispozici globální nasazení standardu. – Standardní (regionální) nasazení jsou aktuálně dostupná jenom pro vybrané zákazníky, kteří obdrželi přístup jako součást o1-preview omezené verze přístupu. |
Vstup: 128 000 Výstup: 65 536 |
Říjen 2023 |
Další informace o pokročilých modelech o-series najdete v tématu Začínáme s modely zdůvodňování.
Dostupnost v regionu
| Model | Región |
|---|---|
codex-mini |
USA – východ 2 a Švédsko – střed (globální standard). |
o3-pro |
USA – východ 2 a Švédsko – střed (globální standard). |
o4-mini |
Podívejte se na tabulku modelů. |
o3 |
Podívejte se na tabulku modelů. |
o3-mini |
Podívejte se na tabulku modelů. |
o1 |
Podívejte se na tabulku modelů. |
o1-preview |
Podívejte se na tabulku modelů. Tento model je k dispozici pouze pro zákazníky, kteří měli udělený přístup jako součást původního omezeného přístupu. |
o1-mini |
Podívejte se na tabulku modelů. |
GPT-4o a GPT-4 Turbo
GPT-4o integruje text a obrázky do jednoho modelu, který umožňuje zpracovávat více datových typů současně. Tento multimodální přístup zlepšuje přesnost a rychlost odezvy v interakcích lidského počítače. GPT-4o odpovídá GPT-4 Turbo v anglickém textu a programovacím úkolům a nabízí vynikající výkon v úlohách v jiných než anglickém jazyce a vizuálních úlohách, nastavení nových srovnávacích testů pro funkce AI.
Modely GPT-4 a GPT-4 Turbo
Tyto modely lze použít pouze s rozhraním API pro dokončování chatu.
Informace o tom, jak Azure OpenAI zpracovává upgrady verzí modelu, najdete v tématu Verze modelu. Informace o zobrazení a konfiguraci nastavení verze modelu nasazení GPT-4 najdete v tématu Práce s modely .
| ID modelu | Description | Maximální počet požadavků (tokeny) | Trénovací data (až do) |
|---|---|---|---|
gpt-4o (2024-11-20) GPT-4o (Omni) |
- Strukturované výstupy. - Zpracování textu a obrázku. – Režim JSON. - Paralelní volání funkce. - Vyšší přesnost a rychlost odezvy. - Parita s anglickým textem a kódovacími úkoly ve srovnání s GPT-4 Turbo s vision. - Vynikající výkon v neanglických jazycích a v úkolech souvisejících se zrakem. - Vylepšené kreativní psaní schopnost. |
Vstup: 128 000 Výstup: 16 384 |
Říjen 2023 |
gpt-4o (2024-08-06) GPT-4o (Omni) |
- Strukturované výstupy. - Zpracování textu a obrázku. – Režim JSON. - Paralelní volání funkce. - Vyšší přesnost a rychlost odezvy. - Parita s anglickým textem a kódovacími úkoly ve srovnání s GPT-4 Turbo s vision. - Vynikající výkon v neanglických jazycích a v úkolech souvisejících se zrakem. |
Vstup: 128 000 Výstup: 16 384 |
Říjen 2023 |
gpt-4o-mini (2024-07-18) GPT-4o mini |
- Rychlý, levný a schopný model ideální pro nahrazení modelů SÉRIE GPT-3.5 Turbo. - Zpracování textu a obrázku. – Režim JSON. - Paralelní volání funkce. |
Vstup: 128 000 Výstup: 16 384 |
Říjen 2023 |
gpt-4o (2024-05-13) GPT-4o (Omni) |
- Zpracování textu a obrázku. – Režim JSON. - Paralelní volání funkce. - Vyšší přesnost a rychlost odezvy. - Parita s anglickým textem a kódovacími úkoly ve srovnání s GPT-4 Turbo s vision. - Vynikající výkon v neanglických jazycích a v úkolech souvisejících se zrakem. |
Vstup: 128 000 Výstup: 4 096 |
Říjen 2023 |
gpt-4 (turbo-2024-04-09) GPT-4 Turbo s vision |
Nový obecně dostupný model. - Náhrada za všechny předchozí modely GPT-4 Preview ( vision-preview, 1106-Preview, 0125-Preview). - Dostupnost funkcí se v současné době liší v závislosti na metodě vstupu a typu nasazení. |
Vstup: 128 000 Výstup: 4 096 |
Prosinec 2023 |
Upozornění
Nedoporučujeme používat modely Preview v produkčním prostředí. Upgradujeme všechna nasazení modelů Preview na budoucí verze Preview nebo na nejnovější stabilní obecně dostupnou verzi. Modely, které jsou určené ve verzi Preview, nedodržují standardní životní cyklus modelu Azure OpenAI.
GPT-3.5
Modely GPT-3.5 můžou pochopit a generovat přirozený jazyk nebo kód. Nejschopnější a nákladově efektivní model v rodině GPT-3.5 je GPT-3.5 Turbo, který je optimalizovaný pro chat a funguje dobře pro tradiční úkoly dokončení. GPT-3.5 Turbo je k dispozici pro použití s rozhraním API pro dokončování chatu. GPT-3.5 Turbo Instruct má podobné možnosti, jako text-davinci-003 když místo rozhraní API pro dokončování chatu použijete rozhraní API pro dokončování chatu. Doporučujeme používat GPT-3.5 Turbo a GPT-3.5 Turbo Instruct místo starších modelů GPT-3.5 a GPT-3.
| ID modelu | Description | Maximální počet požadavků (tokeny) | Trénovací data (až do) |
|---|---|---|---|
gpt-35-turbo (0125) nový |
– Režim JSON. - Paralelní volání funkce. - Reprodukovatelný výstup (Preview). - Vyšší přesnost, když reaguje v požadovaných formátech. – Obsahuje opravu chyby, která způsobovala problém s kódováním textu pro volání funkcí jiného jazyka než v angličtině. |
Vstup: 16 385 Výstup: 4 096 |
Zář 2021 |
gpt-35-turbo (1106) |
Starší obecně dostupný model. – Režim JSON. - Paralelní volání funkce. - Reprodukovatelný výstup (Preview). |
Vstup: 16 385 Výstup: 4 096 |
Zář 2021 |
gpt-35-turbo-instruct (0914) |
Pouze koncový bod dokončení. - Nahrazení modelů starších dokončení. |
4,097 | Zář 2021 |
Další informace o interakci s rozhraním GPT-3.5 Turbo a rozhraním API pro dokončování chatu najdete v našem podrobném článku s postupy.
Zakotvení
text-embedding-3-large je nejnovější a nejschopnější model vkládání. Mezi modely vkládání není možné upgradovat. Pokud chcete přejít z použití text-embedding-ada-002 na text-embedding-3-large, musíte vygenerovat nové vkládání.
text-embedding-3-largetext-embedding-3-smalltext-embedding-ada-002
Sestavy OpenAI, které testují, ukazují, že modely vkládání velké i malé třetí generace nabízejí lepší průměrný výkon načítání ve více jazycích pomocí srovnávacího testu MIRACL . Stále udržují výkon pro anglické úlohy pomocí srovnávacího testu MTEB .
| Srovnávací test hodnocení | text-embedding-ada-002 |
text-embedding-3-small |
text-embedding-3-large |
|---|---|---|---|
| Průměr MIRACL | 31.4 | 44.0 | 54.9 |
| Průměr MTEB | 61.0 | 62.3 | 64.6 |
Modely vkládání třetí generace podporují zmenšení velikosti vkládání pomocí nového dimensions parametru. Větší vkládání jsou obvykle dražší z hlediska výpočetních prostředků, paměti a úložiště. Když můžete upravit počet dimenzí, získáte větší kontrolu nad celkovými náklady a výkonem. Parametr dimensions není podporován ve všech verzích knihovny OpenAI 1.x Pythonu. Pokud chcete tento parametr využít, doporučujeme upgradovat na nejnovější verzi: pip install openai --upgrade.
Srovnávací testy MTEB OpenAI zjistily, že i když jsou dimenze modelu třetí generace sníženy na méně než 1 536 dimenzí text-embeddings-ada-002, výkon zůstává mírně lepší.
Modely generování obrázků
Modely generování obrázků generují obrázky z textových výzev, které uživatel poskytuje. Modely řady GPT-image-1 jsou ve verzi Preview s omezeným přístupem. DALL-E 3 je obecně k dispozici pro použití s rozhraními REST API. DALL-E 2 a DALL-E 3 s klientskými sadami SDK jsou ve verzi Preview.
Registrace je vyžadována pro přístup k gpt-image-1 nebo gpt-image-1-mini. Přístup se uděluje na základě kritérií způsobilosti microsoftu. Zákazníci, kteří mají přístup k jiným modelům omezeného přístupu, stále potřebují požádat o přístup pro tento model.
Pokud chcete požádat o přístup, přejděte do aplikace modelu omezenéhogpt-image-1 přístupu. Když je udělen přístup, musíte pro model vytvořit nasazení.
Dostupnost v regionu
| Model | Región |
|---|---|
dall-e-3 |
USA – východ Austrálie – východ Švédsko – střed |
gpt-image-1 |
Západní USA 3 (Globální standard) USA – východ 2 (globální standard) Spojené arabské emiráty – sever (globální standard) Polsko – střed (Global Standard) Švédsko – centrál (Globální standard) |
gpt-image-1-mini |
Západní USA 3 (Globální standard) USA – východ 2 (globální standard) Spojené arabské emiráty – sever (globální standard) Polsko – střed (Global Standard) Švédsko – centrál (Globální standard) |
Modely generování videa
Sora je model AI z OpenAI, který dokáže vytvářet realistické a imaginativní video scény z textových instrukcí. Sora je ve verzi Preview.
Dostupnost v regionu
| Model | Región |
|---|---|
sora |
USA – východ 2 (globální standard) Švédsko – centrál (Globální standard) |
sora-2 |
USA – východ 2 (globální standard) Švédsko – centrál (Globální standard) |
Zvukové modely
Zvukové modely v Azure OpenAI jsou k dispozici prostřednictvím rozhraní API realtime, completions a audio.
Zvukové modely GPT-4o
Zvukové modely GPT-4o jsou součástí řady modelů GPT-4o a podporují buď nízkou latenci, řeč v řeči, konverzační interakce nebo generování zvuku.
Upozornění
Nedoporučujeme používat modely Preview v produkčním prostředí. Upgradujeme všechna nasazení modelů Preview na budoucí verze Preview nebo na nejnovější stabilní obecně dostupnou verzi. Modely, které jsou určené ve verzi Preview, nedodržují standardní životní cyklus modelu Azure OpenAI.
Podrobnosti o maximálních tokenech žádostí a trénovacích datech jsou k dispozici v následující tabulce:
| ID modelu | Description | Maximální počet požadavků (tokeny) | Trénovací data (až do) |
|---|---|---|---|
gpt-4o-mini-audio-preview (2024-12-17) GPT-4o audio |
Zvukový model pro generování zvuku a textu | Vstup: 128 000 Výstup: 16 384 |
Září 2023 |
gpt-4o-audio-preview (2024-12-17) GPT-4o audio |
Zvukový model pro generování zvuku a textu | Vstup: 128 000 Výstup: 16 384 |
Září 2023 |
gpt-4o-realtime-preview (2025-06-03) GPT-4o audio |
Zvukový model pro zpracování zvuku v reálném čase. | Vstup: 128 000 Výstup: 4 096 |
Říjen 2023 |
gpt-4o-realtime-preview (2024-12-17) GPT-4o audio |
Zvukový model pro zpracování zvuku v reálném čase. | Vstup: 128 000 Výstup: 4 096 |
Říjen 2023 |
gpt-4o-mini-realtime-preview (2024-12-17) GPT-4o audio |
Zvukový model pro zpracování zvuku v reálném čase. | Vstup: 128 000 Výstup: 4 096 |
Říjen 2023 |
gpt-realtime (GA) (2025-08-08-28)gpt-realtime-mini (2025-10-06)gpt-audio(28.08.2025)gpt-audio-mini(06.10.2025) |
Zvukový model pro zpracování zvuku v reálném čase. | Vstup: 28 672 Výstup: 4 096 |
Říjen 2023 |
Pokud chcete porovnat dostupnost zvukových modelů GPT-4o ve všech oblastech, projděte si tabulku modelů.
Zvukové rozhraní API
Zvukové modely prostřednictvím /audio rozhraní API lze použít pro převod řeči na text, překlad a převod textu na řeč.
Modely převodu řeči na text
| ID modelu | Description | Maximální počet požadavků (velikost zvukového souboru) |
|---|---|---|
whisper |
Model rozpoznávání řeči pro obecné účely | 25 MB |
gpt-4o-transcribe |
Model převodu řeči na text s využitím GPT-4o | 25 MB |
gpt-4o-mini-transcribe |
Model převodu řeči na text s technologií GPT-4o mini. | 25 MB |
gpt-4o-transcribe-diarize |
Model převodu řeči na text s automatickým rozpoznáváním řeči | 25 MB |
Modely překladu řeči
| ID modelu | Description | Maximální počet požadavků (velikost zvukového souboru) |
|---|---|---|
whisper |
Model rozpoznávání řeči pro obecné účely | 25 MB |
Modely převodu textu na řeč (Preview)
| ID modelu | Description |
|---|---|
tts |
Model převodu textu na řeč optimalizovaný pro rychlost |
tts-hd |
Model převodu textu na řeč optimalizovaný pro kvalitu |
gpt-4o-mini-tts |
Model převodu textu na řeč s technologií GPT-4o mini. Hlas můžete vést tak, aby mluvil v určitém stylu nebo tónu. |
Další informace najdete v tématu Dostupnost oblastí zvukových modelů dále v tomto článku.
Souhrnná tabulka modelů a dostupnost oblastí
Modely podle typu nasazení
Azure OpenAI poskytuje zákazníkům volby ve struktuře hostování, která odpovídá jejich obchodním vzorům a vzorům využití. Služba nabízí dva hlavní typy nasazení:
- Standard: Má globální možnost nasazení, směrování provozu globálně za účelem zajištění vyšší propustnosti.
- Zřízeno: Má také možnost globálního nasazení, která zákazníkům umožňuje nakupovat a nasazovat zřízené jednotky propustnosti napříč globální infrastrukturou Azure.
Všechna nasazení můžou provádět přesně stejné operace odvozování, ale fakturace, škálování a výkon se podstatně liší. Další informace o typech nasazení Azure OpenAI najdete v průvodci typy nasazení.
- Global Standard
- Globální zřízená spravovaná
- Global Batch
- Standard datové zóny
- Spravovaná zóna dat
- Dávka pro datovou zónu
- Standard
- Zřízená spravovaná
Globální dostupnost modelu Standard
| Oblast | gpt-5.1, 2025-11-13 | gpt-5.1-chat, 2025-11-13 | gpt-5.1-codex, 2025-11-13 | gpt-5.1-codex-mini, 2025-11-13 | gpt-5-pro, 2025-10-06 | gpt-5, 2025-08-07 | gpt-5-mini, 2025-08-07 | gpt-5-nano, 2025-08-07 | gpt-5-chat, 2025-08-07 | gpt-5-chat, 2025-10-03 | o3-pro, 2025-06-10 | codex-mini, 2025-05-16 | sora, 2025-05-02 | model-router, 2025-08-07 | model-router, 2025-05-19 | model-router, 2025-11-18 | o3, 2025-04-16 | o4-mini, 2025-04-16 | gpt-image-1, 2025-04-15 | gpt-4.1, 2025-04-14 | gpt-4.1-nano, 2025-04-14 | gpt-4.1-mini, 2025-04-14 | náhled použití počítače, 11.03.2025 | o3-mini, 2025-01-31 | o1, 2024-12-17 | o1-mini, 2024-09-12 | gpt-4o, 2024-05-13 | gpt-4o, 2024-08-06 | gpt-4o, 2024-11-20 | gpt-4o-mini, 2024-07-18 | text-embedding-3-small, 1 | text-embedding-3-large, 1 | text-embedding-ada-002, 2 | gpt-4o-realtime-preview, 2024-12-17 | gpt-4o-realtime-preview, 2025-06-03 | gpt-4o-audio-preview, 2024-12-17 | gpt-4o-mini-realtime-preview, 2024-12-17 | gpt-4o-mini-audio-preview, 2024-12-17 | gpt-4o-transcribe, 2025-03-20 | gpt-4o-mini-tts, 2025-03-20 | gpt-4o-mini-přepis, 2025-03-20 | gpt-5-codex, 2025-09-15 | gpt-realtime, 2025-08-28 | gpt-audio-mini, 2025-10-06 | gpt-image-1-mini, 2025-10-06 | gpt-realtime-mini, 2025-10-06 | gpt-audio, 2025-08-28 | sora-2, 2025-10-06 | o3-deep-research, 2025-06-26 | gpt-4o-transcribe-diarize, 2025-10-15 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Austrálie - východ | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| Jižní Brazílie | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| kanadacentral | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | ✅ | - | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| východní Kanada | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| centrálus | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | - | - |
| Eastus | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | ✅ | - | - | - | - | - | - | - | - | - | - | - | - |
| eastus2 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
| franciecentral | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| Německo – středozápad | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| itálie sever | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| japaneast | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| koreacentral | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| northcentralus | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| Norsko – východ | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - |
| polskocentral | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - |
| Jižní Afrika – sever | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| southcentralus | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| southeastasia | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | - | - | - | - | ✅ | - | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| Jižní Indie | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| spaincentral | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| Sweden Central | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
| Švýcarsko – sever | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| switzerlandwest | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | ✅ | - | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| uaenorth | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - |
| uksouth | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| západní evropa | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| westus | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - |
| westus3 | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - |
Poznámka:
o3-deep-research je aktuálně k dispozici pouze se službou Foundry Agent Service. Další informace najdete v doprovodných materiálech k nástroji hloubkového výzkumu.
Tato tabulka neobsahuje podrobné informace o dostupnosti v jednotlivých oblastech. Informace najdete v části o dolaďování.
Standardní modely nasazení (regionální) podle koncového bodu
Dokončení chatu
| Oblast | o1-preview, 2024-09-12 | o1-mini, 2024-09-12 | gpt-4o, 2024-05-13 | gpt-4o, 2024-11-20 | gpt-4o, 2024-08-06 | gpt-4o-mini, 2024-07-18 | gpt-4, turbo-2024-04-09 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 |
|---|---|---|---|---|---|---|---|---|---|
| Austrálie - východ | - | - | - | ✅ | - | - | - | ✅ | ✅ |
| východní Kanada | - | - | - | ✅ | - | - | - | ✅ | ✅ |
| Eastus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
| eastus2 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
| franciecentral | - | - | - | ✅ | - | - | - | ✅ | ✅ |
| japaneast | - | - | - | ✅ | - | - | - | - | ✅ |
| northcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
| Norsko – východ | - | - | - | ✅ | - | - | - | - | - |
| southcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
| Jižní Indie | - | - | - | ✅ | - | - | - | ✅ | ✅ |
| Sweden Central | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Švýcarsko – sever | - | - | - | ✅ | - | - | - | - | ✅ |
| uksouth | - | - | - | ✅ | - | - | - | ✅ | ✅ |
| západní evropa | - | - | - | - | - | - | - | - | ✅ |
| westus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| westus3 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
Poznámka:
o1-mini je aktuálně k dispozici pro všechny zákazníky pro globální nasazení standardu.
Vybraným zákazníkům byl udělen standardní (regionální) přístup k nasazení o1-mini jako součást omezeného přístupu o1-preview. V současné době se přístup ke standardním o1-mini (regionálním) nasazením nerozbaluje.
Další informace o tom, jak Azure OpenAI zpracovává upgrady verzí modelu, najdete v tématu Verze modelu. Informace o zobrazení a konfiguraci nastavení verze modelu nasazení GPT-3.5 Turbo najdete v tématu Práce s modely.
Jemné ladění modelů
Poznámka:
Podporované oblasti pro vyladění se můžou lišit, pokud používáte modely Azure OpenAI v projektu Microsoft Foundry oproti mimo projekt.
| ID modelu | Standardní oblasti trénování | Globální školení | Maximální počet požadavků (tokeny) | Trénovací data (až do) | Modality |
|---|---|---|---|---|---|
gpt-4o-mini (2024-07-18) |
USA – středosever Švédsko – střed |
✅ | Vstup: 128 000 Výstup: 16 384 Délka kontextu příkladu trénování: 65 536 |
říjen 2023 | Text na text |
gpt-4o (2024-08-06) |
Východ USA 2 USA – středosever Švédsko – střed |
✅ | Vstup: 128 000 Výstup: 16 384 Délka kontextu příkladu trénování: 65 536 |
říjen 2023 | Text a zpracování obrazu na text |
gpt-4.1 (2025-04-14) |
USA – středosever Švédsko – střed |
✅ | Vstup: 128 000 Výstup: 16 384 Délka kontextu příkladu trénování: 65 536 |
Květen 2024 | Text a zpracování obrazu na text |
gpt-4.1-mini (2025-04-14) |
USA – středosever Švédsko – střed |
✅ | Vstup: 128 000 Výstup: 16 384 Délka kontextu příkladu trénování: 65 536 |
Květen 2024 | Text na text |
gpt-4.1-nano (2025-04-14) |
USA – středosever Švédsko – střed |
✅ | Vstup: 128 000 Výstup: 16 384 Délka kontextu příkladu trénování: 32 768 |
Květen 2024 | Text na text |
o4-mini (2025-04-16) |
Východ USA 2 Švédsko – střed |
- | Vstup: 128 000 Výstup: 16 384 Délka kontextu příkladu trénování: 65 536 |
Květen 2024 | Text na text |
Poznámka:
Globální trénování poskytuje cenově dostupné trénování na token, ale nenabízí rezidenci dat. Prostředky Azure OpenAI jsou aktuálně dostupné v následujících oblastech:
- Austrálie – východ
- Brazílie – jih
- Kanada – střed
- Kanada – východ
- USA – východ
- Východní USA 2
- Francie – střed
- Německo – středozápad
- Itálie – sever
- Japonsko – východ (bez podpory zraku)
- Korea – střed
- Střed USA – sever
- Norsko – východ
- Polsko – střed (bez podpory 4.1-nano)
- Jihovýchodní Asie
- Jižní Afrika – sever
- Střed USA – jih
- Indie – jih
- Španělsko – střed
- Švédsko – střed
- Švýcarsko – západ
- Švýcarsko – sever
- Velká Británie – jih
- Západní Evropa
- USA – západ
- Západ USA3
Asistenti (Preview)
Pro asistenty potřebujete kombinaci podporovaného modelu a podporované oblasti. Některé nástroje a možnosti vyžadují nejnovější modely. Následující modely jsou k dispozici v rozhraní API asistentů, sadě SDK a Foundry. Následující tabulka je určená pro standardní nasazení. Informace o dostupnosti zřízených jednotek propustnosti najdete v tématu Zřízená propustnost. Uvedené modely a oblasti je možné použít s asistenty v1 i v2. Pokud jsou podporované v následujících oblastech, můžete použít modely Global Standard .
| Región | gpt-4o, 2024-05-13 | gpt-4o, 2024-08-06 | gpt-4o-mini, 2024-07-18 | gpt-4, 0613 | gpt-4, 1106-Preview | gpt-4, 0125-Ukázka | gpt-4, turbo-2024-04-09 | gpt-4-32k, 0613 | gpt-35-turbo, 0613 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 | gpt-35-turbo-16k, 0613 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Austrálie - východ | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ |
| Eastus | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | ✅ | - | ✅ | ✅ |
| eastus2 | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | - | ✅ | - | ✅ | ✅ |
| franciecentral | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | ✅ |
| japaneast | - | - | - | - | - | - | - | - | ✅ | - | ✅ | ✅ |
| Norsko – východ | - | - | - | - | ✅ | - | - | - | - | - | - | - |
| Jižní Indie | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | - |
| Sweden Central | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | - | ✅ |
| uksouth | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ |
| westus | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | - | - | ✅ | ✅ | - |
| westus3 | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | - | - | - | ✅ | - |
Vyřazení modelu z provozu
Nejnovější informace o vyřazení modelů najdete v průvodci vyřazení modelů.
Související obsah
Poznámka:
Modely Foundry prodané přímo v Azure zahrnují také všechny modely Azure OpenAI. Pokud se chcete o těchto modelech dozvědět víc, přejděte na kolekci modelů Azure OpenAI v horní části tohoto článku.
Modely Black Forest Labs prodávané přímo v Azure
Kolekce BFL (Black Forest Labs) modelů generování obrázků zahrnuje FLUX.1 Kontext [pro] pro generování v kontextu a úpravy a FLUX1.1 [pro] pro generování textu na image.
Tyto modely můžete spouštět prostřednictvím rozhraní API poskytovatele služeb BFL a prostřednictvím koncových bodů obrázků/generování a obrázků/úprav.
| Model | Typ a koncový bod rozhraní API | Capabilities | Typ nasazení (dostupnost oblastí) | Typ projektu |
|---|---|---|---|---|
| FLUX.1-Kontext-pro |
Generování obrázků - Rozhraní API pro obrázky: https://<resource-name>/openai/deployments/{deployment-id}/images/generations a https://<resource-name>/openai/deployments/{deployment-id}/images/edits - Rozhraní API poskytovatele služeb BFL: <resource-name>/providers/blackforestlabs/v1/flux-kontext-pro?api-version=preview |
-
Vstup: text a obrázek (5 000 tokenů a 1 obrázek) - Výstup: Jeden obrázek - Vyvolání nástrojů: Ne - Formáty odpovědí: Obrázek (PNG a JPG) - Klíčové funkce: Konzistence znaků, pokročilé úpravy - Další parametry:(Pouze rozhraní API specifické pro zprostředkovatele) seed, aspect ratio, input_image, prompt_unsampling, safety_tolerance, output_format |
– Globální standard (všechny oblasti) | Foundry, založená na centru |
| FLUX-1.1-pro |
Generování obrázků - Rozhraní API pro obrázky: https://<resource-name>/openai/deployments/{deployment-id}/images/generations - Rozhraní API poskytovatele služeb BFL: <resource-name>/providers/blackforestlabs/v1/flux-pro-1.1?api-version=preview |
-
Vstup: text (5 000 tokenů a 1 obrázek) - Výstup: Jeden obrázek - Vyvolání nástrojů: Ne - Formáty odpovědí: Obrázek (PNG a JPG) - Klíčové funkce: Rychlé odvozování, silné dodržování pokynů, konkurenční ceny, škálovatelnost generování - Další parametry:(Pouze rozhraní API specifické pro zprostředkovatele) width, height, prompt_unsampling, seed, safety_tolerance, output_format |
– Globální standard (všechny oblasti) | Foundry, založená na centru |
| Model | Typ a koncový bod rozhraní API | Capabilities | Typ nasazení (dostupnost oblastí) |
|---|---|---|---|
FLUX.1-Kontext-pro |
Generování obrázků - Rozhraní API pro obrázky: https://<resource-name>/openai/deployments/{deployment-id}/images/generations a https://<resource-name>/openai/deployments/{deployment-id}/images/edits - Rozhraní API poskytovatele služeb BFL: <resource-name>/providers/blackforestlabs/v1/flux-kontext-pro?api-version=preview |
-
Vstup: text a obrázek (5 000 tokenů a 1 obrázek) - Výstup: Jeden obrázek - Vyvolání nástrojů: Ne - Formáty odpovědí: Obrázek (PNG a JPG) - Klíčové funkce: Konzistence znaků, pokročilé úpravy - Další parametry:(Pouze rozhraní API specifické pro zprostředkovatele) seed, aspect ratio, input_image, prompt_unsampling, safety_tolerance, output_format |
– Globální standard (všechny oblasti) |
FLUX-1.1-pro |
Generování obrázků - Rozhraní API pro obrázky: https://<resource-name>/openai/deployments/{deployment-id}/images/generations - Rozhraní API poskytovatele služeb BFL: <resource-name>/providers/blackforestlabs/v1/flux-pro-1.1?api-version=preview |
-
Vstup: text (5 000 tokenů a 1 obrázek) - Výstup: Jeden obrázek - Vyvolání nástrojů: Ne - Formáty odpovědí: Obrázek (PNG a JPG) - Klíčové funkce: Rychlé odvozování, silné dodržování pokynů, konkurenční ceny, škálovatelnost generování - Další parametry:(Pouze rozhraní API specifické pro zprostředkovatele) width, height, prompt_unsampling, seed, safety_tolerance, output_format |
– Globální standard (všechny oblasti) |
Podívejte se na tuto kolekci modelů na portálu Microsoft Foundry.
Modely cohere prodané přímo v Azure
Řada modelů Cohere zahrnuje různé modely optimalizované pro různé případy použití, včetně dokončování chatu a vkládání. Modely cohere jsou optimalizované pro různé případy použití, mezi které patří odůvodnění, shrnutí a odpovědi na otázky.
| Model | Typ | Capabilities | Typ nasazení (dostupnost oblastí) | Typ projektu |
|---|---|---|---|---|
| Cohere-command-a | chat-completion |
-
Vstup: text (131 072 tokenů) - Výstup: text (8 182 tokenů) - Jazyky: en, fr, es, , itde, pt-brja, , ko, , zh-cnaar - Volání nástroje: Ano - Formáty odpovědí: Text, JSON |
– Globální standard (všechny oblasti) | Foundry, založená na centru |
| embed-v-4-0 | embeddings |
-
Vstup: text (512 tokenů) a obrázky (2MM pixely) - Výstup: Vektor (256, 512, 1024, 1536 rozměry.) - Jazyky: en, fr, es, , itde, pt-brja, , ko, , zh-cnaar |
– Globální standard (všechny oblasti) | Foundry, založená na centru |
| Model | Typ | Capabilities | Typ nasazení (dostupnost oblastí) |
|---|---|---|---|
Cohere-command-a |
chat-completion |
-
Vstup: text (131 072 tokenů) - Výstup: text (8 182 tokenů) - Jazyky: en, fr, es, , itde, pt-brja, , ko, , zh-cnaar - Volání nástroje: Ano - Formáty odpovědí: Text, JSON |
– Globální standard (všechny oblasti) |
embed-v-4-0 |
embeddings |
-
Vstup: text (512 tokenů) a obrázky (2MM pixely) - Výstup: Vektor (256, 512, 1024, 1536 rozměry.) - Jazyky: en, fr, es, , itde, pt-brja, , ko, , zh-cnaar |
– Globální standard (všechny oblasti) |
Podívejte se na kolekci modelů Cohere na portálu Foundry.
Modely DeepSeek prodávané přímo v Azure
Řada modelů DeepSeek zahrnuje DeepSeek-R1, která exceluje při odůvodnění úkolů pomocí podrobného trénovacího procesu, jako je jazyk, vědecké odůvodnění a programovací úkoly.
| Model | Typ | Capabilities | Typ nasazení (dostupnost oblastí) | Typ projektu |
|---|---|---|---|---|
| DeepSeek-V3.1 | chat-completion (s odůvodněním obsahu) |
-
Vstup: text (131 072 tokenů) - Výstup: (131 072 tokenů) - Jazyky: en a zh - Volání nástroje: Ano - Formáty odpovědí: Text, JSON |
– Globální standard (všechny oblasti) | Foundry, založená na centru |
| DeepSeek-R1-0528 | chat-completion (s odůvodněním obsahu) |
-
Vstup: text (163 840 tokenů) - Výstup: (163 840 tokenů) - Jazyky: en a zh - Vyvolání nástrojů: Ne - Formáty odpovědí: Text. |
– Globální standard (všechny oblasti) – Globální zřizování (všechny oblasti) |
Foundry, založená na centru |
| DeepSeek-V3-0324 | chat-completion |
-
Vstup: text (131 072 tokenů) - Výstup: (131 072 tokenů) - Jazyky: en a zh - Volání nástroje: Ano - Formáty odpovědí: Text, JSON |
– Globální standard (všechny oblasti) – Globální zřizování (všechny oblasti) |
Foundry, založená na centru |
| DeepSeek-R1 | chat-completion (s odůvodněním obsahu) |
-
Vstup: text (163 840 tokenů) - Výstup: (163 840 tokenů) - Jazyky: en a zh - Vyvolání nástrojů: Ne - Formáty odpovědí: Text. |
– Globální standard (všechny oblasti) – Globální zřizování (všechny oblasti) |
Foundry, založená na centru |
| Model | Typ | Capabilities | Typ nasazení (dostupnost oblastí) |
|---|---|---|---|
DeepSeek-V3.1 |
chat-completion (s odůvodněním obsahu) |
-
Vstup: text (131 072 tokenů) - Výstup: (131 072 tokenů) - Jazyky: en a zh - Volání nástroje: Ano - Formáty odpovědí: Text, JSON |
– Globální standard (všechny oblasti) |
DeepSeek-R1-0528 |
chat-completion (s odůvodněním obsahu) |
-
Vstup: text (163 840 tokenů) - Výstup: (163 840 tokenů) - Jazyky: en a zh - Vyvolání nástrojů: Ne - Formáty odpovědí: Text. |
– Globální standard (všechny oblasti) – Globální zřizování (všechny oblasti) |
DeepSeek-V3-0324 |
chat-completion |
-
Vstup: text (131 072 tokenů) - Výstup: (131 072 tokenů) - Jazyky: en a zh - Volání nástroje: Ano - Formáty odpovědí: Text, JSON |
– Globální standard (všechny oblasti) – Globální zřizování (všechny oblasti) |
DeepSeek-R1 |
chat-completion (s odůvodněním obsahu) |
-
Vstup: text (163 840 tokenů) - Výstup: (163 840 tokenů) - Jazyky: en a zh - Vyvolání nástrojů: Ne - Formáty odpovědí: Text. |
– Globální standard (všechny oblasti) – Globální zřizování (všechny oblasti) |
Podívejte se na tuto kolekci modelů na portálu Foundry.
Meta modely prodané přímo v Azure
Modely a nástroje Meta Llama představují kolekci předem natrénovaných a vyladěných generativních modelů AI pro zpracování textu a obrazů. Rozsah metamodelů ve velkém měřítku, který zahrnuje:
- Malé jazykové modely (SLM), jako jsou 1B a 3B Base a Instruct modely, pro odvozování na zařízení a edge computing.
- Středně velké jazykové modely (LLM), jako jsou 7B, 8B a 70B Base a Instruct modely.
- Vysoce výkonné modely, jako je Meta Llama 3.1-405B, instrukci pro syntetické generování dat a případy použití destilační.
| Model | Typ | Capabilities | Typ nasazení (dostupnost oblastí) | Typ projektu |
|---|---|---|---|---|
| Llama-4-Maverick-17B-128E-Instruct-FP8 | chat-completion |
-
Vstup: text a obrázky (tokeny 1M) - Výstup: text (1M tokenů) - Jazyky: ar, en, , fr, de, hiid, itpt, es, tl, , thavi - Vyvolání nástrojů: Ne - Formáty odpovědí: Text |
– Globální standard (všechny oblasti) | Foundry, založená na centru |
| Llama-3.3-70B-Instruct | chat-completion |
-
Vstup: text (128 000 token) - Výstup: text (8 192 tokenů) - Jazyky: en, de, fr, it, pt, hi, , es, a th - Vyvolání nástrojů: Ne - Formáty odpovědí: Text |
– Globální standard (všechny oblasti) | Foundry, založená na centru |
| Model | Typ | Capabilities | Typ nasazení (dostupnost oblastí) |
|---|---|---|---|
Llama-4-Maverick-17B-128E-Instruct-FP8 |
chat-completion |
-
Vstup: text a obrázky (tokeny 1M) - Výstup: text (1M tokenů) - Jazyky: ar, en, , fr, de, hiid, itpt, es, tl, , thavi - Vyvolání nástrojů: Ne - Formáty odpovědí: Text |
– Globální standard (všechny oblasti) |
Llama-3.3-70B-Instruct |
chat-completion |
-
Vstup: text (128 000 token) - Výstup: text (8 192 tokenů) - Jazyky: en, de, fr, it, pt, hi, , es, a th - Vyvolání nástrojů: Ne - Formáty odpovědí: Text |
– Globální standard (všechny oblasti) |
Podívejte se na tuto kolekci modelů na portálu Foundry. Můžete také najít několik meta modelů dostupných od partnerů a komunity.
Modely Microsoftu prodané přímo v Azure
Modely Microsoftu zahrnují různé skupiny modelů, jako jsou modelový směrovač, modely MAI, modely Phi, modely AI pro zdravotnictví a další. Podívejte se na kolekci modelů Microsoftu na portálu Foundry. Můžete také najít několik modelů Microsoftu dostupných od partnerů a komunity.
| Model | Typ | Capabilities | Typ nasazení (dostupnost oblastí) | Typ projektu |
|---|---|---|---|---|
| model-router1 | chat-completion | Další podrobnosti najdete v přehledu modelového směrovače. - Vstup: text, obrázek - Výstup: text (maximální počet výstupních tokenů se liší2) Kontextové okno: 200 0003 - Jazyky: en |
– globální standard (USA – východ 2, Švédsko – střed) – Datová zóna standard4 (USA – východ 2, Švédsko – střed) |
Foundry, založená na centru |
| MAI-DS-R1 | chat-completion (s odůvodněním obsahu) |
-
Vstup: text (163 840 tokenů) - Výstup: (163 840 tokenů) - Jazyky: en a zh - Vyvolání nástrojů: Ne - Formáty odpovědí: Text. |
– Globální standard (všechny oblasti) | Foundry, založená na centru |
| Model | Typ | Capabilities | Typ nasazení (dostupnost oblastí) |
|---|---|---|---|
| model-router1 | chat-completion | Další podrobnosti najdete v přehledu modelového směrovače. - Vstup: text, obrázek - Výstup: text (maximální počet výstupních tokenů se liší2) Kontextové okno: 200 0003 - Jazyky: en |
– globální standard (USA – východ 2, Švédsko – střed) – Datová zóna standard4 (USA – východ 2, Švédsko – střed) |
MAI-DS-R1 |
chat-completion (s odůvodněním obsahu) |
-
Vstup: text (163 840 tokenů) - Výstup: (163 840 tokenů) - Jazyky: en a zh - Vyvolání nástrojů: Ne - Formáty odpovědí: Text. |
– Globální standard (všechny oblasti) |
1Modelová verze směrovače2025-11-18. K dispozici jsou také starší verze (2025-08-07 a 2025-05-19).
2Maximální počet výstupních tokenů se u podkladových modelů ve směrovači modelu liší. Například 32 768 (GPT-4.1 series), 100 000 (o4-mini), 128 000 (gpt-5 reasoning models) a 16 384 (gpt-5-chat).
3 Větší kontextová okna jsou kompatibilní s některými podkladovými modely směrovače modelů. To znamená, že volání rozhraní API s větším kontextem proběhne úspěšně pouze v případě, že se výzva přesměruje na jeden z těchto modelů. Jinak volání selže.
4 Fakturace nasazení směrovačů modelu Data Zone Standard začíná nejdříve 1. listopadu 2025.
Modely Mistral prodávané přímo v Azure
| Model | Typ | Capabilities | Typ nasazení (dostupnost oblastí) | Typ projektu |
|---|---|---|---|---|
| Mistral-Large-3 | chat-completion |
-
Vstup: text, obrázek - Výstup: text - Jazyky: en, fr, , de, es, itptnlzh, a jakoar - Volání nástroje: Ano - Formáty odpovědí: Text, JSON |
– globální standard (USA – západ 3) | Slévárna |
| mistral-document-ai-2505 | Obrázek na text |
-
Vstup: obrázek nebo stránky PDF (30 stránek, max. 30 MB PDF soubor) - Výstup: text - Jazyky: en - Volání nástrojů: ne - Formáty odpovědí: Text, JSON, Markdown |
– Globální standard (všechny oblasti) - Standard datové zóny (USA a EU) |
Slévárna |
| Model | Typ | Capabilities | Typ nasazení (dostupnost oblastí) |
|---|---|---|---|
Mistral-Large-3 |
chat-completion |
-
Vstup: text, obrázek - Výstup: text - Jazyky: en, fr, , de, es, itptnlzh, a jakoar - Volání nástroje: Ano - Formáty odpovědí: Text, JSON |
– globální standard (USA – západ 3) |
mistral-document-ai-2505 |
Obrázek na text |
-
Vstup: obrázek nebo stránky PDF (30 stránek, max. 30 MB PDF soubor) - Výstup: text - Jazyky: en - Volání nástrojů: ne - Formáty odpovědí: Text, JSON, Markdown |
– Globální standard (všechny oblasti) - Standard datové zóny (USA a EU) |
Podívejte se na kolekci modelů Mistral na portálu Foundry. K dispozici je také několik modelů Mistral od partnerů a komunity.
Modely xAI prodané přímo v Azure
Grokové modely xAI v modelech Foundry zahrnují různorodou sadu modelů navržených pro vynikání v různých podnikových doménách s různými schopnostmi a cenovými kategoriemi, mezi které patří:
Grok 3, nerozumový model předem natrénovaný datovým centrem Colossus, je přizpůsobený pro obchodní využití, jako je extrakce dat, kódování a shrnutí textu, s výjimečnou schopností dodržovat instrukce. Podporuje kontextové okno o velikosti 131 072 tokenů, které umožňuje zpracovávat rozsáhlé vstupy při zachování koherence a hloubky, a je schopný navazovat spojení napříč doménami a jazyky.
Grok 3 Mini je jednoduchý model, který je natrénovaný tak, aby se zabýval agentickými, programovacími, matematickými a hlubokými vědeckými problémy s výpočetními prostředky v době testování. Podporuje také kontextové okno 131 072 tokenů pro pochopení kódové základny a podnikových dokumentů, exceluje při použití nástrojů k řešení složitých logických problémů v nových prostředích a nabízí neopracované záznamy ke kontrole uživateli s úpravou myšlenkových rozpočtů.
Grok Code Fast 1, rychlý a efektivní model odůvodnění navržený pro použití v aplikacích pro kódování agentů. Byla předem natrénována na kombinaci dat zaměřených na kódování, poté byla dále zdokonalena ukázkami různých programovacích úloh a použití nástrojů, stejně jako ukázkami správného odmítavého chování na základě bezpečnostní politiky xAI. Pro přístup k modelu grok-code-fast-1 se vyžaduje registrace.
Grok 4 Fast, model jazyka optimalizovaný pro efektivitu, který poskytuje téměř Grok 4 možnosti odůvodnění s výrazně nižší latencí a náklady, a může obejít důvody zcela pro ultra-rychlé aplikace. Je navržen pro bezpečné a efektivní použití nástrojů, s integrovaným chováním odmítnutí, pevně definovanou systémovou bezpečnostní výzvou a vstupními filtry, které slouží k zamezení zneužití.
Grok 4 je nejnovější model z xAI s pokročilými možnostmi zdůvodňování a používání nástrojů, který umožňuje dosáhnout nového špičkového výkonu napříč náročnými akademickými a oborovými srovnávacími testy. Pro přístup k modelu grok-4 se vyžaduje registrace.
| Model | Typ | Capabilities | Typ nasazení (dostupnost oblastí) | Typ projektu |
|---|---|---|---|---|
| grok-4 | chat-completion |
-
Vstup: text, obrázek (256 000 tokenů) - Výstup: text (8 192 tokenů) - Jazyky: en - Volání nástrojů: ano - Formáty odpovědí: text |
– Globální standard (všechny oblasti) | Foundry, založená na centru |
| grok-4-fast-reasoning | chat-completion |
-
Vstup: text, obrázek (2 000 000 tokenů) - Výstup: text (2 000 000 tokenů) - Jazyky: en - Volání nástrojů: ano - Formáty odpovědí: text |
– Globální standard (všechny oblasti) – Standard datové zóny (USA) |
Foundry, založená na centru |
| grok-4-fast-non-reasoning | chat-completion |
-
Vstup: text, obrázek (2 000 000 tokenů) - Výstup: text (2 000 000 tokenů) - Jazyky: en - Volání nástrojů: ano - Formáty odpovědí: text |
– Globální standard (všechny oblasti) – Standard datové zóny (USA) |
Foundry, založená na centru |
| grok-code-fast-1 | chat-completion |
-
Vstup: text (256 000 tokenů) - Výstup: text (8 192 tokenů) - Jazyky: en - Volání nástrojů: ano - Formáty odpovědí: text |
– Globální standard (všechny oblasti) | Foundry, založená na centru |
| grok-3 | chat-completion |
-
Vstup: text (131 072 tokenů) - Výstup: text (131 072 tokenů) - Jazyky: en - Volání nástrojů: ano - Formáty odpovědí: text |
– Globální standard (všechny oblasti) – Standard datové zóny (USA) |
Foundry, založená na centru |
| grok-3-mini | chat-completion |
-
Vstup: text (131 072 tokenů) - Výstup: text (131 072 tokenů) - Jazyky: en - Volání nástrojů: ano - Formáty odpovědí: text |
– Globální standard (všechny oblasti) – Standard datové zóny (USA) |
Foundry, založená na centru |
| Model | Typ | Capabilities | Typ nasazení (dostupnost oblastí) |
|---|---|---|---|
grok-4 |
chat-completion |
-
Vstup: text, obrázek (256 000 tokenů) - Výstup: text (8 192 tokenů) - Jazyky: en - Volání nástrojů: ano - Formáty odpovědí: text |
– Globální standard (všechny oblasti) |
grok-4-fast-reasoning |
chat-completion |
-
Vstup: text, obrázek (2 000 000 tokenů) - Výstup: text (2 000 000 tokenů) - Jazyky: en - Volání nástrojů: ano - Formáty odpovědí: text |
– Globální standard (všechny oblasti) – Standard datové zóny (USA) |
grok-4-fast-non-reasoning |
chat-completion |
-
Vstup: text, obrázek (2 000 000 tokenů) - Výstup: text (2 000 000 tokenů) - Jazyky: en - Volání nástrojů: ano - Formáty odpovědí: text |
– Globální standard (všechny oblasti) – Standard datové zóny (USA) |
grok-code-fast-1 |
chat-completion |
-
Vstup: text (256 000 tokenů) - Výstup: text (8 192 tokenů) - Jazyky: en - Volání nástrojů: ano - Formáty odpovědí: text |
– Globální standard (všechny oblasti) |
grok-3 |
chat-completion |
-
Vstup: text (131 072 tokenů) - Výstup: text (131 072 tokenů) - Jazyky: en - Volání nástrojů: ano - Formáty odpovědí: text |
– Globální standard (všechny oblasti) – Standard datové zóny (USA) |
grok-3-mini |
chat-completion |
-
Vstup: text (131 072 tokenů) - Výstup: text (131 072 tokenů) - Jazyky: en - Volání nástrojů: ano - Formáty odpovědí: text |
– Globální standard (všechny oblasti) – Standard datové zóny (USA) |
Podívejte se na kolekci modelů xAI na portálu Foundry.
Dostupnost oblasti modelu podle typu nasazení
Foundry Models nabízí volby pro strukturu hostování, která odpovídá vašim obchodním vzorům a vzorům použití. Služba nabízí dva hlavní typy nasazení:
- Standard: Má globální možnost nasazení, směrování provozu globálně za účelem zajištění vyšší propustnosti.
- Provisioned: Má také možnost nasazení na globální úrovni, což umožňuje zakoupit a nasadit zřízené jednotky propustnosti v rámci globální infrastruktury Azure.
Všechna nasazení provádějí stejné prediktivní výpočty, ale fakturace, škálování a výkon se liší. Další informace o typech nasazení najdete v tématu Typy nasazení v modelech Foundry.
Globální dostupnost modelu Standard
| Oblast | DeepSeek-R1-0528 | DeepSeek-R1 | DeepSeek-V3-0324 | DeepSeek-V3.1 | FLUX.1-Kontext-pro | FLUX-1.1-pro | grok-4 | grok-4-fast-reasoning | grok-4-fast-non-reasoning | grok-code-fast-1 | grok-3 | grok-3-mini | Llama-4-Maverick-17B-128E-Instruct-FP8 | Llama-3.3-70B-Instruct | MAI-DS-R1 | mistral-document-ai-2505 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Austrálie - východ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Jižní Brazílie | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| východní Kanada | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Eastus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| eastus2 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| franciecentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Německo – středozápad | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| itálie sever | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| japaneast | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| koreacentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| northcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Norsko – východ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| polskocentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Jižní Afrika – sever | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| southcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Jižní Indie | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| spaincentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Sweden Central | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Švýcarsko – sever | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| switzerlandwest | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| uaenorth | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| uksouth | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| západní evropa | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| westus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| westus3 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
Otevřené a přizpůsobené modely
Katalog modelů nabízí větší výběr modelů od širší škály poskytovatelů. U těchto modelů nemůžete použít možnost pro standardní nasazení v prostředcích Microsoft Foundry, kde se modely poskytují jako rozhraní API. Místo toho můžete tyto modely nasadit tak, že je budete muset hostovat ve vaší infrastruktuře, vytvořit centrum AI a poskytnout základní kvótu výpočetních prostředků pro hostování modelů.
Kromě toho můžou být tyto modely chráněné otevřeným přístupem nebo IP ochranou. V obou případech je musíte nasadit do nabídek spravovaných výpočetních prostředků v Foundry. Pokud chcete začít, přečtěte si článek Postupy: Nasazení do spravovaného výpočetního prostředí.