Sdílet prostřednictvím


Foundry Models prodané přímo v Azure

Poznámka:

Tento dokument se týká portálu Microsoft Foundry (nový).

Tento článek uvádí výběr modelů Microsoft Foundry prodaných přímo v Azure spolu s jejich možnostmi, typy nasazení a oblastmi dostupnosti, s výjimkou zastaralých a starších modelů. Seznam modelů Azure OpenAI podporovaných službou Foundry Agent Service najdete v tématu Modely podporované službou Agent Service.

Modely prodané přímo v Azure zahrnují všechny modely Azure OpenAI a konkrétní vybrané modely od hlavních poskytovatelů.

V závislosti na druhu projektu , který používáte v Microsoft Foundry, uvidíte jiný výběr modelů. Konkrétně pokud používáte projekt Foundry založený na prostředku Foundry, uvidíte modely, které jsou k dispozici pro standardní nasazení do zdroje Foundry. Případně pokud používáte projekt založený na centru hostovaný centrem Foundry, uvidíte modely, které jsou k dispozici pro nasazení pro spravovaná výpočetní a bezserverová rozhraní API. Tyto výběry modelu se často překrývají, protože mnoho modelů podporuje více možností nasazení.

Modely Foundry jsou k dispozici pro standardní implementaci na zdroj Foundry.

Další informace o atributech modelů Foundry prodaných přímo v Azure najdete v tématu Prozkoumání modelů Foundry.

Poznámka:

Modely Foundry prodané přímo v Azure zahrnují také vybrané modely od následujících hlavních poskytovatelů modelů:

  • Black Forest Labs: FLUX.1-Kontext-pro, FLUX-1.1-pro
  • Cohere: Cohere-command-a, embed-v-4-0
  • DeepSeek: DeepSeek-V3.1, DeepSeek-V3-0324, DeepSeek-R1-0528, DeepSeek-R1
  • Meta: Llama-4-Maverick-17B-128E-Instruct-FP8, Llama-3.3-70B-Instruct
  • Microsoft: MAI-DS-R1, model-router
  • Mistral: mistral-document-ai-2505, Mistral-Large-3
  • xAI: grok-code-fast-1, grok-3, grok-3-mini, grok-4-fast-reasoning, grok-4-fast-non-reasoninggrok-4

Další informace o těchto modelech najdete v horní části tohoto článku v části Další kolekce modelů .

Azure OpenAI v modelech Microsoft Foundry

Azure OpenAI využívá různorodou sadu modelů s různými možnostmi a cenovými body. Dostupnost modelu se liší podle oblastí a cloudu. Dostupnost modelu Azure Government najdete v tématu Azure OpenAI ve službě Azure Government.

Models Description
Řada GPT-5.1 NOVÝgpt-5.1, gpt-5.1-chat, gpt-5.1-codexgpt-5.1-codex-mini
Sora NOVÝ sora-2
Řada GPT-5 gpt-5, gpt-5-mini, gpt-5-nano, gpt-5-chat
gpt-oss modely s otevřenými váhami
codex-mini Jemně vyladěná verze o4-mini.
Řada GPT-4.1 gpt-4.1, gpt-4.1-mini, gpt-4.1-nano
computer-use-preview Experimentální model vyvinutý pro použití s rozhraním API pro odpovědi.
Modely O-series Modely uvažování s pokročilým řešením problémů, větším zaměřením a schopností.
GPT-4o, GPT-4o mini a GPT-4 Turbo Modely Azure OpenAI s vícemodálními verzemi, které můžou jako vstup přijímat text i obrázky.
GPT-4 Sada modelů, které zlepšují GPT-3.5 a můžou pochopit a generovat přirozený jazyk a kód.
GPT-3.5 Sada modelů, které zlepšují GPT-3 a můžou pochopit a generovat přirozený jazyk a kód.
Embeddings Sada modelů, které mohou převést text do číselné vektorové formy, aby se usnadnila podobnost textu.
Generování obrázků Řada modelů, které můžou generovat původní obrázky z přirozeného jazyka.
Video generation Model, který může generovat původní video scény z textových instrukcí.
Zvuk Řada modelů pro převod řeči na text, překlad a převod textu na řeč. Zvukové modely GPT-4o podporují buď konverzační interakce s řečí s nízkou latencí (vstup řeči, výstup řeči), nebo generování zvuku.

GPT-5.1

Dostupnost v regionu

Model Región
gpt-5.1 USA – východ 2 a Švédsko – střed (Global Standard & DataZone Standard)
gpt-5.1-chat USA – východ 2 a Švédsko – střed (globální standard)
gpt-5.1-codex USA – východ 2 a Švédsko – střed (globální standard)
gpt-5.1-codex-mini USA – východ 2 a Švédsko – střed (globální standard)

Přístup bude udělen na základě kritérií způsobilosti Microsoftu. Zákazníci, kteří dříve zažádali a získali přístup k modelu omezeného přístupu, nemusí žádat znovu, protože jejich schválená předplatná budou při vydání modelu automaticky poskytnut přístup.

ID modelu Description Kontextové okno Maximální počet výstupních tokenů Trénovací data (až do)
gpt-5.1 (2025-11-13) - Usuzování
– Rozhraní API pro dokončování chatů
- Rozhraní API pro odpovědi
- Strukturované výstupy.
- Zpracování textu a obrázku.
– Funkce, nástroje a paralelní volání nástrojů.
- Úplný souhrn možností
400 000

Vstup: 272 000
Výstup: 128 000
128,000 30. září 2024
gpt-5.1-chat (2025-11-13) - Usuzování
– Rozhraní API pro dokončování chatů
- Rozhraní API pro odpovědi
- Strukturované výstupy
– Funkce, nástroje a paralelní volání nástrojů.
128,000

Vstup: 111 616
Výstup: 16 384
16,384 30. září 2024
gpt-5.1-codex (2025-11-13) - Pouze API pro odpovědi
- Zpracování textu a obrázku
- Strukturované výstupy.
– Funkce, nástroje a paralelní volání nástrojů.
- Úplný souhrn možností
- Optimalizované pro rozšíření Codex CLI a Codex VS Code
400 000

Vstup: 272 000
Výstup: 128 000
128,000 30. září 2024
gpt-5.1-codex-mini (2025-11-13) - Pouze API pro odpovědi
- Zpracování textu a obrázku
- Strukturované výstupy.
- Zpracování textu a obrázku.
– Funkce, nástroje a paralelní volání nástrojů.
- Úplný souhrn možností
- Optimalizované pro rozšíření Codex CLI a Codex VS Code
400 000

Vstup: 272 000
Výstup: 128 000
128,000 30. září 2024

Důležité

  • gpt-5.1 reasoning_effort se nastaví na výchozí none. Při upgradu z předchozích modelů odůvodnění na gpt-5.1 mějte na paměti, že možná budete muset aktualizovat svůj kód, aby explicitně předával úroveň reasoning_effort, pokud chcete, aby odůvodnění proběhlo.

  • gpt-5.1-chat přidá integrované možnosti odůvodnění. Stejně jako jiné modely odůvodnění nepodporuje parametry jako temperature. Pokud upgradujete z použití gpt-5-chat (což není argumentační model) na gpt-5.1-chat, ujistěte se, že jste z kódu odebrali všechny vlastní parametry jako temperature, které nejsou podporovány argumentačními modely.

GPT-5

Dostupnost v regionu

Model Región
gpt-5 (2025-08-07) Podívejte se na tabulku modelů.
gpt-5-mini (2025-08-07) Podívejte se na tabulku modelů.
gpt-5-nano (2025-08-07) Podívejte se na tabulku modelů.
gpt-5-chat (2025-08-07) Podívejte se na tabulku modelů.
gpt-5-chat (2025-10-03) USA – východ 2 (globální standard) a Švédsko – střed (globální standard)
gpt-5-codex (2025-09-11) USA – východ 2 (globální standard) a Švédsko – střed (globální standard)
gpt-5-pro (2025-10-06) USA – východ 2 (globální standard) a Švédsko – střed (globální standard)

Přístup bude udělen na základě kritérií způsobilosti Microsoftu. Zákazníci, kteří dříve použili a obdrželi přístup, o3nemusí znovu použít, protože jejich schválená předplatná budou po vydání modelu automaticky udělen přístup.

ID modelu Description Kontextové okno Maximální počet výstupních tokenů Trénovací data (až do)
gpt-5 (2025-08-07) - Usuzování
– Rozhraní API pro dokončování chatů
- Rozhraní API pro odpovědi
- Strukturované výstupy.
- Zpracování textu a obrázku.
– Funkce, nástroje a paralelní volání nástrojů.
- Úplný souhrn možností
400 000

Vstup: 272 000
Výstup: 128 000
128,000 30. září 2024
gpt-5-mini (2025-08-07) - Usuzování
– Rozhraní API pro dokončování chatů
- Rozhraní API pro odpovědi
- Strukturované výstupy.
- Zpracování textu a obrázku.
– Funkce, nástroje a paralelní volání nástrojů.
- Úplný souhrn možností
400 000

Vstup: 272 000
Výstup: 128 000
128,000 31. května 2024
gpt-5-nano (2025-08-07) - Usuzování
– Rozhraní API pro dokončování chatů
- Rozhraní API pro odpovědi
- Strukturované výstupy.
- Zpracování textu a obrázku.
– Funkce, nástroje a paralelní volání nástrojů.
- Úplný souhrn možností
400 000

Vstup: 272 000
Výstup: 128 000
128,000 31. května 2024
gpt-5-chat (2025-08-07)
Preview
– Rozhraní API pro dokončování chatů
- Rozhraní API pro odpovědi
- Vstup: Text/obrázek
- Výstup: Pouze text
128,000 16,384 30. září 2024
gpt-5-chat (2025-10-03)
Náhled1
– Rozhraní API pro dokončování chatů
- Rozhraní API pro odpovědi
- Vstup: Text/obrázek
- Výstup: Pouze text
128,000 16,384 30. září 2024
gpt-5-codex (2025-09-11) - Pouze API pro odpovědi
- Vstup: Text/obrázek
- Výstup: Pouze text
- Strukturované výstupy.
- Zpracování textu a obrázku.
– Funkce, nástroje a paralelní volání nástrojů.
- Úplný souhrn možností
- Optimalizované pro rozšíření Codex CLI a Codex VS Code
400 000

Vstup: 272 000
Výstup: 128 000
128,000 -
gpt-5-pro (2025-10-06) - Usuzování
- Rozhraní API pro odpovědi
- Strukturované výstupy.
- Zpracování textu a obrázku.
- Funkce a nástroje
- Úplný souhrn možností
400 000

Vstup: 272 000
Výstup: 128 000
128,000 30. září 2024

Poznámka:

1gpt-5-chat verze 2025-10-03 představuje významné vylepšení zaměřené na schopnosti v oblasti emocionální inteligence a duševního zdraví. Tento upgrade integruje specializované datové sady a upřesňující strategie odezvy, aby se zlepšila schopnost modelu:

  • Pochopit a interpretovat emocionální kontext přesněji, což umožňuje nuantní a empatitické interakce.
  • Poskytovat podporu, zodpovědné reakce v konverzacích souvisejících s duševním zdravím, zajištění citlivosti a dodržování osvědčených postupů.

Cílem těchto vylepšení je zajistit, aby GPT-5-chat byl více kontextově citlivý, zaměřený na člověka a spolehlivý ve scénářích, kde je klíčový emocionální tón a aspekty duševní pohody.

gpt-oss

Dostupnost v regionu

Model Región
gpt-oss-120b Všechny oblasti Azure OpenAI

Capabilities

ID modelu Description Kontextové okno Maximální počet výstupních tokenů Trénovací data (až do)
gpt-oss-120b (Preview) - Pouze text v/text ven
– Rozhraní API pro dokončení chatu
- Streamování
- Volání funkcí
- Strukturované výstupy
-Usuzování
– K dispozici pro nasazení1 a přes spravované výpočetní prostředky
131,072 131,072 31. května 2024
gpt-oss-20b (Preview) - Pouze text v/text ven
– Rozhraní API pro dokončení chatu
- Streamování
- Volání funkcí
- Strukturované výstupy
-Usuzování
– K dispozici přes spravované výpočetní prostředky a Foundry Local
131,072 131,072 31. května 2024

1 Na rozdíl od jiných modelů gpt-oss-120b Azure OpenAI k nasazení modelu vyžaduje projekt Foundry .

Nasazení pomocí kódu

az cognitiveservices account deployment create \
  --name "Foundry-project-resource" \
  --resource-group "test-rg" \
  --deployment-name "gpt-oss-120b" \
  --model-name "gpt-oss-120b" \
  --model-version "1" \
  --model-format "OpenAI-OSS" \
  --sku-capacity 10 \
  --sku-name "GlobalStandard"

Řada GPT-4.1

Dostupnost v regionu

Model Región
gpt-4.1 (2025-04-14) Podívejte se na tabulku modelů.
gpt-4.1-nano (2025-04-14) Podívejte se na tabulku modelů.
gpt-4.1-mini (2025-04-14) Podívejte se na tabulku modelů.

Capabilities

Důležité

Známý problém ovlivňuje všechny modely řady GPT 4.1. Velké definice volání nástrojů nebo funkcí, které překračují 300 000 tokenů, způsobí selhání, i když nebyl dosažen 1 milion kontextových limitů tokenů modelů.

Chyby se mohou lišit v závislosti na vlastnostech volání rozhraní API a základní datové části.

Tady jsou chybové zprávy rozhraní API pro dokončování chatu:

  • Error code: 400 - {'error': {'message': "This model's maximum context length is 300000 tokens. However, your messages resulted in 350564 tokens (100 in the messages, 350464 in the functions). Please reduce the length of the messages or functions.", 'type': 'invalid_request_error', 'param': 'messages', 'code': 'context_length_exceeded'}}

  • Error code: 400 - {'error': {'message': "Invalid 'tools[0].function.description': string too long. Expected a string with maximum length 1048576, but got a string with length 2778531 instead.", 'type': 'invalid_request_error', 'param': 'tools[0].function.description', 'code': 'string_above_max_length'}}

Tady je chybová zpráva pro rozhraní API pro odpovědi:

  • Error code: 500 - {'error': {'message': 'The server had an error processing your request. Sorry about that! You can retry your request, or contact us through an Azure support request at: https://go.microsoft.com/fwlink/?linkid=2213926 if you keep seeing this error. (Please include the request ID d2008353-291d-428f-adc1-defb5d9fb109 in your email.)', 'type': 'server_error', 'param': None, 'code': None}}
ID modelu Description Kontextové okno Maximální počet výstupních tokenů Trénovací data (až do)
gpt-4.1 (2025-04-14) - Zadávání textu a obrázku
- Výstup textu
- API pro doplnění chatu
- Odezvy API
- Streamování
- Volání funkcí
- Strukturované výstupy (dokončení chatu)
- 1,047,576
– 128 000 (zřízené spravované nasazení)
– 300 000 (dávkové nasazení)
32,768 31. května 2024
gpt-4.1-nano (2025-04-14) - Zadávání textu a obrázku
- Výstup textu
- API pro doplnění chatu
- Odezvy API
- Streamování
- Volání funkcí
- Strukturované výstupy (dokončení chatu)
- 1,047,576
– 128 000 (zřízené spravované nasazení)
– 300 000 (dávkové nasazení)
32,768 31. května 2024
gpt-4.1-mini (2025-04-14) - Zadávání textu a obrázku
- Výstup textu
- API pro doplnění chatu
- Odezvy API
- Streamování
- Volání funkcí
- Strukturované výstupy (dokončení chatu)
- 1,047,576
– 128 000 (zřízené spravované nasazení)
– 300 000 (dávkové nasazení)
32,768 31. května 2024

computer-use-preview

Experimentální model vycvičený pro použití s nástrojem Responses API pro počítače.

Dá se použít s knihovnami třetích stran, aby model mohl ovládat vstup myši a klávesnice a zároveň získat kontext ze snímků obrazovky aktuálního prostředí.

Upozornění

Nedoporučujeme používat modely Preview v produkčním prostředí. Upgradujeme všechna nasazení modelů Preview na budoucí verze Preview nebo na nejnovější stabilní obecně dostupnou verzi. Modely, které jsou určené ve verzi Preview, nedodržují standardní životní cyklus modelu Azure OpenAI.

Pro přístup computer-use-previewse vyžaduje registrace . Přístup se uděluje na základě kritérií způsobilosti microsoftu. Zákazníci, kteří mají přístup k jiným modelům omezeného přístupu, stále potřebují požádat o přístup pro tento model.

Pokud chcete požádat o přístup, přejděte do aplikace modelu omezenéhocomputer-use-preview přístupu. Když je udělen přístup, musíte pro model vytvořit nasazení.

Dostupnost v regionu

Model Región
computer-use-preview Podívejte se na tabulku modelů.

Capabilities

ID modelu Description Kontextové okno Maximální počet výstupních tokenů Trénovací data (až do)
computer-use-preview (2025-03-11) Specializovaný model pro použití s nástrojem pro používání počítače Responses API

-Nářadí
-Streamování
- Text (vstup/výstup)
- Obrázek (vstup)
8,192 1,024 Říjen 2023

modely řady o-series

Modely o-series Azure OpenAI jsou navržené tak, aby řešily důvody a úlohy řešení problémů se zvýšeným zaměřením a schopností. Tyto modely tráví více času zpracováním a porozuměním požadavku uživatele, což je mimořádně silné v oblastech, jako je věda, kódování a matematika v porovnání s předchozími iteracemi.

ID modelu Description Maximální počet požadavků (tokeny) Trénovací data (až do)
codex-mini (2025-05-16) Jemně vyladěná verze o4-mini.
- Rozhraní API pro odpovědi
- Strukturované výstupy.
- Zpracování textu a obrázku.
- Funkce a nástroje.
Úplný souhrn možností
Vstup: 200 000
Výstup: 100 000
31. května 2024
o3-pro (2025-06-10) - Rozhraní API pro odpovědi
- Strukturované výstupy.
- Zpracování textu a obrázku.
- Funkce a nástroje.
Úplný souhrn možností
Vstup: 200 000
Výstup: 100 000
31. května 2024
o4-mini (2025-04-16) - Nový model zdůvodnění, který nabízí vylepšené schopnosti zdůvodnění.
– Rozhraní API pro dokončování chatů
- Rozhraní API pro odpovědi
- Strukturované výstupy.
- Zpracování textu a obrázku.
- Funkce a nástroje.
Úplný souhrn možností
Vstup: 200 000
Výstup: 100 000
31. května 2024
o3 (2025-04-16) - Nový model zdůvodnění, který nabízí vylepšené schopnosti zdůvodnění.
– Rozhraní API pro dokončování chatů
- Rozhraní API pro odpovědi
- Strukturované výstupy.
- Zpracování textu a obrázku.
– Funkce, nástroje a paralelní volání nástrojů.
Úplný souhrn možností
Vstup: 200 000
Výstup: 100 000
31. května 2024
o3-mini (2025-01-31) - Vylepšené možnosti odůvodnění.
- Strukturované výstupy.
- Zpracování pouze textu.
- Funkce a nástroje.
Vstup: 200 000
Výstup: 100 000
Říjen 2023
o1 (2024-12-17) - Vylepšené možnosti odůvodnění.
- Strukturované výstupy.
- Zpracování textu a obrázku.
- Funkce a nástroje.
Vstup: 200 000
Výstup: 100 000
Říjen 2023
o1-preview (2024-09-12) Starší verze Preview Vstup: 128 000
Výstup: 32 768
Říjen 2023
o1-mini (2024-09-12) Rychlejší a nákladově efektivnější možnost v řadě o1, která je ideální pro úlohy kódování, které vyžadují rychlost a nižší spotřebu prostředků.
– Ve výchozím nastavení je k dispozici globální nasazení standardu.
– Standardní (regionální) nasazení jsou aktuálně dostupná jenom pro vybrané zákazníky, kteří obdrželi přístup jako součást o1-preview omezené verze přístupu.
Vstup: 128 000
Výstup: 65 536
Říjen 2023

Další informace o pokročilých modelech o-series najdete v tématu Začínáme s modely zdůvodňování.

Dostupnost v regionu

Model Región
codex-mini USA – východ 2 a Švédsko – střed (globální standard).
o3-pro USA – východ 2 a Švédsko – střed (globální standard).
o4-mini Podívejte se na tabulku modelů.
o3 Podívejte se na tabulku modelů.
o3-mini Podívejte se na tabulku modelů.
o1 Podívejte se na tabulku modelů.
o1-preview Podívejte se na tabulku modelů. Tento model je k dispozici pouze pro zákazníky, kteří měli udělený přístup jako součást původního omezeného přístupu.
o1-mini Podívejte se na tabulku modelů.

GPT-4o a GPT-4 Turbo

GPT-4o integruje text a obrázky do jednoho modelu, který umožňuje zpracovávat více datových typů současně. Tento multimodální přístup zlepšuje přesnost a rychlost odezvy v interakcích lidského počítače. GPT-4o odpovídá GPT-4 Turbo v anglickém textu a programovacím úkolům a nabízí vynikající výkon v úlohách v jiných než anglickém jazyce a vizuálních úlohách, nastavení nových srovnávacích testů pro funkce AI.

Modely GPT-4 a GPT-4 Turbo

Tyto modely lze použít pouze s rozhraním API pro dokončování chatu.

Informace o tom, jak Azure OpenAI zpracovává upgrady verzí modelu, najdete v tématu Verze modelu. Informace o zobrazení a konfiguraci nastavení verze modelu nasazení GPT-4 najdete v tématu Práce s modely .

ID modelu Description Maximální počet požadavků (tokeny) Trénovací data (až do)
gpt-4o (2024-11-20)
GPT-4o (Omni)
- Strukturované výstupy.
- Zpracování textu a obrázku.
– Režim JSON.
- Paralelní volání funkce.
- Vyšší přesnost a rychlost odezvy.
- Parita s anglickým textem a kódovacími úkoly ve srovnání s GPT-4 Turbo s vision.
- Vynikající výkon v neanglických jazycích a v úkolech souvisejících se zrakem.
- Vylepšené kreativní psaní schopnost.
Vstup: 128 000
Výstup: 16 384
Říjen 2023
gpt-4o (2024-08-06)
GPT-4o (Omni)
- Strukturované výstupy.
- Zpracování textu a obrázku.
– Režim JSON.
- Paralelní volání funkce.
- Vyšší přesnost a rychlost odezvy.
- Parita s anglickým textem a kódovacími úkoly ve srovnání s GPT-4 Turbo s vision.
- Vynikající výkon v neanglických jazycích a v úkolech souvisejících se zrakem.
Vstup: 128 000
Výstup: 16 384
Říjen 2023
gpt-4o-mini (2024-07-18)
GPT-4o mini
- Rychlý, levný a schopný model ideální pro nahrazení modelů SÉRIE GPT-3.5 Turbo.
- Zpracování textu a obrázku.
– Režim JSON.
- Paralelní volání funkce.
Vstup: 128 000
Výstup: 16 384
Říjen 2023
gpt-4o (2024-05-13)
GPT-4o (Omni)
- Zpracování textu a obrázku.
– Režim JSON.
- Paralelní volání funkce.
- Vyšší přesnost a rychlost odezvy.
- Parita s anglickým textem a kódovacími úkoly ve srovnání s GPT-4 Turbo s vision.
- Vynikající výkon v neanglických jazycích a v úkolech souvisejících se zrakem.
Vstup: 128 000
Výstup: 4 096
Říjen 2023
gpt-4 (turbo-2024-04-09)
GPT-4 Turbo s vision
Nový obecně dostupný model.
- Náhrada za všechny předchozí modely GPT-4 Preview (vision-preview, 1106-Preview, 0125-Preview).
- Dostupnost funkcí se v současné době liší v závislosti na metodě vstupu a typu nasazení.
Vstup: 128 000
Výstup: 4 096
Prosinec 2023

Upozornění

Nedoporučujeme používat modely Preview v produkčním prostředí. Upgradujeme všechna nasazení modelů Preview na budoucí verze Preview nebo na nejnovější stabilní obecně dostupnou verzi. Modely, které jsou určené ve verzi Preview, nedodržují standardní životní cyklus modelu Azure OpenAI.

GPT-3.5

Modely GPT-3.5 můžou pochopit a generovat přirozený jazyk nebo kód. Nejschopnější a nákladově efektivní model v rodině GPT-3.5 je GPT-3.5 Turbo, který je optimalizovaný pro chat a funguje dobře pro tradiční úkoly dokončení. GPT-3.5 Turbo je k dispozici pro použití s rozhraním API pro dokončování chatu. GPT-3.5 Turbo Instruct má podobné možnosti, jako text-davinci-003 když místo rozhraní API pro dokončování chatu použijete rozhraní API pro dokončování chatu. Doporučujeme používat GPT-3.5 Turbo a GPT-3.5 Turbo Instruct místo starších modelů GPT-3.5 a GPT-3.

ID modelu Description Maximální počet požadavků (tokeny) Trénovací data (až do)
gpt-35-turbo (0125) nový – Režim JSON.
- Paralelní volání funkce.
- Reprodukovatelný výstup (Preview).
- Vyšší přesnost, když reaguje v požadovaných formátech.
– Obsahuje opravu chyby, která způsobovala problém s kódováním textu pro volání funkcí jiného jazyka než v angličtině.
Vstup: 16 385
Výstup: 4 096
Zář 2021
gpt-35-turbo (1106) Starší obecně dostupný model.
– Režim JSON.
- Paralelní volání funkce.
- Reprodukovatelný výstup (Preview).
Vstup: 16 385
Výstup: 4 096
Zář 2021
gpt-35-turbo-instruct (0914) Pouze koncový bod dokončení.
- Nahrazení modelů starších dokončení.
4,097 Zář 2021

Další informace o interakci s rozhraním GPT-3.5 Turbo a rozhraním API pro dokončování chatu najdete v našem podrobném článku s postupy.

Zakotvení

text-embedding-3-large je nejnovější a nejschopnější model vkládání. Mezi modely vkládání není možné upgradovat. Pokud chcete přejít z použití text-embedding-ada-002 na text-embedding-3-large, musíte vygenerovat nové vkládání.

  • text-embedding-3-large
  • text-embedding-3-small
  • text-embedding-ada-002

Sestavy OpenAI, které testují, ukazují, že modely vkládání velké i malé třetí generace nabízejí lepší průměrný výkon načítání ve více jazycích pomocí srovnávacího testu MIRACL . Stále udržují výkon pro anglické úlohy pomocí srovnávacího testu MTEB .

Srovnávací test hodnocení text-embedding-ada-002 text-embedding-3-small text-embedding-3-large
Průměr MIRACL 31.4 44.0 54.9
Průměr MTEB 61.0 62.3 64.6

Modely vkládání třetí generace podporují zmenšení velikosti vkládání pomocí nového dimensions parametru. Větší vkládání jsou obvykle dražší z hlediska výpočetních prostředků, paměti a úložiště. Když můžete upravit počet dimenzí, získáte větší kontrolu nad celkovými náklady a výkonem. Parametr dimensions není podporován ve všech verzích knihovny OpenAI 1.x Pythonu. Pokud chcete tento parametr využít, doporučujeme upgradovat na nejnovější verzi: pip install openai --upgrade.

Srovnávací testy MTEB OpenAI zjistily, že i když jsou dimenze modelu třetí generace sníženy na méně než 1 536 dimenzí text-embeddings-ada-002, výkon zůstává mírně lepší.

Modely generování obrázků

Modely generování obrázků generují obrázky z textových výzev, které uživatel poskytuje. Modely řady GPT-image-1 jsou ve verzi Preview s omezeným přístupem. DALL-E 3 je obecně k dispozici pro použití s rozhraními REST API. DALL-E 2 a DALL-E 3 s klientskými sadami SDK jsou ve verzi Preview.

Registrace je vyžadována pro přístup k gpt-image-1 nebo gpt-image-1-mini. Přístup se uděluje na základě kritérií způsobilosti microsoftu. Zákazníci, kteří mají přístup k jiným modelům omezeného přístupu, stále potřebují požádat o přístup pro tento model.

Pokud chcete požádat o přístup, přejděte do aplikace modelu omezenéhogpt-image-1 přístupu. Když je udělen přístup, musíte pro model vytvořit nasazení.

Dostupnost v regionu

Model Región
dall-e-3 USA – východ​
Austrálie – východ
Švédsko – střed
gpt-image-1 Západní USA 3 (Globální standard)
USA – východ 2 (globální standard)
Spojené arabské emiráty – sever (globální standard)
Polsko – střed (Global Standard)
Švédsko – centrál (Globální standard)
gpt-image-1-mini Západní USA 3 (Globální standard)
USA – východ 2 (globální standard)
Spojené arabské emiráty – sever (globální standard)
Polsko – střed (Global Standard)
Švédsko – centrál (Globální standard)

Modely generování videa

Sora je model AI z OpenAI, který dokáže vytvářet realistické a imaginativní video scény z textových instrukcí. Sora je ve verzi Preview.

Dostupnost v regionu

Model Región
sora USA – východ 2 (globální standard)
Švédsko – centrál (Globální standard)
sora-2 USA – východ 2 (globální standard)
Švédsko – centrál (Globální standard)

Zvukové modely

Zvukové modely v Azure OpenAI jsou k dispozici prostřednictvím rozhraní API realtime, completions a audio.

Zvukové modely GPT-4o

Zvukové modely GPT-4o jsou součástí řady modelů GPT-4o a podporují buď nízkou latenci, řeč v řeči, konverzační interakce nebo generování zvuku.

Upozornění

Nedoporučujeme používat modely Preview v produkčním prostředí. Upgradujeme všechna nasazení modelů Preview na budoucí verze Preview nebo na nejnovější stabilní obecně dostupnou verzi. Modely, které jsou určené ve verzi Preview, nedodržují standardní životní cyklus modelu Azure OpenAI.

Podrobnosti o maximálních tokenech žádostí a trénovacích datech jsou k dispozici v následující tabulce:

ID modelu Description Maximální počet požadavků (tokeny) Trénovací data (až do)
gpt-4o-mini-audio-preview (2024-12-17)
GPT-4o audio
Zvukový model pro generování zvuku a textu Vstup: 128 000
Výstup: 16 384
Září 2023
gpt-4o-audio-preview (2024-12-17)
GPT-4o audio
Zvukový model pro generování zvuku a textu Vstup: 128 000
Výstup: 16 384
Září 2023
gpt-4o-realtime-preview (2025-06-03)
GPT-4o audio
Zvukový model pro zpracování zvuku v reálném čase. Vstup: 128 000
Výstup: 4 096
Říjen 2023
gpt-4o-realtime-preview (2024-12-17)
GPT-4o audio
Zvukový model pro zpracování zvuku v reálném čase. Vstup: 128 000
Výstup: 4 096
Říjen 2023
gpt-4o-mini-realtime-preview (2024-12-17)
GPT-4o audio
Zvukový model pro zpracování zvuku v reálném čase. Vstup: 128 000
Výstup: 4 096
Říjen 2023
gpt-realtime (GA) (2025-08-08-28)
gpt-realtime-mini (2025-10-06)
gpt-audio(28.08.2025)
gpt-audio-mini(06.10.2025)
Zvukový model pro zpracování zvuku v reálném čase. Vstup: 28 672
Výstup: 4 096
Říjen 2023

Pokud chcete porovnat dostupnost zvukových modelů GPT-4o ve všech oblastech, projděte si tabulku modelů.

Zvukové rozhraní API

Zvukové modely prostřednictvím /audio rozhraní API lze použít pro převod řeči na text, překlad a převod textu na řeč.

Modely převodu řeči na text

ID modelu Description Maximální počet požadavků (velikost zvukového souboru)
whisper Model rozpoznávání řeči pro obecné účely 25 MB
gpt-4o-transcribe Model převodu řeči na text s využitím GPT-4o 25 MB
gpt-4o-mini-transcribe Model převodu řeči na text s technologií GPT-4o mini. 25 MB
gpt-4o-transcribe-diarize Model převodu řeči na text s automatickým rozpoznáváním řeči 25 MB

Modely překladu řeči

ID modelu Description Maximální počet požadavků (velikost zvukového souboru)
whisper Model rozpoznávání řeči pro obecné účely 25 MB

Modely převodu textu na řeč (Preview)

ID modelu Description
tts Model převodu textu na řeč optimalizovaný pro rychlost
tts-hd Model převodu textu na řeč optimalizovaný pro kvalitu
gpt-4o-mini-tts Model převodu textu na řeč s technologií GPT-4o mini.

Hlas můžete vést tak, aby mluvil v určitém stylu nebo tónu.

Další informace najdete v tématu Dostupnost oblastí zvukových modelů dále v tomto článku.

Souhrnná tabulka modelů a dostupnost oblastí

Modely podle typu nasazení

Azure OpenAI poskytuje zákazníkům volby ve struktuře hostování, která odpovídá jejich obchodním vzorům a vzorům využití. Služba nabízí dva hlavní typy nasazení:

  • Standard: Má globální možnost nasazení, směrování provozu globálně za účelem zajištění vyšší propustnosti.
  • Zřízeno: Má také možnost globálního nasazení, která zákazníkům umožňuje nakupovat a nasazovat zřízené jednotky propustnosti napříč globální infrastrukturou Azure.

Všechna nasazení můžou provádět přesně stejné operace odvozování, ale fakturace, škálování a výkon se podstatně liší. Další informace o typech nasazení Azure OpenAI najdete v průvodci typy nasazení.

Globální dostupnost modelu Standard

Oblast gpt-5.1, 2025-11-13 gpt-5.1-chat, 2025-11-13 gpt-5.1-codex, 2025-11-13 gpt-5.1-codex-mini, 2025-11-13 gpt-5-pro, 2025-10-06 gpt-5, 2025-08-07 gpt-5-mini, 2025-08-07 gpt-5-nano, 2025-08-07 gpt-5-chat, 2025-08-07 gpt-5-chat, 2025-10-03 o3-pro, 2025-06-10 codex-mini, 2025-05-16 sora, 2025-05-02 model-router, 2025-08-07 model-router, 2025-05-19 model-router, 2025-11-18 o3, 2025-04-16 o4-mini, 2025-04-16 gpt-image-1, 2025-04-15 gpt-4.1, 2025-04-14 gpt-4.1-nano, 2025-04-14 gpt-4.1-mini, 2025-04-14 náhled použití počítače, 11.03.2025 o3-mini, 2025-01-31 o1, 2024-12-17 o1-mini, 2024-09-12 gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o, 2024-11-20 gpt-4o-mini, 2024-07-18 text-embedding-3-small, 1 text-embedding-3-large, 1 text-embedding-ada-002, 2 gpt-4o-realtime-preview, 2024-12-17 gpt-4o-realtime-preview, 2025-06-03 gpt-4o-audio-preview, 2024-12-17 gpt-4o-mini-realtime-preview, 2024-12-17 gpt-4o-mini-audio-preview, 2024-12-17 gpt-4o-transcribe, 2025-03-20 gpt-4o-mini-tts, 2025-03-20 gpt-4o-mini-přepis, 2025-03-20 gpt-5-codex, 2025-09-15 gpt-realtime, 2025-08-28 gpt-audio-mini, 2025-10-06 gpt-image-1-mini, 2025-10-06 gpt-realtime-mini, 2025-10-06 gpt-audio, 2025-08-28 sora-2, 2025-10-06 o3-deep-research, 2025-06-26 gpt-4o-transcribe-diarize, 2025-10-15
Austrálie - východ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Jižní Brazílie - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
kanadacentral - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
východní Kanada - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
centrálus - - - - - - - - - - - - - - - - - - - - - - -
Eastus - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
eastus2 -
franciecentral - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Německo – středozápad - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
itálie sever - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
japaneast - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
koreacentral - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
northcentralus - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Norsko – východ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
polskocentral - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Jižní Afrika – sever - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
southcentralus - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
southeastasia - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Jižní Indie - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
spaincentral - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Sweden Central - - -
Švýcarsko – sever - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
switzerlandwest - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
uaenorth - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
uksouth - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
západní evropa - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
westus - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
westus3 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

Poznámka:

o3-deep-research je aktuálně k dispozici pouze se službou Foundry Agent Service. Další informace najdete v doprovodných materiálech k nástroji hloubkového výzkumu.

Tato tabulka neobsahuje podrobné informace o dostupnosti v jednotlivých oblastech. Informace najdete v části o dolaďování.

Standardní modely nasazení (regionální) podle koncového bodu

Dokončení chatu

Oblast o1-preview, 2024-09-12 o1-mini, 2024-09-12 gpt-4o, 2024-05-13 gpt-4o, 2024-11-20 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4, turbo-2024-04-09 gpt-35-turbo, 1106 gpt-35-turbo, 0125
Austrálie - východ - - - - - -
východní Kanada - - - - - -
Eastus -
eastus2 -
franciecentral - - - - - -
japaneast - - - - - - -
northcentralus -
Norsko – východ - - - - - - - -
southcentralus -
Jižní Indie - - - - - -
Sweden Central
Švýcarsko – sever - - - - - - -
uksouth - - - - - -
západní evropa - - - - - - - -
westus
westus3 -

Poznámka:

o1-mini je aktuálně k dispozici pro všechny zákazníky pro globální nasazení standardu.

Vybraným zákazníkům byl udělen standardní (regionální) přístup k nasazení o1-mini jako součást omezeného přístupu o1-preview. V současné době se přístup ke standardním o1-mini (regionálním) nasazením nerozbaluje.

Další informace o tom, jak Azure OpenAI zpracovává upgrady verzí modelu, najdete v tématu Verze modelu. Informace o zobrazení a konfiguraci nastavení verze modelu nasazení GPT-3.5 Turbo najdete v tématu Práce s modely.

Jemné ladění modelů

Poznámka:

Podporované oblasti pro vyladění se můžou lišit, pokud používáte modely Azure OpenAI v projektu Microsoft Foundry oproti mimo projekt.

ID modelu Standardní oblasti trénování Globální školení Maximální počet požadavků (tokeny) Trénovací data (až do) Modality
gpt-4o-mini
(2024-07-18)
USA – středosever
Švédsko – střed
Vstup: 128 000
Výstup: 16 384
Délka kontextu příkladu trénování: 65 536
říjen 2023 Text na text
gpt-4o
(2024-08-06)
Východ USA 2
USA – středosever
Švédsko – střed
Vstup: 128 000
Výstup: 16 384
Délka kontextu příkladu trénování: 65 536
říjen 2023 Text a zpracování obrazu na text
gpt-4.1
(2025-04-14)
USA – středosever
Švédsko – střed
Vstup: 128 000
Výstup: 16 384
Délka kontextu příkladu trénování: 65 536
Květen 2024 Text a zpracování obrazu na text
gpt-4.1-mini
(2025-04-14)
USA – středosever
Švédsko – střed
Vstup: 128 000
Výstup: 16 384
Délka kontextu příkladu trénování: 65 536
Květen 2024 Text na text
gpt-4.1-nano (2025-04-14) USA – středosever
Švédsko – střed
Vstup: 128 000
Výstup: 16 384
Délka kontextu příkladu trénování: 32 768
Květen 2024 Text na text
o4-mini
(2025-04-16)
Východ USA 2
Švédsko – střed
- Vstup: 128 000
Výstup: 16 384
Délka kontextu příkladu trénování: 65 536
Květen 2024 Text na text

Poznámka:

Globální trénování poskytuje cenově dostupné trénování na token, ale nenabízí rezidenci dat. Prostředky Azure OpenAI jsou aktuálně dostupné v následujících oblastech:

  • Austrálie – východ
  • Brazílie – jih
  • Kanada – střed
  • Kanada – východ
  • USA – východ​
  • Východní USA 2
  • Francie – střed
  • Německo – středozápad
  • Itálie – sever
  • Japonsko – východ (bez podpory zraku)
  • Korea – střed
  • Střed USA – sever
  • Norsko – východ
  • Polsko – střed (bez podpory 4.1-nano)
  • Jihovýchodní Asie
  • Jižní Afrika – sever
  • Střed USA – jih
  • Indie – jih
  • Španělsko – střed
  • Švédsko – střed
  • Švýcarsko – západ
  • Švýcarsko – sever
  • Velká Británie – jih
  • Západní Evropa
  • USA – západ
  • Západ USA3

Asistenti (Preview)

Pro asistenty potřebujete kombinaci podporovaného modelu a podporované oblasti. Některé nástroje a možnosti vyžadují nejnovější modely. Následující modely jsou k dispozici v rozhraní API asistentů, sadě SDK a Foundry. Následující tabulka je určená pro standardní nasazení. Informace o dostupnosti zřízených jednotek propustnosti najdete v tématu Zřízená propustnost. Uvedené modely a oblasti je možné použít s asistenty v1 i v2. Pokud jsou podporované v následujících oblastech, můžete použít modely Global Standard .

Región gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Ukázka gpt-4, turbo-2024-04-09 gpt-4-32k, 0613 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613
Austrálie - východ - - - - -
Eastus - - - -
eastus2 - - - -
franciecentral - - - - - -
japaneast - - - - - - - - -
Norsko – východ - - - - - - - - - - -
Jižní Indie - - - - - - - - -
Sweden Central - -
uksouth - - - - - -
westus - - - - -
westus3 - - - - - -

Vyřazení modelu z provozu

Nejnovější informace o vyřazení modelů najdete v průvodci vyřazení modelů.

Poznámka:

Modely Foundry prodané přímo v Azure zahrnují také všechny modely Azure OpenAI. Pokud se chcete o těchto modelech dozvědět víc, přejděte na kolekci modelů Azure OpenAI v horní části tohoto článku.

Modely Black Forest Labs prodávané přímo v Azure

Kolekce BFL (Black Forest Labs) modelů generování obrázků zahrnuje FLUX.1 Kontext [pro] pro generování v kontextu a úpravy a FLUX1.1 [pro] pro generování textu na image.

Tyto modely můžete spouštět prostřednictvím rozhraní API poskytovatele služeb BFL a prostřednictvím koncových bodů obrázků/generování a obrázků/úprav.

Model Typ a koncový bod rozhraní API Capabilities Typ nasazení (dostupnost oblastí) Typ projektu
FLUX.1-Kontext-pro Generování obrázků
- Rozhraní API pro obrázky: https://<resource-name>/openai/deployments/{deployment-id}/images/generations
a
https://<resource-name>/openai/deployments/{deployment-id}/images/edits

- Rozhraní API poskytovatele služeb BFL: <resource-name>/providers/blackforestlabs/v1/flux-kontext-pro?api-version=preview
- Vstup: text a obrázek (5 000 tokenů a 1 obrázek)
- Výstup: Jeden obrázek
- Vyvolání nástrojů: Ne
- Formáty odpovědí: Obrázek (PNG a JPG)
- Klíčové funkce: Konzistence znaků, pokročilé úpravy
- Další parametry:(Pouze rozhraní API specifické pro zprostředkovatele)seed, aspect ratio, input_image, prompt_unsampling, safety_tolerance, output_format
– Globální standard (všechny oblasti) Foundry, založená na centru
FLUX-1.1-pro Generování obrázků
- Rozhraní API pro obrázky: https://<resource-name>/openai/deployments/{deployment-id}/images/generations

- Rozhraní API poskytovatele služeb BFL: <resource-name>/providers/blackforestlabs/v1/flux-pro-1.1?api-version=preview
- Vstup: text (5 000 tokenů a 1 obrázek)
- Výstup: Jeden obrázek
- Vyvolání nástrojů: Ne
- Formáty odpovědí: Obrázek (PNG a JPG)
- Klíčové funkce: Rychlé odvozování, silné dodržování pokynů, konkurenční ceny, škálovatelnost generování
- Další parametry:(Pouze rozhraní API specifické pro zprostředkovatele)width, height, prompt_unsampling, seed, safety_tolerance, output_format
– Globální standard (všechny oblasti) Foundry, založená na centru
Model Typ a koncový bod rozhraní API Capabilities Typ nasazení (dostupnost oblastí)
FLUX.1-Kontext-pro Generování obrázků
- Rozhraní API pro obrázky: https://<resource-name>/openai/deployments/{deployment-id}/images/generations
a
https://<resource-name>/openai/deployments/{deployment-id}/images/edits

- Rozhraní API poskytovatele služeb BFL: <resource-name>/providers/blackforestlabs/v1/flux-kontext-pro?api-version=preview
- Vstup: text a obrázek (5 000 tokenů a 1 obrázek)
- Výstup: Jeden obrázek
- Vyvolání nástrojů: Ne
- Formáty odpovědí: Obrázek (PNG a JPG)
- Klíčové funkce: Konzistence znaků, pokročilé úpravy
- Další parametry:(Pouze rozhraní API specifické pro zprostředkovatele)seed, aspect ratio, input_image, prompt_unsampling, safety_tolerance, output_format
– Globální standard (všechny oblasti)
FLUX-1.1-pro Generování obrázků
- Rozhraní API pro obrázky: https://<resource-name>/openai/deployments/{deployment-id}/images/generations

- Rozhraní API poskytovatele služeb BFL: <resource-name>/providers/blackforestlabs/v1/flux-pro-1.1?api-version=preview
- Vstup: text (5 000 tokenů a 1 obrázek)
- Výstup: Jeden obrázek
- Vyvolání nástrojů: Ne
- Formáty odpovědí: Obrázek (PNG a JPG)
- Klíčové funkce: Rychlé odvozování, silné dodržování pokynů, konkurenční ceny, škálovatelnost generování
- Další parametry:(Pouze rozhraní API specifické pro zprostředkovatele)width, height, prompt_unsampling, seed, safety_tolerance, output_format
– Globální standard (všechny oblasti)

Podívejte se na tuto kolekci modelů na portálu Microsoft Foundry.

Modely cohere prodané přímo v Azure

Řada modelů Cohere zahrnuje různé modely optimalizované pro různé případy použití, včetně dokončování chatu a vkládání. Modely cohere jsou optimalizované pro různé případy použití, mezi které patří odůvodnění, shrnutí a odpovědi na otázky.

Model Typ Capabilities Typ nasazení (dostupnost oblastí) Typ projektu
Cohere-command-a chat-completion - Vstup: text (131 072 tokenů)
- Výstup: text (8 182 tokenů)
- Jazyky:en, fr, es, , itde, pt-brja, , ko, , zh-cnaar
- Volání nástroje: Ano
- Formáty odpovědí: Text, JSON
– Globální standard (všechny oblasti) Foundry, založená na centru
embed-v-4-0 embeddings - Vstup: text (512 tokenů) a obrázky (2MM pixely)
- Výstup: Vektor (256, 512, 1024, 1536 rozměry.)
- Jazyky:en, fr, es, , itde, pt-brja, , ko, , zh-cnaar
– Globální standard (všechny oblasti) Foundry, založená na centru
Model Typ Capabilities Typ nasazení (dostupnost oblastí)
Cohere-command-a chat-completion - Vstup: text (131 072 tokenů)
- Výstup: text (8 182 tokenů)
- Jazyky:en, fr, es, , itde, pt-brja, , ko, , zh-cnaar
- Volání nástroje: Ano
- Formáty odpovědí: Text, JSON
– Globální standard (všechny oblasti)
embed-v-4-0 embeddings - Vstup: text (512 tokenů) a obrázky (2MM pixely)
- Výstup: Vektor (256, 512, 1024, 1536 rozměry.)
- Jazyky:en, fr, es, , itde, pt-brja, , ko, , zh-cnaar
– Globální standard (všechny oblasti)

Podívejte se na kolekci modelů Cohere na portálu Foundry.

Modely DeepSeek prodávané přímo v Azure

Řada modelů DeepSeek zahrnuje DeepSeek-R1, která exceluje při odůvodnění úkolů pomocí podrobného trénovacího procesu, jako je jazyk, vědecké odůvodnění a programovací úkoly.

Model Typ Capabilities Typ nasazení (dostupnost oblastí) Typ projektu
DeepSeek-V3.1 chat-completion
(s odůvodněním obsahu)
- Vstup: text (131 072 tokenů)
- Výstup: (131 072 tokenů)
- Jazyky:en a zh
- Volání nástroje: Ano
- Formáty odpovědí: Text, JSON
– Globální standard (všechny oblasti) Foundry, založená na centru
DeepSeek-R1-0528 chat-completion
(s odůvodněním obsahu)
- Vstup: text (163 840 tokenů)
- Výstup: (163 840 tokenů)
- Jazyky:en a zh
- Vyvolání nástrojů: Ne
- Formáty odpovědí: Text.
– Globální standard (všechny oblasti)
– Globální zřizování (všechny oblasti)
Foundry, založená na centru
DeepSeek-V3-0324 chat-completion - Vstup: text (131 072 tokenů)
- Výstup: (131 072 tokenů)
- Jazyky:en a zh
- Volání nástroje: Ano
- Formáty odpovědí: Text, JSON
– Globální standard (všechny oblasti)
– Globální zřizování (všechny oblasti)
Foundry, založená na centru
DeepSeek-R1 chat-completion
(s odůvodněním obsahu)
- Vstup: text (163 840 tokenů)
- Výstup: (163 840 tokenů)
- Jazyky:en a zh
- Vyvolání nástrojů: Ne
- Formáty odpovědí: Text.
– Globální standard (všechny oblasti)
– Globální zřizování (všechny oblasti)
Foundry, založená na centru
Model Typ Capabilities Typ nasazení (dostupnost oblastí)
DeepSeek-V3.1 chat-completion
(s odůvodněním obsahu)
- Vstup: text (131 072 tokenů)
- Výstup: (131 072 tokenů)
- Jazyky:en a zh
- Volání nástroje: Ano
- Formáty odpovědí: Text, JSON
– Globální standard (všechny oblasti)
DeepSeek-R1-0528 chat-completion
(s odůvodněním obsahu)
- Vstup: text (163 840 tokenů)
- Výstup: (163 840 tokenů)
- Jazyky:en a zh
- Vyvolání nástrojů: Ne
- Formáty odpovědí: Text.
– Globální standard (všechny oblasti)
– Globální zřizování (všechny oblasti)
DeepSeek-V3-0324 chat-completion - Vstup: text (131 072 tokenů)
- Výstup: (131 072 tokenů)
- Jazyky:en a zh
- Volání nástroje: Ano
- Formáty odpovědí: Text, JSON
– Globální standard (všechny oblasti)
– Globální zřizování (všechny oblasti)
DeepSeek-R1 chat-completion
(s odůvodněním obsahu)
- Vstup: text (163 840 tokenů)
- Výstup: (163 840 tokenů)
- Jazyky:en a zh
- Vyvolání nástrojů: Ne
- Formáty odpovědí: Text.
– Globální standard (všechny oblasti)
– Globální zřizování (všechny oblasti)

Podívejte se na tuto kolekci modelů na portálu Foundry.

Meta modely prodané přímo v Azure

Modely a nástroje Meta Llama představují kolekci předem natrénovaných a vyladěných generativních modelů AI pro zpracování textu a obrazů. Rozsah metamodelů ve velkém měřítku, který zahrnuje:

  • Malé jazykové modely (SLM), jako jsou 1B a 3B Base a Instruct modely, pro odvozování na zařízení a edge computing.
  • Středně velké jazykové modely (LLM), jako jsou 7B, 8B a 70B Base a Instruct modely.
  • Vysoce výkonné modely, jako je Meta Llama 3.1-405B, instrukci pro syntetické generování dat a případy použití destilační.
Model Typ Capabilities Typ nasazení (dostupnost oblastí) Typ projektu
Llama-4-Maverick-17B-128E-Instruct-FP8 chat-completion - Vstup: text a obrázky (tokeny 1M)
- Výstup: text (1M tokenů)
- Jazyky:ar, en, , fr, de, hiid, itpt, es, tl, , thavi
- Vyvolání nástrojů: Ne
- Formáty odpovědí: Text
– Globální standard (všechny oblasti) Foundry, založená na centru
Llama-3.3-70B-Instruct chat-completion - Vstup: text (128 000 token)
- Výstup: text (8 192 tokenů)
- Jazyky:en, de, fr, it, pt, hi, , es, a th
- Vyvolání nástrojů: Ne
- Formáty odpovědí: Text
– Globální standard (všechny oblasti) Foundry, založená na centru
Model Typ Capabilities Typ nasazení (dostupnost oblastí)
Llama-4-Maverick-17B-128E-Instruct-FP8 chat-completion - Vstup: text a obrázky (tokeny 1M)
- Výstup: text (1M tokenů)
- Jazyky:ar, en, , fr, de, hiid, itpt, es, tl, , thavi
- Vyvolání nástrojů: Ne
- Formáty odpovědí: Text
– Globální standard (všechny oblasti)
Llama-3.3-70B-Instruct chat-completion - Vstup: text (128 000 token)
- Výstup: text (8 192 tokenů)
- Jazyky:en, de, fr, it, pt, hi, , es, a th
- Vyvolání nástrojů: Ne
- Formáty odpovědí: Text
– Globální standard (všechny oblasti)

Podívejte se na tuto kolekci modelů na portálu Foundry. Můžete také najít několik meta modelů dostupných od partnerů a komunity.

Modely Microsoftu prodané přímo v Azure

Modely Microsoftu zahrnují různé skupiny modelů, jako jsou modelový směrovač, modely MAI, modely Phi, modely AI pro zdravotnictví a další. Podívejte se na kolekci modelů Microsoftu na portálu Foundry. Můžete také najít několik modelů Microsoftu dostupných od partnerů a komunity.

Model Typ Capabilities Typ nasazení (dostupnost oblastí) Typ projektu
model-router1 chat-completion Další podrobnosti najdete v přehledu modelového směrovače.
- Vstup: text, obrázek
- Výstup: text (maximální počet výstupních tokenů se liší2)
Kontextové okno: 200 0003
- Jazyky:en
– globální standard (USA – východ 2, Švédsko – střed)
– Datová zóna standard4 (USA – východ 2, Švédsko – střed)
Foundry, založená na centru
MAI-DS-R1 chat-completion
(s odůvodněním obsahu)
- Vstup: text (163 840 tokenů)
- Výstup: (163 840 tokenů)
- Jazyky:en a zh
- Vyvolání nástrojů: Ne
- Formáty odpovědí: Text.
– Globální standard (všechny oblasti) Foundry, založená na centru
Model Typ Capabilities Typ nasazení (dostupnost oblastí)
model-router1 chat-completion Další podrobnosti najdete v přehledu modelového směrovače.
- Vstup: text, obrázek
- Výstup: text (maximální počet výstupních tokenů se liší2)
Kontextové okno: 200 0003
- Jazyky:en
– globální standard (USA – východ 2, Švédsko – střed)
– Datová zóna standard4 (USA – východ 2, Švédsko – střed)
MAI-DS-R1 chat-completion
(s odůvodněním obsahu)
- Vstup: text (163 840 tokenů)
- Výstup: (163 840 tokenů)
- Jazyky:en a zh
- Vyvolání nástrojů: Ne
- Formáty odpovědí: Text.
– Globální standard (všechny oblasti)

1Modelová verze směrovače2025-11-18. K dispozici jsou také starší verze (2025-08-07 a 2025-05-19).

2Maximální počet výstupních tokenů se u podkladových modelů ve směrovači modelu liší. Například 32 768 (GPT-4.1 series), 100 000 (o4-mini), 128 000 (gpt-5 reasoning models) a 16 384 (gpt-5-chat).

3 Větší kontextová okna jsou kompatibilní s některými podkladovými modely směrovače modelů. To znamená, že volání rozhraní API s větším kontextem proběhne úspěšně pouze v případě, že se výzva přesměruje na jeden z těchto modelů. Jinak volání selže.

4 Fakturace nasazení směrovačů modelu Data Zone Standard začíná nejdříve 1. listopadu 2025.

Modely Mistral prodávané přímo v Azure

Model Typ Capabilities Typ nasazení (dostupnost oblastí) Typ projektu
Mistral-Large-3 chat-completion - Vstup: text, obrázek
- Výstup: text
- Jazyky:en, fr, , de, es, itptnlzh, a jakoar
- Volání nástroje: Ano
- Formáty odpovědí: Text, JSON
– globální standard (USA – západ 3) Slévárna
mistral-document-ai-2505 Obrázek na text - Vstup: obrázek nebo stránky PDF (30 stránek, max. 30 MB PDF soubor)
- Výstup: text
- Jazyky:en
- Volání nástrojů: ne
- Formáty odpovědí: Text, JSON, Markdown
– Globální standard (všechny oblasti)
- Standard datové zóny (USA a EU)
Slévárna
Model Typ Capabilities Typ nasazení (dostupnost oblastí)
Mistral-Large-3 chat-completion - Vstup: text, obrázek
- Výstup: text
- Jazyky:en, fr, , de, es, itptnlzh, a jakoar
- Volání nástroje: Ano
- Formáty odpovědí: Text, JSON
– globální standard (USA – západ 3)
mistral-document-ai-2505 Obrázek na text - Vstup: obrázek nebo stránky PDF (30 stránek, max. 30 MB PDF soubor)
- Výstup: text
- Jazyky:en
- Volání nástrojů: ne
- Formáty odpovědí: Text, JSON, Markdown
– Globální standard (všechny oblasti)
- Standard datové zóny (USA a EU)

Podívejte se na kolekci modelů Mistral na portálu Foundry. K dispozici je také několik modelů Mistral od partnerů a komunity.

Modely xAI prodané přímo v Azure

Grokové modely xAI v modelech Foundry zahrnují různorodou sadu modelů navržených pro vynikání v různých podnikových doménách s různými schopnostmi a cenovými kategoriemi, mezi které patří:

  • Grok 3, nerozumový model předem natrénovaný datovým centrem Colossus, je přizpůsobený pro obchodní využití, jako je extrakce dat, kódování a shrnutí textu, s výjimečnou schopností dodržovat instrukce. Podporuje kontextové okno o velikosti 131 072 tokenů, které umožňuje zpracovávat rozsáhlé vstupy při zachování koherence a hloubky, a je schopný navazovat spojení napříč doménami a jazyky.

  • Grok 3 Mini je jednoduchý model, který je natrénovaný tak, aby se zabýval agentickými, programovacími, matematickými a hlubokými vědeckými problémy s výpočetními prostředky v době testování. Podporuje také kontextové okno 131 072 tokenů pro pochopení kódové základny a podnikových dokumentů, exceluje při použití nástrojů k řešení složitých logických problémů v nových prostředích a nabízí neopracované záznamy ke kontrole uživateli s úpravou myšlenkových rozpočtů.

  • Grok Code Fast 1, rychlý a efektivní model odůvodnění navržený pro použití v aplikacích pro kódování agentů. Byla předem natrénována na kombinaci dat zaměřených na kódování, poté byla dále zdokonalena ukázkami různých programovacích úloh a použití nástrojů, stejně jako ukázkami správného odmítavého chování na základě bezpečnostní politiky xAI. Pro přístup k modelu grok-code-fast-1 se vyžaduje registrace.

  • Grok 4 Fast, model jazyka optimalizovaný pro efektivitu, který poskytuje téměř Grok 4 možnosti odůvodnění s výrazně nižší latencí a náklady, a může obejít důvody zcela pro ultra-rychlé aplikace. Je navržen pro bezpečné a efektivní použití nástrojů, s integrovaným chováním odmítnutí, pevně definovanou systémovou bezpečnostní výzvou a vstupními filtry, které slouží k zamezení zneužití.

  • Grok 4 je nejnovější model z xAI s pokročilými možnostmi zdůvodňování a používání nástrojů, který umožňuje dosáhnout nového špičkového výkonu napříč náročnými akademickými a oborovými srovnávacími testy. Pro přístup k modelu grok-4 se vyžaduje registrace.

Model Typ Capabilities Typ nasazení (dostupnost oblastí) Typ projektu
grok-4 chat-completion - Vstup: text, obrázek (256 000 tokenů)
- Výstup: text (8 192 tokenů)
- Jazyky:en
- Volání nástrojů: ano
- Formáty odpovědí: text
– Globální standard (všechny oblasti) Foundry, založená na centru
grok-4-fast-reasoning chat-completion - Vstup: text, obrázek (2 000 000 tokenů)
- Výstup: text (2 000 000 tokenů)
- Jazyky:en
- Volání nástrojů: ano
- Formáty odpovědí: text
– Globální standard (všechny oblasti)
– Standard datové zóny (USA)
Foundry, založená na centru
grok-4-fast-non-reasoning chat-completion - Vstup: text, obrázek (2 000 000 tokenů)
- Výstup: text (2 000 000 tokenů)
- Jazyky:en
- Volání nástrojů: ano
- Formáty odpovědí: text
– Globální standard (všechny oblasti)
– Standard datové zóny (USA)
Foundry, založená na centru
grok-code-fast-1 chat-completion - Vstup: text (256 000 tokenů)
- Výstup: text (8 192 tokenů)
- Jazyky:en
- Volání nástrojů: ano
- Formáty odpovědí: text
– Globální standard (všechny oblasti) Foundry, založená na centru
grok-3 chat-completion - Vstup: text (131 072 tokenů)
- Výstup: text (131 072 tokenů)
- Jazyky:en
- Volání nástrojů: ano
- Formáty odpovědí: text
– Globální standard (všechny oblasti)
– Standard datové zóny (USA)
Foundry, založená na centru
grok-3-mini chat-completion - Vstup: text (131 072 tokenů)
- Výstup: text (131 072 tokenů)
- Jazyky:en
- Volání nástrojů: ano
- Formáty odpovědí: text
– Globální standard (všechny oblasti)
– Standard datové zóny (USA)
Foundry, založená na centru
Model Typ Capabilities Typ nasazení (dostupnost oblastí)
grok-4 chat-completion - Vstup: text, obrázek (256 000 tokenů)
- Výstup: text (8 192 tokenů)
- Jazyky:en
- Volání nástrojů: ano
- Formáty odpovědí: text
– Globální standard (všechny oblasti)
grok-4-fast-reasoning chat-completion - Vstup: text, obrázek (2 000 000 tokenů)
- Výstup: text (2 000 000 tokenů)
- Jazyky:en
- Volání nástrojů: ano
- Formáty odpovědí: text
– Globální standard (všechny oblasti)
– Standard datové zóny (USA)
grok-4-fast-non-reasoning chat-completion - Vstup: text, obrázek (2 000 000 tokenů)
- Výstup: text (2 000 000 tokenů)
- Jazyky:en
- Volání nástrojů: ano
- Formáty odpovědí: text
– Globální standard (všechny oblasti)
– Standard datové zóny (USA)
grok-code-fast-1 chat-completion - Vstup: text (256 000 tokenů)
- Výstup: text (8 192 tokenů)
- Jazyky:en
- Volání nástrojů: ano
- Formáty odpovědí: text
– Globální standard (všechny oblasti)
grok-3 chat-completion - Vstup: text (131 072 tokenů)
- Výstup: text (131 072 tokenů)
- Jazyky:en
- Volání nástrojů: ano
- Formáty odpovědí: text
– Globální standard (všechny oblasti)
– Standard datové zóny (USA)
grok-3-mini chat-completion - Vstup: text (131 072 tokenů)
- Výstup: text (131 072 tokenů)
- Jazyky:en
- Volání nástrojů: ano
- Formáty odpovědí: text
– Globální standard (všechny oblasti)
– Standard datové zóny (USA)

Podívejte se na kolekci modelů xAI na portálu Foundry.

Dostupnost oblasti modelu podle typu nasazení

Foundry Models nabízí volby pro strukturu hostování, která odpovídá vašim obchodním vzorům a vzorům použití. Služba nabízí dva hlavní typy nasazení:

  • Standard: Má globální možnost nasazení, směrování provozu globálně za účelem zajištění vyšší propustnosti.
  • Provisioned: Má také možnost nasazení na globální úrovni, což umožňuje zakoupit a nasadit zřízené jednotky propustnosti v rámci globální infrastruktury Azure.

Všechna nasazení provádějí stejné prediktivní výpočty, ale fakturace, škálování a výkon se liší. Další informace o typech nasazení najdete v tématu Typy nasazení v modelech Foundry.

Globální dostupnost modelu Standard

Oblast DeepSeek-R1-0528 DeepSeek-R1 DeepSeek-V3-0324 DeepSeek-V3.1 FLUX.1-Kontext-pro FLUX-1.1-pro grok-4 grok-4-fast-reasoning grok-4-fast-non-reasoning grok-code-fast-1 grok-3 grok-3-mini Llama-4-Maverick-17B-128E-Instruct-FP8 Llama-3.3-70B-Instruct MAI-DS-R1 mistral-document-ai-2505
Austrálie - východ
Jižní Brazílie
východní Kanada
Eastus
eastus2
franciecentral
Německo – středozápad
itálie sever
japaneast
koreacentral
northcentralus
Norsko – východ
polskocentral
Jižní Afrika – sever
southcentralus
Jižní Indie
spaincentral
Sweden Central
Švýcarsko – sever
switzerlandwest
uaenorth
uksouth
západní evropa
westus
westus3

Otevřené a přizpůsobené modely

Katalog modelů nabízí větší výběr modelů od širší škály poskytovatelů. U těchto modelů nemůžete použít možnost pro standardní nasazení v prostředcích Microsoft Foundry, kde se modely poskytují jako rozhraní API. Místo toho můžete tyto modely nasadit tak, že je budete muset hostovat ve vaší infrastruktuře, vytvořit centrum AI a poskytnout základní kvótu výpočetních prostředků pro hostování modelů.

Kromě toho můžou být tyto modely chráněné otevřeným přístupem nebo IP ochranou. V obou případech je musíte nasadit do nabídek spravovaných výpočetních prostředků v Foundry. Pokud chcete začít, přečtěte si článek Postupy: Nasazení do spravovaného výpočetního prostředí.