Megosztás:


Közvetlenül az Azure által értékesített öntödei modellek

Megjegyzés:

Ez a dokumentum a Microsoft Foundry (klasszikus) portálra hivatkozik.

🔄Ha az új portált használja, váltson a Microsoft Foundry (új) dokumentációra.

Megjegyzés:

Ez a dokumentum a Microsoft Foundry (új) portálra hivatkozik.

Ez a cikk az Azure által közvetlenül értékesített Microsoft Foundry-modelleket, valamint azok képességeit, üzembe helyezési típusait és rendelkezésre állási régióit sorolja fel, kivéve az elavult és örökölt modelleket. Az Foundry Agent Service által támogatott Azure OpenAI-modellek listájának megtekintéséhez tekintse meg az Agent Service által támogatott modelleket.

A közvetlenül az Azure által értékesített modellek közé tartozik az összes Azure OpenAI-modell és a legjobb szolgáltatóktól származó konkrét, kiválasztott modellek.

A Microsoft Foundryben használt projekt típusától függően különböző modelleket láthat. Pontosabban, ha egy Foundry-erőforrásra épülő Foundry-projektet használ, láthatja azokat a modelleket, amelyek szabványos üzembe helyezéshez érhetők el egy Foundry-erőforrásban. Másik lehetőségként, ha egy Foundry-központ által üzemeltetett központi projektet használ, olyan modelleket láthat, amelyek a felügyelt számítási és kiszolgáló nélküli API-k üzembe helyezéséhez érhetők el. Ezek a modellkijelölések gyakran átfedésben vannak, mivel számos modell több üzembe helyezési lehetőséget is támogat.

Az Foundry modellek elérhetők szabványos üzembe helyezéshez egy Foundry-erőforrásban.

A közvetlenül az Azure által értékesített Öntödei modellek attribútumairól további információt az Öntödei modellek felfedezése című témakörben talál.

Megjegyzés:

A közvetlenül az Azure által értékesített öntödei modellek a legnépszerűbb modellszolgáltatóktól származó modelleket is tartalmazzák, például:

  • Black Forest Labs: FLUX.2-pro, FLUX.1-Kontext-pro, FLUX-1.1-pro
  • Összetartó: Cohere-command-a, embed-v-4-0, Cohere-rerank-v4.0-pro, Cohere-rerank-v4.0-fast
  • DeepSeek: DeepSeek-V3.2, DeepSeek-V3.2-Speciale, DeepSeek-V3.1, DeepSeek-V3-0324, DeepSeek-R1-0528DeepSeek-R1
  • Moonshot AI: Kimi-K2-Thinking
  • Meta: Llama-4-Maverick-17B-128E-Instruct-FP8, Llama-3.3-70B-Instruct
  • Microsoft: MAI-DS-R1, model-router
  • Mistral: mistral-document-ai-2505, Mistral-Large-3
  • xAI: grok-code-fast-1, grok-3, grok-3-mini, grok-4-fast-reasoning, grok-4-fast-non-reasoninggrok-4

Ezeknek a modelleknek a megismeréséhez váltson a cikk tetején található Egyéb modellgyűjteményekre .

Azure OpenAI a Microsoft Foundry-modellekben

Az Azure OpenAI-t különböző képességekkel és árpontokkal rendelkező modellek széles halmaza működteti. A modell rendelkezésre állása régiónként és felhőnként eltérő. Az Azure Government-modell elérhetőségéről az Azure OpenAI-ban tájékozódhat az Azure Governmentben.

Models Description
GPT-5.2 sorozat ÚJgpt-5.2-codex, gpt-5.2, gpt-5.2-chat (előzetes verzió)
GPT-5.1 sorozat ÚJgpt-5.1, gpt-5.1-chat, , gpt-5.1-codexgpt-5.1-codex-mini
Sora ÚJ szóra-2
GPT-5 sorozat gpt-5, gpt-5-mini, gpt-5-nano, gpt-5-chat
gpt-oss nyílt súlyú érvelési modellek
codex-mini Az o4-mini finomhangolt verziója.
GPT-4.1 sorozat gpt-4.1, gpt-4.1-mini, gpt-4.1-nano
computer-use-preview Kísérleti modell, amely a Responses API számítógép-használati eszközével való használatra van betanítve.
o-sorozatú modellek Érvelési modellek fejlett problémamegoldással és nagyobb összpontosítással és képességgel.
GPT-4o, GPT-4o mini és GPT-4 Turbo Képes Azure OpenAI-modellek multimodális verziókkal, amelyek bemenetként szöveget és képeket is elfogadnak.
Embeddings Olyan modellek készlete, amelyek a szöveg numerikus vektorformává alakíthatók a szöveg hasonlóságának megkönnyítése érdekében.
Képgenerálás Olyan modellek sorozata, amelyek eredeti képeket hozhatnak létre természetes nyelvről.
Video generation Olyan modell, amely szöveges utasításokból képes eredeti videojeleneteket létrehozni.
Hanganyag A beszédről szövegre, fordításra és szövegről beszédre történő (át)alakítás modellek sorozata. A GPT-4o hangmodellek támogatják az alacsony késleltetésű beszéd be, beszéd ki beszélgetési interakciókat vagy a hanggenerálást.

GPT-5.2

Régiónkénti elérhetőség

Model Régió
gpt-5.2 Tekintse meg a modellek táblázatát.
gpt-5.2-chat Tekintse meg a modellek táblázatát.
gpt-5.2-codex USA 2. keleti régiója – Svédország középső régiója (globális szabvány)

A hozzáférés a Microsoft jogosultsági feltételei alapján lesz megadva. Azok az ügyfelek, akik korábban korlátozott hozzáférési modellhez alkalmaztak és kaptak hozzáférést, nem kell újból alkalmazniuk, mivel a jóváhagyott előfizetéseik automatikusan hozzáférést kapnak a modell megjelenésekor.

Modellazonosító Description Kontextus ablak Kimeneti elemek maximális száma Képzési adatok (legfeljebb)
gpt-5.2-codex (2026-01-14) - Érvelés
- Chat Completions API (csevegés befejezési API)
- Responses API.
- Strukturált kimenetek.
- Szöveg- és képfeldolgozás.
- Függvények, eszközök és párhuzamos eszközhívás.
- A képességek teljes összefoglalása.
- Codex CLI - Codex VS Code-bővítményhez optimalizálva
400,000

Bemenet: 272 000
Kimenet: 128 000
128,000
gpt-5.2 (2025-12-11) - Érvelés
- Chat Completions API (csevegés befejezési API)
- Responses API.
- Strukturált kimenetek.
- Szöveg- és képfeldolgozás.
- Függvények, eszközök és párhuzamos eszközhívás.
- A képességek teljes összefoglalása.
400,000

Bemenet: 272 000
Kimenet: 128 000
128,000 2025. augusztus
gpt-5.2-chat (2025-12-11)
Preview
- Chat Completions API (csevegés befejezési API)
- Responses API.
- Strukturált kimenetek
- Függvények, eszközök és párhuzamos eszközhívás.
128,000

Bemenet: 111 616
Kimenet: 16 384
16,384 2025. augusztus

Caution

Nem javasoljuk, hogy éles környezetben használjunk előzetes verziójú modelleket. Az előzetes modellek összes üzembe helyezését a jövőbeni előzetes verzióra vagy a legújabb stabil, általánosan elérhető verzióra frissítjük. Az előzetes verziójú modellek nem követik az Azure OpenAI-modell szokásos életciklusát.

GPT-5.1

Régiónkénti elérhetőség

Model Régió
gpt-5.1 Tekintse meg a modellek táblázatát.
gpt-5.1-chat Tekintse meg a modellek táblázatát.
gpt-5.1-codex Tekintse meg a modellek táblázatát.
gpt-5.1-codex-mini Tekintse meg a modellek táblázatát.
gpt-5.1-codex-max Tekintse meg a modellek táblázatát.

A hozzáférés a Microsoft jogosultsági feltételei alapján lesz megadva. Azok az ügyfelek, akik korábban korlátozott hozzáférési modellhez alkalmaztak és kaptak hozzáférést, nem kell újból alkalmazniuk, mivel a jóváhagyott előfizetéseik automatikusan hozzáférést kapnak a modell megjelenésekor.

Modellazonosító Description Kontextus ablak Kimeneti elemek maximális száma Képzési adatok (legfeljebb)
gpt-5.1 (2025-11-13) - Érvelés
- Chat Completions API (csevegés befejezési API)
- Responses API.
- Strukturált kimenetek.
- Szöveg- és képfeldolgozás.
- Függvények, eszközök és párhuzamos eszközhívás.
- A képességek teljes összefoglalása.
400,000

Bemenet: 272 000
Kimenet: 128 000
128,000 2024. szeptember 30.
gpt-5.1-chat (2025-11-13)
Preview
- Érvelés
- Chat Completions API (csevegés befejezési API)
- Responses API.
- Strukturált kimenetek
- Függvények, eszközök és párhuzamos eszközhívás.
128,000

Bemenet: 111 616
Kimenet: 16 384
16,384 2024. szeptember 30.
gpt-5.1-codex (2025-11-13) - Csak válasz API .
- Szöveg- és képfeldolgozás
- Strukturált kimenetek.
- Függvények, eszközök és párhuzamos eszközhívás.
- A képességek teljes összefoglalása
- Codex CLI - Codex VS Code-bővítményhez optimalizálva
400,000

Bemenet: 272 000
Kimenet: 128 000
128,000 2024. szeptember 30.
gpt-5.1-codex-mini (2025-11-13) - Csak válasz API .
- Szöveg- és képfeldolgozás
- Strukturált kimenetek.
- Szöveg- és képfeldolgozás.
- Függvények, eszközök és párhuzamos eszközhívás.
- A képességek teljes összefoglalása
- Codex CLI - Codex VS Code-bővítményhez optimalizálva
400,000

Bemenet: 272 000
Kimenet: 128 000
128,000 2024. szeptember 30.
gpt-5.1-codex-max (2025-12-04) - Csak válasz API .
- Szöveg- és képfeldolgozás
- Strukturált kimenetek.
- Szöveg- és képfeldolgozás.
- Függvények, eszközök és párhuzamos eszközhívás.
- A képességek teljes összefoglalása
- Codex CLI - Codex VS Code-bővítményhez optimalizálva
400,000

Bemenet: 272 000
Kimenet: 128 000
128,000 2024. szeptember 30.

Caution

Nem javasoljuk, hogy éles környezetben használjunk előzetes verziójú modelleket. Az előzetes modellek összes üzembe helyezését a jövőbeni előzetes verzióra vagy a legújabb stabil, általánosan elérhető verzióra frissítjük. Az előzetes verziójú modellek nem követik az Azure OpenAI-modell szokásos életciklusát.

Fontos

  • gpt-5.1 reasoning_effort alapértelmezett értéke none. A korábbi érvelési modellekről gpt-5.1 való frissítéskor ne feledje, hogy előfordulhat, hogy frissítenie kell a kódot annak érdekében, hogy kifejezetten átadjon egy adott reasoning_effort szintet, ha érvelést szeretne folytatni.

  • gpt-5.1-chat beépített érvelési képességeket ad hozzá. Más érvelési modellekhez hasonlóan ez sem támogatja az olyan paramétereket, mint a temperature. Ha a gpt-5-chat használatáról frissít a gpt-5.1-chat-re, ellenőrizze, hogy biztosan eltávolította a kódból az összes egyéni paramétert, például temperature-t, amelyeket az érvelési modellek nem támogatnak.

  • gpt-5.1-codex-max támogatja a reasoning_effort beállítását xhigh-re. Az érvelési erőfeszítés none nem támogatott a gpt-5.1-codex-max.

GPT-5

Régiónkénti elérhetőség

Model Régió
gpt-5 (2025-08-07) Tekintse meg a modellek táblázatát.
gpt-5-mini (2025-08-07) Tekintse meg a modellek táblázatát.
gpt-5-nano (2025-08-07) Tekintse meg a modellek táblázatát.
gpt-5-chat (2025-08-07) Tekintse meg a modellek táblázatát.
gpt-5-chat (2025-10-03) Tekintse meg a modellek táblázatát.
gpt-5-codex (2025-09-11) Tekintse meg a modellek táblázatát.
gpt-5-pro (2025-10-06) Tekintse meg a modellek táblázatát.

A hozzáférés a Microsoft jogosultsági feltételei alapján lesz megadva. Azok az ügyfelek, akik korábban alkalmazták és hozzáféréssel o3rendelkeztek, nem kell újból alkalmazniuk, mivel a jóváhagyott előfizetéseik automatikusan hozzáférést kapnak a modell megjelenésekor.

Modellazonosító Description Kontextus ablak Kimeneti elemek maximális száma Képzési adatok (legfeljebb)
gpt-5 (2025-08-07) - Érvelés
- Chat Completions API (csevegés befejezési API)
- Responses API.
- Strukturált kimenetek.
- Szöveg- és képfeldolgozás.
- Függvények, eszközök és párhuzamos eszközhívás.
- A képességek teljes összefoglalása.
400,000

Bemenet: 272 000
Kimenet: 128 000
128,000 2024. szeptember 30.
gpt-5-mini (2025-08-07) - Érvelés
- Chat Completions API (csevegés befejezési API)
- Responses API.
- Strukturált kimenetek.
- Szöveg- és képfeldolgozás.
- Függvények, eszközök és párhuzamos eszközhívás.
- A képességek teljes összefoglalása.
400,000

Bemenet: 272 000
Kimenet: 128 000
128,000 2024. május 31.
gpt-5-nano (2025-08-07) - Érvelés
- Chat Completions API (csevegés befejezési API)
- Responses API.
- Strukturált kimenetek.
- Szöveg- és képfeldolgozás.
- Függvények, eszközök és párhuzamos eszközhívás.
- A képességek teljes összefoglalása.
400,000

Bemenet: 272 000
Kimenet: 128 000
128,000 2024. május 31.
gpt-5-chat (2025-08-07)
Preview
- Chat Completions API (csevegés befejezési API)
- Responses API.
- Bemenet: Szöveg/kép
- Kimenet: Csak szöveg
128,000 16,384 2024. szeptember 30.
gpt-5-chat (2025-10-03)
Előnézet1
- Chat Completions API (csevegés befejezési API)
- Responses API.
- Bemenet: Szöveg/kép
- Kimenet: Csak szöveg
128,000 16,384 2024. szeptember 30.
gpt-5-codex (2025-09-11) - Csak válasz API .
- Bemenet: Szöveg/kép
- Kimenet: Csak szöveg
- Strukturált kimenetek.
- Szöveg- és képfeldolgozás.
- Függvények, eszközök és párhuzamos eszközhívás.
- A képességek teljes összefoglalása
- Codex CLI - Codex VS Code-bővítményhez optimalizálva
400,000

Bemenet: 272 000
Kimenet: 128 000
128,000 -
gpt-5-pro (2025-10-06) - Érvelés
- Responses API.
- Strukturált kimenetek.
- Szöveg- és képfeldolgozás.
- Függvények és eszközök
- A képességek teljes összefoglalása.
400,000

Bemenet: 272 000
Kimenet: 128 000
128,000 2024. szeptember 30.

Megjegyzés:

Az 1gpt-5-chat verzió 2025-10-03 jelentős fejlesztést vezet be az érzelmi intelligencia és a mentális egészség képességeire összpontosítva. Ez a frissítés speciális adatkészleteket és kifinomult válaszstratégiákat integrál a modell azon képességének javítása érdekében, hogy:

  • Az érzelmi környezet pontosabb megértése és értelmezése , ami árnyalt és empatikus interakciókat tesz lehetővé.
  • Támogató, felelős válaszok biztosítása a mentális egészséggel kapcsolatos beszélgetésekben, biztosítva az érzékenységet és az ajánlott eljárások betartását.

Ezek a fejlesztések célja, hogy a GPT-5 csevegés környezettudatosabb, emberközpontúbb és megbízhatóbb legyen olyan helyzetekben, ahol az érzelmi hangnem és a jóllét szempontjából kritikus szempontok állnak fenn.

Caution

Nem javasoljuk, hogy éles környezetben használjunk előzetes verziójú modelleket. Az előzetes modellek összes üzembe helyezését a jövőbeni előzetes verzióra vagy a legújabb stabil, általánosan elérhető verzióra frissítjük. Az előzetes verziójú modellek nem követik az Azure OpenAI-modell szokásos életciklusát.

gpt-oss

Régiónkénti elérhetőség

Model Régió
gpt-oss-120b Minden Azure OpenAI-régió

Capabilities

Modellazonosító Description Kontextus ablak Kimeneti elemek maximális száma Képzési adatok (legfeljebb)
gpt-oss-120b (előzetes verzió) – Csak szöveg/szöveg
- Csevegés befejezések API
-Streaming
- Függvényhívás
- Strukturált kimenetek
-Érvelés
- Elérhető az1. üzembe helyezéshez és a felügyelt számításon keresztül
131,072 131,072 2024. május 31.
gpt-oss-20b (előzetes verzió) – Csak szöveg/szöveg
- Csevegés befejezések API
-Streaming
- Függvényhívás
- Strukturált kimenetek
-Érvelés
- Felügyelt számítási és foundry local használatával érhető el
131,072 131,072 2024. május 31.

1 A többi Azure OpenAI-modelltől gpt-oss-120b eltérően a modell üzembe helyezéséhez egy Foundry-projekt szükséges.

Üzembe helyezés kóddal

az cognitiveservices account deployment create \
  --name "Foundry-project-resource" \
  --resource-group "test-rg" \
  --deployment-name "gpt-oss-120b" \
  --model-name "gpt-oss-120b" \
  --model-version "1" \
  --model-format "OpenAI-OSS" \
  --sku-capacity 10 \
  --sku-name "GlobalStandard"

GPT-4.1 sorozat

Régiónkénti elérhetőség

Model Régió
gpt-4.1 (2025-04-14) Tekintse meg a modellek táblázatát.
gpt-4.1-nano (2025-04-14) Tekintse meg a modellek táblázatát.
gpt-4.1-mini (2025-04-14) Tekintse meg a modellek táblázatát.

Capabilities

Fontos

Egy ismert probléma az összes GPT 4.1-es sorozatú modellt érinti. A 300 000 tokent meghaladó nagy méretű eszköz- vagy függvényhívás-definíciók hibákhoz vezetnek, annak ellenére, hogy a modellek 1 millió token környezeti korlátja nem érte el.

A hibák az API-hívástól és a mögöttes hasznos adatok jellemzőitől függően változhatnak.

A Csevegés befejezések API hibaüzenetei a következők:

  • Error code: 400 - {'error': {'message': "This model's maximum context length is 300000 tokens. However, your messages resulted in 350564 tokens (100 in the messages, 350464 in the functions). Please reduce the length of the messages or functions.", 'type': 'invalid_request_error', 'param': 'messages', 'code': 'context_length_exceeded'}}

  • Error code: 400 - {'error': {'message': "Invalid 'tools[0].function.description': string too long. Expected a string with maximum length 1048576, but got a string with length 2778531 instead.", 'type': 'invalid_request_error', 'param': 'tools[0].function.description', 'code': 'string_above_max_length'}}

A Válaszok API hibaüzenete:

  • Error code: 500 - {'error': {'message': 'The server had an error processing your request. Sorry about that! You can retry your request, or contact us through an Azure support request at: https://go.microsoft.com/fwlink/?linkid=2213926 if you keep seeing this error. (Please include the request ID d2008353-291d-428f-adc1-defb5d9fb109 in your email.)', 'type': 'server_error', 'param': None, 'code': None}}
Modellazonosító Description Környezeti ablak Kimeneti jogkivonatok maximális értéke Betanítási adatok (legfeljebb)
gpt-4.1 (2025-04-14) - Szöveg- és képbemenet
- Szövegkimenet
- Csevegés befejezések API
- Responses API
-Streaming
- Függvényhívás
- Strukturált kimenetek (csevegés befejezése)
- 1,047,576
- 128 000 (elkészített felügyelt telepítések)
- 300 000 (kötegelt üzembe helyezés)
32,768 2024. május 31.
gpt-4.1-nano (2025-04-14) - Szöveg- és képbemenet
- Szövegkimenet
- Csevegés befejezések API
- Responses API
-Streaming
- Függvényhívás
- Strukturált kimenetek (csevegés befejezése)
- 1,047,576
- 128 000 (elkészített felügyelt telepítések)
- 300 000 (kötegelt üzembe helyezés)
32,768 2024. május 31.
gpt-4.1-mini (2025-04-14) - Szöveg- és képbemenet
- Szövegkimenet
- Csevegés befejezések API
- Responses API
-Streaming
- Függvényhívás
- Strukturált kimenetek (csevegés befejezése)
- 1,047,576
- 128 000 (elkészített felügyelt telepítések)
- 300 000 (kötegelt üzembe helyezés)
32,768 2024. május 31.

computer-use-preview

Kísérleti modell, amely a Responses API számítógép-használati eszközével való használatra van betanítve.

Külső kódtárakkal is használható, hogy lehetővé tegye a modell számára az egér- és billentyűzetbemenet szabályozását, miközben az aktuális környezet képernyőképeiből környezeteket kap.

Caution

Nem javasoljuk, hogy éles környezetben használjunk előzetes verziójú modelleket. Az előzetes modellek összes üzembe helyezését a jövőbeni előzetes verzióra vagy a legújabb stabil, általánosan elérhető verzióra frissítjük. Az előzetes verziójú modellek nem követik az Azure OpenAI-modell szokásos életciklusát.

A hozzáféréshez computer-use-previewregisztráció szükséges. A hozzáférés a Microsoft jogosultsági feltételei alapján adható meg. Az egyéb korlátozott hozzáférési modellekhez hozzáféréssel rendelkező ügyfeleknek továbbra is hozzáférést kell kérniük ehhez a modellhez.

Hozzáférés kéréséhez lépjen a korlátozott hozzáférésű modellalkalmazáshozcomputer-use-preview. Ha a hozzáférés meg van adva, létre kell hoznia egy üzembe helyezést a modellhez.

Régiónkénti elérhetőség

Model Régió
computer-use-preview Tekintse meg a modellek táblázatát.

Capabilities

Modellazonosító Description Környezeti ablak Kimeneti jogkivonatok maximális értéke Betanítási adatok (legfeljebb)
computer-use-preview (2025-03-11) Specializált modell a Responses API számítógép-használati eszközével való használatra

-Eszközök
-Streaming
- Szöveg (bemenet/kimenet)
- Kép (bemenet)
8,192 1,024 Október 2023.

o-sorozatú modellek

Az Azure OpenAI o-sorozatú modelljei az érvelési és problémamegoldási feladatok nagyobb összpontosítással és képességgel való kezelésére lettek kialakítva. Ezek a modellek több időt töltenek a felhasználó kérésének feldolgozásával és megértésével, így a korábbi iterációkhoz képest rendkívül erősek a tudomány, a kódolás és a matematika területén.

Modellazonosító Description Maximális kérelem (tokenek) Betanítási adatok (legfeljebb)
codex-mini (2025-05-16) A /> finomhangolt verziója.
- Responses API.
- Strukturált kimenetek.
- Szöveg- és képfeldolgozás.
- Függvények és eszközök.
A képességek teljes összefoglalása.
Bemenet: 200 000
Kimenet: 100 000
2024. május 31.
o3-pro (2025-06-10) - Responses API.
- Strukturált kimenetek.
- Szöveg- és képfeldolgozás.
- Függvények és eszközök.
A képességek teljes összefoglalása.
Bemenet: 200 000
Kimenet: 100 000
2024. május 31.
o4-mini (2025-04-16) - Új érvelési modell, amely továbbfejlesztett érvelési képességeket kínál.
- Chat Completions API (csevegés befejezési API)
- Responses API.
- Strukturált kimenetek.
- Szöveg- és képfeldolgozás.
- Függvények és eszközök.
A képességek teljes összefoglalása.
Bemenet: 200 000
Kimenet: 100 000
2024. május 31.
o3 (2025-04-16) - Új érvelési modell, amely továbbfejlesztett érvelési képességeket kínál.
- Chat Completions API (csevegés befejezési API)
- Responses API.
- Strukturált kimenetek.
- Szöveg- és képfeldolgozás.
- Függvények, eszközök és párhuzamos eszközhívás.
A képességek teljes összefoglalása.
Bemenet: 200 000
Kimenet: 100 000
2024. május 31.
o3-mini (2025-01-31) - Továbbfejlesztett érvelési képességek.
- Strukturált kimenetek.
- Csak szöveges feldolgozás.
- Függvények és eszközök.
Bemenet: 200 000
Kimenet: 100 000
Október 2023.
o1 (2024-12-17) - Továbbfejlesztett érvelési képességek.
- Strukturált kimenetek.
- Szöveg- és képfeldolgozás.
- Függvények és eszközök.
Bemenet: 200 000
Kimenet: 100 000
Október 2023.
o1-preview (2024-09-12) Régebbi előzetes verzió. Bemenet: 128 000
Kimenet: 32 768
Október 2023.
o1-mini (2024-09-12) Gyorsabb és költséghatékonyabb megoldás az o1 sorozatban, amely ideális a sebességet és alacsonyabb erőforrás-felhasználást igénylő feladatok kódolásához.
– Alapértelmezés szerint elérhető a Global Standard üzembe helyezése.
- A standard (regionális) üzemelő példányok jelenleg csak olyan ügyfelek számára érhetők el, akik a o1-preview korlátozott hozzáférésű kiadás részeként kaptak hozzáférést.
Bemenet: 128 000
Kimenet: 65 536
Október 2023.

A speciális o-sorozatú modellekről az érvelési modellek használatának első lépései című témakörben olvashat bővebben.

Régiónkénti elérhetőség

Model Régió
codex-mini USA 2. keleti régiója és Svédország középső régiója (Global Standard).
o3-pro USA 2. keleti régiója és Svédország középső régiója (Global Standard).
o4-mini Tekintse meg a modellek táblázatát.
o3 Tekintse meg a modellek táblázatát.
o3-mini Tekintse meg a modellek táblázatát.
o1 Tekintse meg a modellek táblázatát.
o1-preview Tekintse meg a modellek táblázatát. Ez a modell csak azoknak az ügyfeleknek érhető el, akik az eredeti korlátozott hozzáférés részeként kaptak hozzáférést.
o1-mini Tekintse meg a modellek táblázatát.

GPT-4o és GPT-4 Turbo

A GPT-4o egyetlen modellben integrálja a szöveget és a képeket, így egyszerre több adattípust is kezelhet. Ez a multimodális megközelítés növeli a pontosságot és a válaszkészséget az emberi-számítógépes interakciókban. A GPT-4o megfelel a GPT-4 Turbo angol nyelvű szöveg- és kódolási feladatainak, miközben kiváló teljesítményt nyújt a nem angol nyelvű feladatokban és a látási feladatokban, új teljesítményteszteket állítva be az AI-képességekhez.

GPT-4 és GPT-4 Turbo modellek

Ezek a modellek csak a Chat Completions API-val használhatók.

A Modellverziók című cikkből megtudhatja, hogyan kezeli az Azure OpenAI a modellverzió-frissítéseket. Tekintse meg a modellek használata című témakört, amelyből megtudhatja, hogyan tekintheti meg és konfigurálhatja a GPT-4 üzemelő példányok modellverzió-beállításait.

Modellazonosító Description Maximális kérelem (tokenek) Betanítási adatok (legfeljebb)
gpt-4o (2024-11-20)
GPT-4o (Omni)
- Strukturált kimenetek.
- Szöveg- és képfeldolgozás.
- JSON mód.
- Párhuzamos függvényhívás.
- Nagyobb pontosság és válaszkészség.
- Paritás angol szöveggel és kódolási feladatokkal a GPT-4 Turbo with Vision-hez képest.
- Kiváló teljesítmény nem angol nyelven és látási feladatokban.
- Továbbfejlesztett kreatív írási képesség.
Bemenet: 128 000
Kimenet: 16 384
Október 2023.
gpt-4o (2024-08-06)
GPT-4o (Omni)
- Strukturált kimenetek.
- Szöveg- és képfeldolgozás.
- JSON mód.
- Párhuzamos függvényhívás.
- Nagyobb pontosság és válaszkészség.
- Paritás angol szöveggel és kódolási feladatokkal a GPT-4 Turbo with Vision-hez képest.
- Kiváló teljesítmény nem angol nyelven és látási feladatokban.
Bemenet: 128 000
Kimenet: 16 384
Október 2023.
gpt-4o-mini (2024-07-18)
GPT-4o Mini
- Gyors, olcsó, teljesítményű modell, amely ideális csere a GPT-3.5 Turbo sorozatú modellek helyett.
- Szöveg- és képfeldolgozás.
- JSON mód.
- Párhuzamos függvényhívás.
Bemenet: 128 000
Kimenet: 16 384
Október 2023.
gpt-4o (2024-05-13)
GPT-4o (Omni)
- Szöveg- és képfeldolgozás.
- JSON mód.
- Párhuzamos függvényhívás.
- Nagyobb pontosság és válaszkészség.
- Paritás angol szöveggel és kódolási feladatokkal a GPT-4 Turbo with Vision-hez képest.
- Kiváló teljesítmény nem angol nyelven és látási feladatokban.
Bemenet: 128 000
Kimenet: 4096
Október 2023.
gpt-4 (turbo-2024-04-09)
GPT-4 Turbo és Vision
Új általánosan elérhető modell.
- Az összes korábbi GPT-4 előzetes modell cseréje (vision-preview, 1106-Preview, ). 0125-Preview
- A funkciók rendelkezésre állása jelenleg eltérő a bemeneti módszertől és az üzembe helyezés típusától függően.
Bemenet: 128 000
Kimenet: 4096
2023. december

Caution

Nem javasoljuk, hogy éles környezetben használjon előzetes verziójú modelleket. Az előzetes modellek összes üzembe helyezését a jövőbeni előzetes verzióra vagy a legújabb stabil, általánosan elérhető verzióra frissítjük. Az előzetes verziójú modellek nem követik az Azure OpenAI-modell szokásos életciklusát.

Beágyazások

text-embedding-3-large A legújabb és leginkább alkalmas beágyazási modell. A beágyazási modellek között nem frissíthet. Ha át szeretne lépni a text-embedding-ada-002használatbóltext-embedding-3-large, új beágyazásokat kell létrehoznia.

  • text-embedding-3-large
  • text-embedding-3-small
  • text-embedding-ada-002

Az OpenAI-jelentések tesztelése azt mutatja, hogy a nagy és a kis harmadik generációs beágyazási modellek is jobb átlagos többnyelvű lekérési teljesítményt nyújtanak a MIRACL-teljesítményteszttel . Az MTEB-teljesítményteszttel továbbra is fenntartják az angol feladatok teljesítményét.

Értékelési teljesítménymutató text-embedding-ada-002 text-embedding-3-small text-embedding-3-large
MIRACL-átlag 31.4 44.0 54.9
MTEB átlag 61.0 62.3 64.6

A harmadik generációs beágyazási modellek támogatják a beágyazás méretének csökkentését egy új dimensions paraméterrel. A nagyobb beágyazások általában számítási, memória- és tárolási szempontból drágábbak. Ha módosíthatja a dimenziók számát, nagyobb mértékben szabályozhatja a teljes költséget és teljesítményt. A dimensions paraméter nem támogatott az OpenAI 1.x Python-kódtár minden verziójában. A paraméter előnyeinek kihasználásához javasoljuk, hogy frissítsen a legújabb verzióra: pip install openai --upgrade.

Az OpenAI MTEB benchmarktesztje azt találta, hogy még akkor is, ha a harmadik generációs modell méretei az 1536-os méretnél kisebbre csökkennek text-embeddings-ada-002, a teljesítmény kissé jobb marad.

Képgenerálási modellek

A képgenerálási modellek a felhasználó által biztosított szöveges kérésekből hoznak létre képeket. A GPT-image-1 sorozatú modellek korlátozott hozzáférésű előzetes verzióban érhetők el. A DALL-E 3 általánosan elérhető a REST API-khoz. A DALL-E 2 és a DALL-E 3 ügyféloldali SDK-kkal előzetes verzióban érhető el.

A gpt-image-1, gpt-image-1-mini vagy gpt-image-1.5 hozzáféréséhez regisztráció szükséges. A hozzáférés a Microsoft jogosultsági feltételei alapján adható meg. Az egyéb korlátozott hozzáférési modellekhez hozzáféréssel rendelkező ügyfeleknek továbbra is hozzáférést kell kérniük ehhez a modellhez.

A hozzáférés kéréséhez töltsön ki egy alkalmazásűrlapot: GPT-image-1 hozzáférés kérelmezése; A GPT-image-1.5 hozzáférés alkalmazása. Ha a hozzáférés meg van adva, létre kell hoznia egy üzembe helyezést a modellhez.

Régiónkénti elérhetőség

Model Régió
dall-e-3 USA keleti régiója
Ausztrália keleti régiója
Közép-Svédország
gpt-image-1 USA 3. nyugati régiója (globális szabvány)
USA 2. keleti régiója (globális szabvány)
Észak-Egyesült Arab Emírségek (globális szabvány)
Lengyelország középső régiója (Global Standard)
Svédország középső régiója (Global Standard)
gpt-image-1-mini USA 3. nyugati régiója (globális szabvány)
USA 2. keleti régiója (globális szabvány)
Észak-Egyesült Arab Emírségek (globális szabvány)
Lengyelország középső régiója (Global Standard)
Svédország középső régiója (Global Standard)
gpt-image-1.5 USA 3. nyugati régiója (globális szabvány)
USA 2. keleti régiója (globális szabvány)
Észak-Egyesült Arab Emírségek (globális szabvány)
Lengyelország középső régiója (Global Standard)
Svédország középső régiója (Global Standard)

Videogenerációs modellek

A Sora egy AI-modell az OpenAI-ból, amely szöveges utasításokból valós és ötletes videojeleneteket hozhat létre. Sora előzetes verzióban érhető el.

Régiónkénti elérhetőség

Model Régió
sora USA 2. keleti régiója (globális szabvány)
Svédország középső régiója (Global Standard)
sora-2 USA 2. keleti régiója (globális szabvány)
Svédország középső régiója (Global Standard)

Audió modellek

Az Azure OpenAI szolgáltatásban a hangmodellek a realtime, completions, és audio API-ken keresztül érhetők el.

GPT-4o hangmodellek

A GPT-4o hangmodellek a GPT-4o modellcsalád részét képezik, és támogatják az alacsony késést, a beszédet, a beszédfelolvasási interakciókat vagy a hanggenerálást.

Caution

Nem javasoljuk, hogy éles környezetben használjunk előzetes verziójú modelleket. Az előzetes modellek összes üzembe helyezését a jövőbeni előzetes verzióra vagy a legújabb stabil, általánosan elérhető verzióra frissítjük. Az előzetes verziójú modellek nem követik az Azure OpenAI-modell szokásos életciklusát.

A kérelmek maximális jogkivonatairól és a betanítási adatokról az alábbi táblázatban olvashat:

Modellazonosító Description Maximális kérelem (tokenek) Betanítási adatok (legfeljebb)
gpt-4o-mini-audio-preview (2024-12-17)
GPT-4o audió
Hang- és szövegmodell a hang- és szöveggeneráláshoz. Bemenet: 128 000
Kimenet: 16 384
2023. szeptember
gpt-4o-audio-preview (2024-12-17)
GPT-4o audió
Hang- és szövegmodell a hang- és szöveggeneráláshoz. Bemenet: 128 000
Kimenet: 16 384
2023. szeptember
gpt-4o-realtime-preview (2025-06-03)
GPT-4o audió
Hangmodell valós idejű hangfeldolgozáshoz. Bemenet: 128 000
Kimenet: 4096
Október 2023.
gpt-4o-realtime-preview (2024-12-17)
GPT-4o audió
Hangmodell valós idejű hangfeldolgozáshoz. Bemenet: 128 000
Kimenet: 4096
Október 2023.
gpt-4o-mini-realtime-preview (2024-12-17)
GPT-4o audió
Hangmodell valós idejű hangfeldolgozáshoz. Bemenet: 128 000
Kimenet: 4096
Október 2023.
gpt-realtime (2025-08-28) (GA)
gpt-realtime-mini (2025-10-06)
gpt-realtime-mini-2025-12-15 (2025-12-15)
gpt-audio(2025.08.28)
gpt-audio-mini(2025-10-06)
Hangmodell valós idejű hangfeldolgozáshoz. Bemenet: 28 672
Kimenet: 4096
Október 2023.

A GPT-4o hangmodellek minden régióban való rendelkezésre állásának összehasonlításához tekintse meg a modellek táblázatát.

Audio API

A /audio API-n keresztül használható hangmodellek beszéd szöveggé alakítására, fordításra és szöveg beszéddé alakítására használhatók.

Beszédfelolvasási modellek

Modellazonosító Description Maximális kérelem (hangfájl mérete)
whisper Általános célú beszédfelismerési modell. 25 MB
gpt-4o-transcribe A GPT-4o által működtetett beszédfelolvasási modell. 25 MB
gpt-4o-mini-transcribe A GPT-4o mini által működtetett beszédfelolvasó modell. 25 MB
gpt-4o-transcribe-diarize Automatikus beszédfelismerési modell. 25 MB
gpt-4o-mini-transcribe-2025-12-15 Automatikus beszédfelismerési modell. Továbbfejlesztett átírási pontosság és robusztusság. 25 MB

Beszédfordítási modellek

Modellazonosító Description Maximális kérelem (hangfájl mérete)
whisper Általános célú beszédfelismerési modell. 25 MB

Szövegfelolvasási modellek (előzetes verzió)

Modellazonosító Description
tts A sebességre optimalizált szövegfelolvasási modell.
tts-hd Minőségre optimalizált szövegfelolvasási modell.
gpt-4o-mini-tts A GPT-4o mini által működtetett szövegfelolvasási modell.

A hang egy adott stílusban vagy hangnemben szólalhat meg.
gpt-4o-mini-tts-2025-12-15 A GPT-4o mini által működtetett szövegfelolvasási modell.

A hang egy adott stílusban vagy hangnemben szólalhat meg.

Modellösszesítő táblázat és régió rendelkezésre állása

Modellek üzembe helyezési típus szerint

Az Azure OpenAI az üzleti és használati mintáknak megfelelő üzemeltetési struktúrával kapcsolatos lehetőségeket biztosít az ügyfelek számára. A szolgáltatás két fő üzembe helyezési típust kínál:

  • Standard: Globális üzembe helyezési lehetőséggel rendelkezik, amely globálisan irányítja a forgalmat, hogy nagyobb átviteli sebességet biztosítson.
  • Kiépített: Globális üzembe helyezési lehetőséggel is rendelkezik, amely lehetővé teszi az ügyfelek számára a kiépített átviteli egységek megvásárlását és üzembe helyezését az Azure globális infrastruktúrában.

Minden üzembe helyezés pontosan ugyanazokat a következtetési műveleteket hajthatja végre, de a számlázás, a skálázás és a teljesítmény lényegesen eltérő. Az Azure OpenAI üzembe helyezési típusaival kapcsolatos további információkért tekintse meg az Üzembehelyezési típusok útmutatót.

Globális standard modell rendelkezésre állása

Régió gpt-5.2-codex, 2026-01-14 gpt-5.2, 2025-12-11 gpt-5.2-chat, 2025-12-11 gpt-5.1-codex-max, 2025-12-04 gpt-5.1, 2025-11-13 gpt-5.1-chat, 2025-11-13 gpt-5.1-codex, 2025-11-13 gpt-5.1-codex-mini, 2025-11-13 gpt-5-pro, 2025-10-06 gpt-5-codex, 2025-09-15 gpt-5, 2025-08-07 gpt-5-mini, 2025-08-07 gpt-5 nano, 2025-08-07 gpt-5-chat, 2025-08-07 gpt-5-chat, 2025-10-03 o3-pro, 2025-06-10 codex-mini, 2025-05-16 sora, 2025-05-02 model-router, 2025-08-07 model-router, 2025-05-19 model-router, 2025-11-18 o3, 2025-04-16 o4-mini, 2025-04-16 gpt-image-1, 2025-04-15 gpt-4.1, 2025-04-14 gpt-4.1 nano, 2025-04-14 gpt-4.1-mini, 2025-04-14 számítógép-használat-előnézete, 2025.03.11 o3-mini, 2025-01-31 o1, 2024-12-17 gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o, 2024-11-20 gpt-4o-mini, 2024-07-18 text-embedding-3-small, 1 text-embedding-3-large, 1 text-embedding-ada-002, 2 gpt-4o-realtime-preview, 2024-12-17 gpt-4o-audio-preview, 2024-12-17 gpt-4o-mini-realtime-preview, 2024-12-17 gpt-4o-mini-audio-preview, 2024-12-17 gpt-4o-transcribe, 2025-03-20 gpt-4o-mini-tts, 2025-12-15 gpt-4o-mini-tts, 2025-03-20 gpt-4o-mini-transcribe, 2025-12-15 gpt-4o-mini-transcribe, 2025-03-20 gpt-image-1-mini, 2025-10-06 gpt-audio-mini, 2025-10-06 gpt-audio-mini, 2025-12-15 gpt-image-1.5, 2025-12-16 sora-2, 2025-10-06 gpt-realtime-mini, 2025-10-06 gpt-realtime-mini, 2025-12-15 o3-deep-research, 2025-06-26 gpt-realtime, 2025-08-28 gpt-audio, 2025-08-28 gpt-4o-transcribe-diarize, 2025-10-15
AustraliaEast - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Brazília déli régiója - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Kanada középső része - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Kanada keleti része - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
központi - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
eastus - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
eastus2 -
francecentral - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Németország Közép-Nyugat - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Olaszország északa - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
japaneast - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
koreacentral - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
northcentralus - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Norvégia keleti része - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Lengyel központ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
southafricanorth - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
southcentralus - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
southeastasia - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Dél-India - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
spaincentral - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Swedencentral - - - -
Svájc észak - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
switzerlandwest - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
uaenorth - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
uksouth - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Nyugat-Európa - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
westus - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
westus3 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

Megjegyzés:

o3-deep-research jelenleg csak a Foundry Agent Service-ben érhető el. További információkért tekintse meg a Deep Research eszköz útmutatását.

Ez a táblázat nem tartalmazza a regionális rendelkezésre állási adatok finomhangolását. Az információkért tekintse meg a finomhangolási szakaszt .

Beágyazási modellek

Ezek a modellek csak API-kérések beágyazásával használhatók.

Megjegyzés:

text-embedding-3-large A legújabb és leginkább alkalmas beágyazási modell. A beágyazási modellek között nem frissíthet. A használatból text-embedding-ada-002 való migráláshoz text-embedding-3-largeúj beágyazásokat kell létrehoznia.

Modellazonosító Maximális kérelem (tokenek) Kimeneti dimenziók Betanítási adatok (legfeljebb)
text-embedding-ada-002 (2. verzió) 8,192 1,536 2021. szeptember
text-embedding-ada-002 (1. verzió) 2,046 1,536 2021. szeptember
text-embedding-3-large 8,192 3,072 2021. szeptember
text-embedding-3-small 8,192 1,536 2021. szeptember

Megjegyzés:

Amikor bemeneti tömböt küld beágyazáshoz, a tömbben a bemeneti elemek maximális száma a beágyazási végpontra irányuló hívásonként 2048.

Képgenerálási modellek

Modellazonosító Kérelem maximális száma (karakterek)
gpt-image-1 4,000
gpt-image-1-mini 4,000
gpt-image-1.5 4,000
dall-e-3 4,000

Videogenerációs modellek

Modellazonosító Maximális kérelem (karakterek)
sora 4,000

Modellek finomhangolása

Megjegyzés:

A finomhangolás támogatott régiói eltérőek lehetnek, ha Azure OpenAI-modelleket használ egy Microsoft Foundry-projektben vagy egy projekten kívül.

Modellazonosító Standard régiók Global fejlesztő Maximális kérelem (tokenek) Betanítási adatok (legfeljebb) Modality
gpt-4o-mini
(2024-07-18)
USA északi középső régiója
Közép-Svédország
Bemenet: 128 000
Kimenet: 16 384
Betanítási példák kontextusának hossza: 65 536
2023. október Szövegről szövegre
gpt-4o
(2024-08-06)
Kelet-USA 2
USA északi középső régiója
Közép-Svédország
Bemenet: 128 000
Kimenet: 16 384
Betanítási példák kontextusának hossza: 65 536
2023. október Szöveg és látás szöveggé
gpt-4.1
(2025-04-14)
USA északi középső régiója
Közép-Svédország
Bemenet: 128 000
Kimenet: 16 384
Betanítási példák kontextusának hossza: 65 536
2024. május Szöveg és látás szöveggé
gpt-4.1-mini
(2025-04-14)
USA északi középső régiója
Közép-Svédország
Bemenet: 128 000
Kimenet: 16 384
Betanítási példák kontextusának hossza: 65 536
2024. május Szövegről szövegre
gpt-4.1-nano (2025-04-14) USA északi középső régiója
Közép-Svédország
Bemenet: 128 000
Kimenet: 16 384
Példa tanítási kontextus hossza: 32 768
2024. május Szövegről szövegre
o4-mini
(2025-04-16)
Kelet-USA 2
Közép-Svédország
Bemenet: 128 000
Kimenet: 16 384
Betanítási példák kontextusának hossza: 65 536
2024. május Szövegről szövegre
Ministral-3B (előzetes verzió)
(2411)
Nem támogatott Bemenet: 128 000
Kimenet: Ismeretlen
Példa betanítási környezet hossza: Ismeretlen
Ismeretlen Szövegről szövegre
Qwen-32B (előzetes verzió) Nem támogatott Bemenet: 8000
Kimenet: 32 000
Betanítási példasorozat hossza: 8192
2024. július Szövegről szövegre

Megjegyzés:

A globális képzés jogkivonatonként megfizethetőbb képzést biztosít, de nem kínál adattárolást. Jelenleg a következő régiókban érhető el az Foundry-erőforrások számára:

  • Ausztrália keleti régiója
  • Dél-Brazília
  • Közép-Kanada
  • Kelet-Kanada
  • USA keleti régiója
  • Kelet-USA 2
  • Közép-Franciaország
  • Középnyugat-Németország
  • Észak-Olaszország
  • Kelet-Japán (nincs látástámogatás)
  • Korea középső régiója
  • USA északi középső régiója
  • Kelet-Norvégia
  • Lengyelország középső régiója (4,1 nano támogatás nélkül)
  • Délkelet-Ázsia
  • Dél-Afrika északi régiója
  • USA déli középső régiója
  • Dél-India
  • Közép-Spanyolország
  • Közép-Svédország
  • Nyugat-Svájc
  • Észak-Svájc
  • Egyesült Királyság déli régiója
  • Nyugat-Európa
  • USA nyugati régiója
  • Nyugat USA3

Asszisztensek (előzetes verzió)

Az Asszisztensek esetében egy támogatott modell és egy támogatott régió kombinációjára van szükség. Bizonyos eszközökhöz és képességekhez a legújabb modellek szükségesek. A következő modellek érhetők el az Assistants API-ban, az SDK-ban és a Foundryben. Az alábbi táblázat a standard üzembe helyezéshez készült. A kiosztott átviteli sebességegységek rendelkezésre állásáról további információt a kiosztott átviteli sebesség című témakörben talál. A felsorolt modellek és régiók az Assistants v1 és v2 verzióval is használhatók. A Global Standard modelleket akkor használhatja, ha az alábbi régiókban támogatottak.

Régió gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Előnézet gpt-4, turbo-2024-04-09 gpt-4-32k, 0613 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613
AustraliaEast - - - - -
eastus - - - -
eastus2 - - - -
francecentral - - - - - -
japaneast - - - - - - - - -
Norvégia keleti része - - - - - - - - - - -
Dél-India - - - - - - - - -
Swedencentral - -
uksouth - - - - - -
westus - - - - -
westus3 - - - - - -

Modell nyugdíjazása

A modellkivonásokkal kapcsolatos legfrissebb információkért tekintse meg a modellkivonási útmutatót.

Megjegyzés:

A közvetlenül az Azure által értékesített öntödei modellek az összes Azure OpenAI-modellt is tartalmazzák. A modellek megismeréséhez váltson az Azure OpenAI-modellek gyűjteményére a cikk tetején.

Az Azure által közvetlenül értékesített Black Forest Labs-modellek

A Black Forest Labs (BFL) képgenerálási modellek gyűjteménye magában foglalja a FLUX.2 [pro] modellt a képgeneráláshoz és szerkesztéshez szöveg- és képkérések alapján, a FLUX.1 Kontext [pro] modellt a kontextuson belüli generáláshoz és szerkesztéshez, valamint a FLUX1.1 [pro] modellt szöveg-képgeneráláshoz.

Ezeket a modelleket a BFL szolgáltatói API-n, valamint a képeken/generációkon és képeken/szerkesztési végpontokon keresztül futtathatja.

Model Típus > API-végpont Capabilities Üzembe helyezés típusa (régió rendelkezésre állása) Projekttípus
FLUX.2-pro Képgenerálás
- BFL-szolgáltató API: <resource-name>/providers/blackforestlabs/v1/flux-2-pro
- Bemenet: szöveg és képek (32 000 token és legfeljebb 8 képi)
- Hozam: Egy kép
- Eszközhívás: Nem
- Válaszformátumok: Kép (PNG és JPG)
- Főbb funkciók: Többhivatkozásos támogatás legfeljebb 8képhez ii; a valós tudás alaposabb ismerete; nagyobb kimeneti rugalmasság; továbbfejlesztett teljesítmény
- További paraméterek:(Csak szolgáltatóspecifikus API-ban) Minden paramétert támogat.
- Globális szabvány (minden régió) Öntöde, hub-alapú
FLUX.1-Kontext-pro Képgenerálás
- Image API: https://<resource-name>/openai/deployments/{deployment-id}/images/generations
és
https://<resource-name>/openai/deployments/{deployment-id}/images/edits

- BFL-szolgáltató API: <resource-name>/providers/blackforestlabs/v1/flux-kontext-pro?api-version=preview
- Bemenet: szöveg és kép (5000 jogkivonat és 1 kép)
- Hozam: Egy kép
- Eszközhívás: Nem
- Válaszformátumok: Kép (PNG és JPG)
- Főbb funkciók: Karakterkonzisztencia, speciális szerkesztés
- További paraméterek:(Csak szolgáltatóspecifikus API-ban)seed, aspect ratio, input_image, prompt_unsampling, , safety_toleranceoutput_format
- Globális szabvány (minden régió) Öntöde, hub-alapú
FLUX-1.1-pro Képgenerálás
- Image API: https://<resource-name>/openai/deployments/{deployment-id}/images/generations

- BFL-szolgáltató API: <resource-name>/providers/blackforestlabs/v1/flux-pro-1.1?api-version=preview
- Bemenet: szöveg (5,000 token és 1 kép)
- Hozam: Egy kép
- Eszközhívás: Nem
- Válaszformátumok: Kép (PNG és JPG)
- Főbb funkciók: Gyors következtetési sebesség, erős gyors betartás, versenyképes díjszabás, skálázható generáció
- További paraméterek:(Csak szolgáltatóspecifikus API-ban)width, height, prompt_unsampling, seed, , safety_toleranceoutput_format
- Globális szabvány (minden régió) Öntöde, hub-alapú
Model Típus > API-végpont Capabilities Üzembe helyezés típusa (régió rendelkezésre állása)
FLUX.2-pro Képgenerálás
- BFL-szolgáltató API: <resource-name>/providers/blackforestlabs/v1/flux-2-pro
- Bemenet: szöveg (32 000 token és legfeljebb 8 képi)
- Hozam: Egy kép
- Eszközhívás: Nem
- Válaszformátumok: Kép (PNG és JPG)
- Főbb funkciók: Többhivatkozásos támogatás legfeljebb 8képhez ii; a valós tudás alaposabb ismerete; nagyobb kimeneti rugalmasság; továbbfejlesztett teljesítmény
- További paraméterek:(Csak szolgáltatóspecifikus API-ban) Minden paramétert támogat.
- Globális szabvány (minden régió)
FLUX.1-Kontext-pro Képgenerálás
- Image API: https://<resource-name>/openai/deployments/{deployment-id}/images/generations
és
https://<resource-name>/openai/deployments/{deployment-id}/images/edits

- BFL-szolgáltató API: <resource-name>/providers/blackforestlabs/v1/flux-kontext-pro?api-version=preview
- Bemenet: szöveg és kép (5000 jogkivonat és 1 kép)
- Hozam: Egy kép
- Eszközhívás: Nem
- Válaszformátumok: Kép (PNG és JPG)
- Főbb funkciók: Karakterkonzisztencia, speciális szerkesztés
- További paraméterek:(Csak szolgáltatóspecifikus API-ban)seed, aspect ratio, input_image, prompt_unsampling, , safety_toleranceoutput_format
- Globális szabvány (minden régió)
FLUX-1.1-pro Képgenerálás
- Image API: https://<resource-name>/openai/deployments/{deployment-id}/images/generations

- BFL-szolgáltató API: <resource-name>/providers/blackforestlabs/v1/flux-pro-1.1?api-version=preview
- Bemenet: szöveg (5,000 token és 1 kép)
- Hozam: Egy kép
- Eszközhívás: Nem
- Válaszformátumok: Kép (PNG és JPG)
- Főbb funkciók: Gyors következtetési sebesség, erős gyors betartás, versenyképes díjszabás, skálázható generáció
- További paraméterek:(Csak szolgáltatóspecifikus API-ban)width, height, prompt_unsampling, seed, , safety_toleranceoutput_format
- Globális szabvány (minden régió)

i,ii A FLUX.2[pro] számára több referenciakép (legfeljebb nyolc) támogatása érhető el az API használatával, de nem a játszótéren. Lásd a FLUX.2[pro] következő kódmintáit.

Kódminták a FLUX.2-hez[pro]

Képgenerálás

  • Bemenet: Szöveg
  • Kimenet: Egy kép
curl -X POST https://<your-resource-name>.api.cognitive.microsoft.com/providers/blackforestlabs/v1/flux-2-pro?api-version… \ 
  -H "Content-Type: application/json" \ 
  -H "Authorization: Bearer {API_KEY}" \ 
  -d '{ 
      "model": "FLUX.2-pro" 
      "prompt": "A photograph of a red fox in an autumn forest", 
      "width": 1024, 
      "height": 1024, 
      "seed": 42, 
      "safety_tolerance": 2, 
      "output_format": "jpeg", 
    }' 

Képszerkesztés

  • Bemenet: Legfeljebb nyolc bit-64 kódolású rendszerkép
  • Kimenet: Egy kép
curl -X POST https://<your-resource-name>.api.cognitive.microsoft.com/providers/blackforestlabs/v1/flux-2-pro?api-version… \
  -H "Content-Type: application/json" \ 
  -H "Authorization: Bearer {API_KEY}" \ 
  -d '{ 
      "model": "FLUX.2-pro", 
      "prompt": "Apply a cinematic, moody lighting effect to all photos. Make them look like scenes from a sci-fi noir film", 
      "output_format": "jpeg", 
      "input_image" : "/9j/4AAQSkZJRgABAQAAAQABAAD/2wBDA.......", 
      "input_image_2" : "iVBORw0KGgoAAAANSUhEUgAABAAAAAQACAIAAADwf........" 
    }' 

Tekintse meg ezt a modellgyűjteményt a Microsoft Foundry portálon.

Közvetlenül az Azure által értékesített cohere-modellek

A Cohere modellcsalád különböző használati esetekre optimalizált modelleket tartalmaz, beleértve a csevegések befejezését, a rerank/text besorolást és a beágyazásokat. A Cohere modelleket különböző felhasználási esetekre optimalizálták, beleértve az érvelést, az összegzést és a kérdések megválaszolását.

Model Típus Capabilities Üzembe helyezés típusa (régió rendelkezésre állása) Projekttípus
Cohere-rerank-v4.0-pro szövegbesorolás (újrarangsorolás) - Bemenet: szöveg
- Kimenet: szöveg
- Nyelvek:en, fr, , esit, de, pt-br, ja, zh-cn, ar, vi, , hi, ru, , id, ésnl
- Eszközhívás: Nem
- Válaszformátumok: JSON
- Globális szabvány (minden régió)
- Felügyelt számítás
Öntöde, hub-alapú
Cohere-rerank-v4.0-fast szövegbesorolás (újrarangsorolás) - Bemenet: szöveg
- Kimenet: szöveg
- Nyelvek:en, fr, , esit, de, pt-br, ja, zh-cn, ar, vi, , hi, ru, , id, ésnl
- Eszközhívás: Nem
- Válaszformátumok: JSON
- Globális szabvány (minden régió)
- Felügyelt számítás
Öntöde, hub-alapú
Cohere-command-a chat-completion - Bemenet: szöveg (131 072 token)
- Kimenet: szöveg (8182 token)
- Nyelvek:en, fr, es, it, de, pt-br, ja, ko, , zh-cnés ar
- Eszközhívás: Igen
- Válaszformátumok: Szöveg, JSON
- Globális szabvány (minden régió) Öntöde, hub-alapú
embed-v-4-0 embeddings - Bemenet: szöveg (512 token) és képek (2MM képpont)
- Kimenet: Vektor (256, 512, 1024, 1536 dim.)
- Nyelvek:en, fr, es, it, de, pt-br, ja, ko, , zh-cnés ar
- Globális szabvány (minden régió) Öntöde, hub-alapú
Model Típus Capabilities Üzembe helyezés típusa (régió rendelkezésre állása)
Cohere-rerank-v4.0-pro szövegbesorolás (újrarangsorolás) - Bemenet: szöveg
- Kimenet: szöveg
- Nyelvek:en, fr, , esit, de, pt-br, ja, zh-cn, ar, vi, , hi, ru, , id, ésnl
- Eszközhívás: Nem
- Válaszformátumok: JSON
- Globális szabvány (minden régió)
- Felügyelt számítás
Cohere-rerank-v4.0-fast szövegbesorolás (újrarangsorolás) - Bemenet: szöveg
- Kimenet: szöveg
- Nyelvek:en, fr, , esit, de, pt-br, ja, zh-cn, ar, vi, , hi, ru, , id, ésnl
- Eszközhívás: Nem
- Válaszformátumok: JSON
- Globális szabvány (minden régió)
- Felügyelt számítás
Cohere-command-a chat-completion - Bemenet: szöveg (131 072 token)
- Kimenet: szöveg (8182 token)
- Nyelvek:en, fr, es, it, de, pt-br, ja, ko, , zh-cnés ar
- Eszközhívás: Igen
- Válaszformátumok: Szöveg, JSON
- Globális szabvány (minden régió)
embed-v-4-0 embeddings - Bemenet: szöveg (512 token) és képek (2MM képpont)
- Kimenet: Vektor (256, 512, 1024, 1536 dim.)
- Nyelvek:en, fr, es, it, de, pt-br, ja, ko, , zh-cnés ar
- Globális szabvány (minden régió)

Tekintse meg a Cohere modellgyűjteményt az Foundry portálon.

Közvetlenül az Azure által értékesített DeepSeek-modellek

A DeepSeek modellcsalád számos érvelési modellt tartalmaz, amelyek egy lépésenkénti betanítási folyamattal, például nyelvi, tudományos érvelési és kódolási feladatokkal emelik ki az érvelési feladatokat.

Model Típus Capabilities Üzembe helyezés típusa (régió rendelkezésre állása) Projekttípus
DeepSeek-V3.2-Speciale chat-completion
(érvelési tartalommal)
- Bemenet: szöveg (128 000 token)
- Kimenet: (128 000 token)
- Nyelvek:en és zh
- Eszközhívás: Nem
- Válaszformátumok: Szöveg, JSON
- Globális szabvány (minden régió) Öntöde, hub-alapú
DeepSeek-V3.2 chat-completion
(érvelési tartalommal)
- Bemenet: szöveg (128 000 token)
- Kimenet: (128 000 token)
- Nyelvek:en és zh
- Eszközhívás: Nem
- Válaszformátumok: Szöveg, JSON
- Globális szabvány (minden régió) Öntöde, hub-alapú
DeepSeek-V3.1 chat-completion
(érvelési tartalommal)
- Bemenet: szöveg (131 072 token)
- Kimenet: (131 072 token)
- Nyelvek:en és zh
- Eszközhívás: Igen
- Válaszformátumok: Szöveg, JSON
- Globális szabvány (minden régió) Öntöde, hub-alapú
DeepSeek-R1-0528 chat-completion
(érvelési tartalommal)
- Bemenet: szöveg (163 840 token)
- Kimenet: (163 840 token)
- Nyelvek:en és zh
- Eszközhívás: Nem
- Válaszformátumok: Szöveg.
- Globális szabvány (minden régió)
- Globálisan kiépített (minden régió)
Öntöde, hub-alapú
DeepSeek-V3-0324 chat-completion - Bemenet: szöveg (131 072 token)
- Kimenet: (131 072 token)
- Nyelvek:en és zh
- Eszközhívás: Igen
- Válaszformátumok: Szöveg, JSON
- Globális szabvány (minden régió)
- Globálisan kiépített (minden régió)
Öntöde, hub-alapú
DeepSeek-R1 chat-completion
(érvelési tartalommal)
- Bemenet: szöveg (163 840 token)
- Kimenet: (163 840 token)
- Nyelvek:en és zh
- Eszközhívás: Nem
- Válaszformátumok: Szöveg.
- Globális szabvány (minden régió)
- Globálisan kiépített (minden régió)
Öntöde, hub-alapú
Model Típus Capabilities Üzembe helyezés típusa (régió rendelkezésre állása)
DeepSeek-V3.2-Speciale chat-completion
(érvelési tartalommal)
- Bemenet: szöveg (128 000 token)
- Kimenet: (128 000 token)
- Nyelvek:en és zh
- Eszközhívás: Nem
- Válaszformátumok: Szöveg, JSON
- Globális szabvány (minden régió)
DeepSeek-V3.2 chat-completion
(érvelési tartalommal)
- Bemenet: szöveg (128 000 token)
- Kimenet: (128 000 token)
- Nyelvek:en és zh
- Eszközhívás: Nem
- Válaszformátumok: Szöveg, JSON
- Globális szabvány (minden régió)
DeepSeek-V3.1 chat-completion
(érvelési tartalommal)
- Bemenet: szöveg (131 072 token)
- Kimenet: (131 072 token)
- Nyelvek:en és zh
- Eszközhívás: Igen
- Válaszformátumok: Szöveg, JSON
- Globális szabvány (minden régió)
DeepSeek-R1-0528 chat-completion
(érvelési tartalommal)
- Bemenet: szöveg (163 840 token)
- Kimenet: (163 840 token)
- Nyelvek:en és zh
- Eszközhívás: Nem
- Válaszformátumok: Szöveg.
- Globális szabvány (minden régió)
- Globálisan kiépített (minden régió)
DeepSeek-V3-0324 chat-completion - Bemenet: szöveg (131 072 token)
- Kimenet: (131 072 token)
- Nyelvek:en és zh
- Eszközhívás: Igen
- Válaszformátumok: Szöveg, JSON
- Globális szabvány (minden régió)
- Globálisan kiépített (minden régió)
DeepSeek-R1 chat-completion
(érvelési tartalommal)
- Bemenet: szöveg (163 840 token)
- Kimenet: (163 840 token)
- Nyelvek:en és zh
- Eszközhívás: Nem
- Válaszformátumok: Szöveg.
- Globális szabvány (minden régió)
- Globálisan kiépített (minden régió)

Tekintse meg ezt a modellgyűjteményt az Foundry portálon.

Közvetlenül az Azure által értékesített metamodellek

A Meta Llama modellek és eszközök előre betanított és finomhangolt, generatív AI szöveg- és képértelmező modellek gyűjteménye. A metamodellek skálázási tartománya a következőkre terjed ki:

  • Kis nyelvi modellek (SLM-ek), például 1B és 3B alapmodellek, valamint instrukciós modellek az eszköz- és peremhálózati következtetéshez
  • Közepes méretű nagy nyelvi modellek (LLM-ek), például 7B, 8B és 70B alap- és instruktúramodellek
  • Olyan nagy teljesítményű modellek, mint a Meta Llama 3.1-405B Instruct for szintetikus adatgenerálási és desztillációs használati esetek.
Model Típus Capabilities Üzembe helyezés típusa (régió rendelkezésre állása) Projekttípus
Llama-4-Maverick-17B-128E-Instruct-FP8 chat-completion - Bemenet: szöveg és képek (1M tokenek)
- Kimenet: szöveg (1M-jogkivonatok)
- Nyelvek:ar, en, fr, de, hi, id, it, pt, es, tl, th, és vi
- Eszközhívás: Nem
- Válaszformátumok: Szöveg
- Globális szabvány (minden régió) Öntöde, hub-alapú
Llama-3.3-70B-Instruct chat-completion - Bemenet: szöveg (128 000 token)
- Kimenet: szöveg (8192 token)
- Nyelvek:en, de, fr, it, pt, hi, esés th
- Eszközhívás: Nem
- Válaszformátumok: Szöveg
- Globális szabvány (minden régió) Öntöde, hub-alapú
Model Típus Capabilities Üzembe helyezés típusa (régió rendelkezésre állása)
Llama-4-Maverick-17B-128E-Instruct-FP8 chat-completion - Bemenet: szöveg és képek (1M tokenek)
- Kimenet: szöveg (1M-jogkivonatok)
- Nyelvek:ar, en, fr, de, hi, id, it, pt, es, tl, th, és vi
- Eszközhívás: Nem
- Válaszformátumok: Szöveg
- Globális szabvány (minden régió)
Llama-3.3-70B-Instruct chat-completion - Bemenet: szöveg (128 000 token)
- Kimenet: szöveg (8192 token)
- Nyelvek:en, de, fr, it, pt, hi, esés th
- Eszközhívás: Nem
- Válaszformátumok: Szöveg
- Globális szabvány (minden régió)

Tekintse meg ezt a modellgyűjteményt az Foundry portálon. A partnerek és a közösség számos metamodellt is találhat.

Közvetlenül az Azure által értékesített Microsoft-modellek

A Microsoft-modellek különböző modellcsoportokat tartalmaznak, például a Model Routert, a MAI-modelleket, a Phi-modelleket, az egészségügyi AI-modelleket stb. Tekintse meg a Microsoft-modellgyűjteményt az Foundry portálon. A partnerektől és a közösségtől is számos Microsoft-modell érhető el.

Model Típus Capabilities Üzembe helyezés típusa (régió rendelkezésre állása) Projekttípus
model-router1 chat-completion További részletek a Modell útválasztó áttekintésében.
- Bemenet: szöveg, kép
- Kimenet: szöveg (a kimeneti tokének maximális száma változó2)
Környezeti ablak: 200 0003
- Nyelvek:en
- Globális szabvány (USA 2. keleti régiója, Közép-Svédország)
- Data Zone Standard4 (USA 2. keleti régiója, Közép-Svédország)
Öntöde, hub-alapú
MAI-DS-R1 chat-completion
(érvelési tartalommal)
- Bemenet: szöveg (163 840 token)
- Kimenet: (163 840 token)
- Nyelvek:en és zh
- Eszközhívás: Nem
- Válaszformátumok: Szöveg.
- Globális szabvány (minden régió) Öntöde, hub-alapú
Model Típus Capabilities Üzembe helyezés típusa (régió rendelkezésre állása)
model-router1 chat-completion További részletek a Modell útválasztó áttekintésében.
- Bemenet: szöveg, kép
- Kimenet: szöveg (a kimeneti tokének maximális száma változó2)
Környezeti ablak: 200 0003
- Nyelvek:en
- Globális szabvány (USA 2. keleti régiója, Közép-Svédország)
- Data Zone Standard4 (USA 2. keleti régiója, Közép-Svédország)
MAI-DS-R1 chat-completion
(érvelési tartalommal)
- Bemenet: szöveg (163 840 token)
- Kimenet: (163 840 token)
- Nyelvek:en és zh
- Eszközhívás: Nem
- Válaszformátumok: Szöveg.
- Globális szabvány (minden régió)

1Router modell verzió2025-11-18. A korábbi verziók (2025-08-07 és 2025-05-19) is elérhetők.

2A maximális kimeneti jogkivonatok a modell útválasztójának mögöttes modelljeinél eltérőek. Például: 32 768 (GPT-4.1 series), 100 000 (o4-mini), 128 000 (gpt-5 reasoning models) és 16 384 (gpt-5-chat).

3 A nagyobb környezetablakok kompatibilisek a modell útválasztójának néhány mögöttes modelljével. Ez azt jelenti, hogy a nagyobb környezettel rendelkező API-hívások csak akkor lesznek sikeresek, ha a rendszer a kérést egy ilyen modellhez irányítja. Ellenkező esetben a hívás meghiúsul.

4 A Data Zone Standard modell útválasztók telepítésének számlázása legkorábban 2025. november 1-én kezdődik.

Közvetlenül az Azure által értékesített mistral modellek

Model Típus Capabilities Üzembe helyezés típusa (régió rendelkezésre állása) Projekttípus
Mistral-Large-3 chat-completion - Bemenet: szöveg, kép
- Kimenet: szöveg
- Nyelvek:en, fr, de, es, it, pt, nl, zh, ja, koés ar
- Eszközhívás: Igen
- Válaszformátumok: Szöveg, JSON
- Globális szabvány (USA 3. nyugati régiója) Öntöde
mistral-document-ai-2505 Képről szövegre - Bemenet: kép- vagy PDF-oldalak (30 oldal, legfeljebb 30 MB PDF-fájl)
- Kimenet: szöveg
- Nyelvek:en
- Eszközhívás: nem
- Válaszformátumok: Szöveg, JSON, Markdown
- Globális szabvány (minden régió)
- Adatzóna szabvány (USA és EU)
Öntöde
Model Típus Capabilities Üzembe helyezés típusa (régió rendelkezésre állása)
Mistral-Large-3 chat-completion - Bemenet: szöveg, kép
- Kimenet: szöveg
- Nyelvek:en, fr, de, es, it, pt, nl, zh, ja, koés ar
- Eszközhívás: Igen
- Válaszformátumok: Szöveg, JSON
- Globális szabvány (USA 3. nyugati régiója)
mistral-document-ai-2505 Képről szövegre - Bemenet: kép- vagy PDF-oldalak (30 oldal, legfeljebb 30 MB PDF-fájl)
- Kimenet: szöveg
- Nyelvek:en
- Eszközhívás: nem
- Válaszformátumok: Szöveg, JSON, Markdown
- Globális szabvány (minden régió)
- Adatzóna szabvány (USA és EU)

Tekintse meg a Mistral modellgyűjteményt az Foundry portálon. A partnerek és a közösség számos Mistral-modellel is elérhető.

Közvetlenül az Azure által értékesített Moonshot AI-modellek

A Moonshot AI-modellek közé tartozik a Kimi K2 Thinking, a nyílt forráskódú gondolkodási modell legújabb, leginkább alkalmas verziója. A Kimi K2 olyan gondolkodó ügynökként készült, amely lépésről lépésre érvel, miközben dinamikusan használja az eszközöket. Az emberiség utolsó vizsgáján (HLE), a BrowseComp-on és más teljesítménymutatókon alapuló új csúcsot állít be a többlépéses érvelés mélységének drasztikus skálázásával és a stabil eszközhasználat fenntartásával 200–300 egymást követő hívás során.

A Kimi K2 Gondolkodás főbb képességei a következők:

  • Mély gondolkodás és eszközvezérlés: Végponttól végpontig betanítva a gondolatláncok és a függvényhívások összekapcsolására, lehetővé téve az autonóm kutatást, kódolást és szövegírást olyan munkafolyamatokban, amelyek több száz lépésen át sodródásmentesen tartanak.
  • Natív INT4 kvantálás: A kvantálás-tudatos betanítást (QAT) a betanítás utáni szakaszban alkalmazzák az alacsony késleltetésű módban történő veszteségmentes, kétszeres gyorsítás érdekében.
  • Stabil Long-Horizon Ügynökség: Következetes célirányos viselkedést biztosít akár 200–300 egymást követő eszközhívásban, felülmúlva a korábbi modelleket, amelyek 30–50 lépés után romlanak.
Model Típus Capabilities Üzembe helyezés típusa (régió rendelkezésre állása) Projekttípus
Kimi-K2-Thinking chat-completion
(érvelési tartalommal)
- Bemenet: szöveg (262 144 token)
- Kimenet: szöveg (262 144 jogkivonat)
- Nyelvek:en és zh
- Eszközhívás: Igen
- Válaszformátumok: Szöveg
- Globális szabvány (minden régió) Öntöde, hub-alapú
Model Típus Capabilities Üzembe helyezés típusa (régió rendelkezésre állása)
Kimi-K2-Thinking chat-completion
(érvelési tartalommal)
- Bemenet: szöveg (262 144 token)
- Kimenet: szöveg (262 144 jogkivonat)
- Nyelvek:en és zh
- Eszközhívás: Igen
- Válaszformátumok: Szöveg
- Globális szabvány (minden régió)

Tekintse meg ezt a modellgyűjteményt az Foundry portálon.

közvetlenül az Azure által értékesített xAI-modellek

Az xAI Foundry Models Grok-modelljei különféle vállalati területeken való kiváló teljesítményre tervezett modelleket tartalmaznak, változatos képességekkel és árpontokkal, többek között a következőkkel:

  • A Grok 3, a Colossus adatközpont által előre betanított nem érvelési modell üzleti használati esetekre, például adatkinyeréshez, kódoláshoz és szövegösszesítéshez van kialakítva, kivételes utasításkövetési képességekkel. 131 072 jogkivonatos környezetablakot támogat, amely lehetővé teszi a kiterjedt bemenetek kezelését a koherencia és a mélység fenntartása mellett, és alkalmas a tartományok és nyelvek közötti kapcsolatok rajzolására.

  • A Grok 3 Mini egy egyszerű érvelési modell, amely a tesztelési idő számításával kapcsolatos ügynöki, kódolási, matematikai és mély tudományos problémák kezelésére lett betanítve. Emellett egy 131 072 tokenes kontextusablakot is támogat a kódbázisok és a vállalati dokumentumok megértéséhez. Kiválóan használható eszközök alkalmazásával a bonyolult logikai problémák megoldására új környezetekben, és nyers érvelési nyomokat kínál felhasználói ellenőrzéshez, állítható gondolati keretek mellett.

  • Grok Code Fast 1, egy gyors és hatékony érvelési modell, amelyet ügynöki kódolási alkalmazásokhoz terveztek. Előzetesen betanítottuk egy kódolásra összpontosító adatkeveréken, majd utólagos képzésként különböző kódolási feladatok és eszközhasználat bemutatásán, valamint az xAI biztonsági irányelvein alapuló helyes elutasítási viselkedések bemutatásán dolgoztunk. A grok-code-fast-1 modellhez való hozzáféréshez regisztráció szükséges.

  • A Grok 4 Fast egy hatékonyságoptimalizált nyelvi modell, amely jelentősen alacsonyabb késéssel és költséggel nyújt közel Grok 4 érvelési képességeket, és teljesen megkerülheti az érvelést az ultragyors alkalmazások esetében. Kiképzett a biztonságos és hatékony eszközhasználatra, beépített elutasító viselkedéssel, fixen beállított biztonsági előíró rendszerrel és bemeneti szűrőkkel a visszaélések megelőzése érdekében.

  • A Grok 4 az xAI legújabb érvelési modellje fejlett érvelési és eszközhasználati képességekkel, lehetővé téve, hogy új, korszerű teljesítményt érjen el a kihívást jelentő tudományos és iparági teljesítménytesztek között. A grok-4 modellhez való hozzáféréshez regisztráció szükséges. A Grok 4 Fast (érvelési és nem érvelési) modellekkel ellentétben a Grok 4 nem támogatja a képbevitelt.

Model Típus Capabilities Üzembe helyezés típusa (régió rendelkezésre állása) Projekttípus
grok-4 chat-completion - Bemenet: szöveg (256 000 token)
- Kimenet: szöveg (8192 token)
- Nyelvek:en
- Eszközhívás: igen
- Válaszformátumok: szöveg
- Globális szabvány (minden régió) Öntöde, hub-alapú
grok-4-fast-reasoning chat-completion - Bemenet: szöveg, kép (2 000 000 token)
- Kimenet: szöveg (2 000 000 token)
- Nyelvek:en
- Eszközhívás: igen
- Válaszformátumok: szöveg
- Globális szabvány (minden régió)
- Adatzóna standard (USA)
Öntöde, hub-alapú
grok-4-fast-non-reasoning chat-completion - Bemenet: szöveg, kép (2 000 000 token)
- Kimenet: szöveg (2 000 000 token)
- Nyelvek:en
- Eszközhívás: igen
- Válaszformátumok: szöveg
- Globális szabvány (minden régió)
- Adatzóna standard (USA)
Öntöde, hub-alapú
grok-code-fast-1 chat-completion - Bemenet: szöveg (256 000 token)
- Kimenet: szöveg (8192 token)
- Nyelvek:en
- Eszközhívás: igen
- Válaszformátumok: szöveg
- Globális szabvány (minden régió) Öntöde, hub-alapú
grok-3 chat-completion - Bemenet: szöveg (131 072 token)
- Kimenet: szöveg (131 072 token)
- Nyelvek:en
- Eszközhívás: igen
- Válaszformátumok: szöveg
- Globális szabvány (minden régió)
- Adatzóna standard (USA)
Öntöde, hub-alapú
grok-3-mini chat-completion - Bemenet: szöveg (131 072 token)
- Kimenet: szöveg (131 072 token)
- Nyelvek:en
- Eszközhívás: igen
- Válaszformátumok: szöveg
- Globális szabvány (minden régió)
- Adatzóna standard (USA)
Öntöde, hub-alapú
Model Típus Capabilities Üzembe helyezés típusa (régió rendelkezésre állása)
grok-4 chat-completion - Bemenet: szöveg, kép (256 000 token)
- Kimenet: szöveg (8192 token)
- Nyelvek:en
- Eszközhívás: igen
- Válaszformátumok: szöveg
- Globális szabvány (minden régió)
grok-4-fast-reasoning chat-completion - Bemenet: szöveg, kép (2 000 000 token)
- Kimenet: szöveg (2 000 000 token)
- Nyelvek:en
- Eszközhívás: igen
- Válaszformátumok: szöveg
- Globális szabvány (minden régió)
- Adatzóna standard (USA)
grok-4-fast-non-reasoning chat-completion - Bemenet: szöveg, kép (2 000 000 token)
- Kimenet: szöveg (2 000 000 token)
- Nyelvek:en
- Eszközhívás: igen
- Válaszformátumok: szöveg
- Globális szabvány (minden régió)
- Adatzóna standard (USA)
grok-code-fast-1 chat-completion - Bemenet: szöveg (256 000 token)
- Kimenet: szöveg (8192 token)
- Nyelvek:en
- Eszközhívás: igen
- Válaszformátumok: szöveg
- Globális szabvány (minden régió)
grok-3 chat-completion - Bemenet: szöveg (131 072 token)
- Kimenet: szöveg (131 072 token)
- Nyelvek:en
- Eszközhívás: igen
- Válaszformátumok: szöveg
- Globális szabvány (minden régió)
- Adatzóna standard (USA)
grok-3-mini chat-completion - Bemenet: szöveg (131 072 token)
- Kimenet: szöveg (131 072 token)
- Nyelvek:en
- Eszközhívás: igen
- Válaszformátumok: szöveg
- Globális szabvány (minden régió)
- Adatzóna standard (USA)

Tekintse meg az xAI-modellgyűjteményt az Foundry portálon.

Modellrégió rendelkezésre állása üzembe helyezési típus szerint

Az Öntödei modellek lehetőséget adnak az üzleti és használati mintáknak megfelelő üzemeltetési struktúra kialakítására. A szolgáltatás két fő üzembe helyezési típust kínál:

  • Standard: Globális üzembe helyezési lehetőséggel rendelkezik, amely globálisan irányítja a forgalmat, hogy nagyobb átviteli sebességet biztosítson.
  • Kiépített: Globális üzembe helyezési lehetőséggel is rendelkezik, amely lehetővé teszi a kiépített átviteli egységek megvásárlását és üzembe helyezését az Azure globális infrastruktúrában.

Minden üzembe helyezés ugyanazt a következtetési műveletet hajtja végre, de a számlázás, a skálázás és a teljesítmény eltérő. Az üzembe helyezési típusokról további információt a Foundry modellek telepítési típusai témakörben talál.

Globális standard modell rendelkezésre állása

Régió DeepSeek-R1-0528 DeepSeek-R1 DeepSeek-V3-0324 DeepSeek-V3.1 FLUX.1-Kontext-pro FLUX-1.1-pro grok-4 grok-4-fast-reasoning grok-4-fast-non-reasoning grok-code-fast-1 grok-3 grok-3-mini Llama-4-Maverick-17B-128E-Instruct-FP8 Llama-3.3-70B-Instruct MAI-DS-R1 mistral-document-ai-2505
AustraliaEast
Brazília déli régiója
Kanada keleti része
eastus
eastus2
francecentral
Németország Közép-Nyugat
Olaszország északa
japaneast
koreacentral
northcentralus
Norvégia keleti része
Lengyel központ
southafricanorth
southcentralus
Dél-India
spaincentral
Swedencentral
Svájc észak
switzerlandwest
uaenorth
uksouth
Nyugat-Európa
westus
westus3

Nyitott és egyéni modellek

A modellkatalógus a szolgáltatók szélesebb köréből származó modellek nagyobb választékát kínálja. Ezekben a modellekben nem használhatja a standard üzembe helyezés lehetőségét a Microsoft Foundry-erőforrásokban, ahol a modellek API-kként vannak megadva. A modellek üzembe helyezéséhez előfordulhat, hogy az infrastruktúrában kell üzemeltetnie őket, létre kell hoznia egy AI-központot, és meg kell adnia a mögöttes számítási kvótát a modellek üzemeltetéséhez.

Ezenkívül ezek a modellek lehetnek nyílt hozzáférésűek vagy IP-védelem alatt állnak. Mindkét esetben üzembe kell helyeznie őket a Foundry felügyelt számítási ajánlataiban. Első lépésként tekintse meg a útmutatót: Üzembe helyezés felügyelt számítási környezetben.