Az Azure OpenAI Service modelljei
Az Azure OpenAI szolgáltatást különböző képességekkel és árpontokkal rendelkező modellek változatos halmaza működteti. A modell rendelkezésre állása régiónként és felhőnként eltérő. Az Azure Government-modell rendelkezésre állásával kapcsolatban tekintse meg az Azure Government OpenAI szolgáltatást.
Modellek | Leírás |
---|---|
o1-preview és o1-mini | Korlátozott hozzáférési modellek, amelyek kifejezetten az érvelési és problémamegoldási feladatok nagyobb összpontosítással és képességgel való kezelésére lettek kialakítva. |
GPT-4o & GPT-4o mini & GPT-4 Turbo | A legújabb, többmodális verziójú Azure OpenAI-modellek, amelyek bemenetként szövegeket és képeket is elfogadnak. |
GPT-4o hang | A GPT-4o modell, amely támogatja az alacsony késleltetésű, "beszéd, beszéd ki" beszélgetési interakciókat. |
GPT-4 | A GPT-3.5-ben fejleszthető modellek, amelyek képesek megérteni és létrehozni a természetes nyelvet és kódot. |
GPT-3.5 | A GPT-3-on fejleszthető modellek, amelyek képesek megérteni és létrehozni a természetes nyelvet és a kódot. |
Beágyazások | Olyan modellek készlete, amelyek a szöveg numerikus vektorformává alakíthatók a szöveg hasonlóságának megkönnyítése érdekében. |
DALL-E | Olyan modellek sorozata, amelyek eredeti képeket hozhatnak létre természetes nyelvről. |
Súg | Előzetes verziójú modellek sorozata, amelyek átírhatják és lefordíthatják a beszédet szöveggé. |
Szövegfelolvasás (előzetes verzió) | Egy előzetes verziójú modellsorozat, amely képes szövegfelolvasásra. |
o1-preview és o1-mini modellek korlátozott hozzáféréssel
Az Azure OpenAI o1-preview
és o1-mini
a modellek kifejezetten az érvelési és problémamegoldási feladatok nagyobb összpontosítással és képességgel való kezelésére lettek kialakítva. Ezek a modellek több időt töltenek a felhasználó kérésének feldolgozásával és megértésével, így rendkívül erősek a korábbi iterációkhoz képest olyan területeken, mint a tudomány, a kódolás és a matematika.
Modellazonosító | Leírás | Maximális kérelem (jogkivonatok) | Betanítási adatok (legfeljebb) |
---|---|---|---|
o1-preview (2024-09-12) |
Az o1 sorozat legtehatósabb modellje, amely továbbfejlesztett érvelési képességeket kínál. | Bemenet: 128 000 Kimenet: 32 768 |
2023. október |
o1-mini (2024-09-12) |
Gyorsabb és költséghatékonyabb megoldás az o1 sorozatban, amely ideális a sebességet és alacsonyabb erőforrás-felhasználást igénylő feladatok kódolásához. | Bemenet: 128 000 Kimenet: 65 536 |
2023. október |
Elérhetőség
A o1-preview
modellek mostantól o1-mini
elérhetők API-hozzáféréshez és modelltelepítéshez. Regisztráció szükséges, és a hozzáférés a Microsoft jogosultsági feltételei alapján lesz megadva.
Hozzáférés kérése: korlátozott hozzáférésű modellalkalmazás
A hozzáférés megadása után minden modellhez létre kell hoznia egy üzembe helyezést.
API-támogatás
Az o1 sorozatú modellek támogatása az API-verzióban 2024-09-01-preview
lett hozzáadva.
A max_tokens
paraméter elavult, és az új max_completion_tokens
paraméterre cserélődött. o1 sorozatú modellek csak a max_completion_tokens
paraméterrel működnek.
Használat
Ezek a modellek jelenleg nem támogatják ugyanazokat a paramétereket, mint a csevegésvégzítési API-t használó többi modell. Jelenleg csak egy nagyon korlátozott részhalmaz támogatott, ezért az olyan gyakori paraméterek, mint például temperature
a , top_p
nem érhetők el, és azokat is beleszámítva a kérés sikertelen lesz. o1-preview
és o1-mini
a modellek nem fogadják el a rendszer üzenetszerepkörét az üzenettömb részeként.
Előfordulhat, hogy frissítenie kell az OpenAI Python-kódtár verzióját, hogy kihasználhassa az új max_completion_tokens
paraméter előnyeit.
pip install openai --upgrade
Ha még nem használta a Microsoft Entra ID-t a hitelesítéshez, olvassa el az Azure OpenAI szolgáltatás Microsoft Entra ID-hitelesítéssel való konfigurálását ismertető témakört.
from openai import AzureOpenAI
from azure.identity import DefaultAzureCredential, get_bearer_token_provider
token_provider = get_bearer_token_provider(
DefaultAzureCredential(), "https://cognitiveservices.azure.com/.default"
)
client = AzureOpenAI(
azure_endpoint = os.getenv("AZURE_OPENAI_ENDPOINT"),
azure_ad_token_provider=token_provider,
api_version="2024-09-01-preview"
)
response = client.chat.completions.create(
model="o1-preview-new", # replace with the model deployment name of your o1-preview, or o1-mini model
messages=[
{"role": "user", "content": "What steps should I think about when writing my first Python API?"},
],
max_completion_tokens = 5000
)
print(response.model_dump_json(indent=2))
Régiónkénti elérhetőség
Standard és globális standard üzembe helyezéshez érhető el az USA 2. keleti régiójában és a Svédország középső régiójában jóváhagyott ügyfelek számára.
GPT-4o hang
A gpt-4o-realtime-preview
modell a GPT-4o modellcsalád része, és támogatja az alacsony késleltetésű, "beszéd, beszéd ki" beszélgetési interakciókat. A GPT-4o hang a valós idejű, alacsony késleltetésű beszélgetési interakciók kezelésére lett kialakítva, így kiválóan alkalmas támogató ügynökök, asszisztensek, fordítók és egyéb használati esetek kezelésére, amelyekhez a felhasználóval együtt rendkívül rugalmas háttérrendszerre van szükség.
A GPT-4o hang az USA 2. keleti régiójában (eastus2
) és Svédország középső (swedencentral
) régiójában érhető el. A GPT-4o hang használatához létre kell hoznia vagy használnia kell egy meglévő erőforrást az egyik támogatott régióban.
Az erőforrás létrehozásakor üzembe helyezheti a GPT-4o hangmodellt. Ha programozott üzembe helyezést végez, a modell neve .gpt-4o-realtime-preview
A GPT-4o hang használatáról további információt a GPT-4o hangdokumentációjában talál.
A kérelmek maximális jogkivonatairól és a betanítási adatokról az alábbi táblázatban olvashat.
Modellazonosító | Leírás | Maximális kérelem (jogkivonatok) | Betanítási adatok (legfeljebb) |
---|---|---|---|
gpt-4o-realtime-preview (2024-10-01-preview) GPT-4o hang |
Hangmodell valós idejű hangfeldolgozáshoz | Bemenet: 128 000 Kimenet: 4096 |
2023. október |
GPT-4o és GPT-4 Turbo
A GPT-4o egyetlen modellben integrálja a szöveget és a képeket, így egyszerre több adattípust is képes kezelni. Ez a multimodális megközelítés növeli a pontosságot és a válaszkészséget az emberi-számítógépes interakciókban. A GPT-4o megfelel a GPT-4 Turbo angol nyelvű szöveg- és kódolási feladatainak, miközben kiváló teljesítményt nyújt nem angol nyelvű és látási feladatokban, új teljesítményteszteket állít be az AI-képességekhez.
Hogyan elérni a GPT-4o és a GPT-4o mini modelleket?
A GPT-4o és a GPT-4o mini standard és globális modell üzembe helyezéséhez érhető el.
Meglévő erőforrást kell létrehoznia vagy használnia egy támogatott standard vagy globális standard régióban, ahol a modell elérhető.
Az erőforrás létrehozásakor üzembe helyezheti a GPT-4o modelleket. Ha programozott üzembe helyezést végez, a modell nevei a következők:
gpt-4o
Verzió2024-08-06
gpt-4o
, Verzió2024-05-13
gpt-4o-mini
Verzió2024-07-18
GPT-4 Turbo
A GPT-4 Turbo egy nagy multimodális modell (szöveg- vagy képbemenetek elfogadása és szöveg generálása), amely nagyobb pontossággal képes megoldani a nehéz problémákat, mint az OpenAI korábbi modelljei. A GPT-3.5 Turbo és a régebbi GPT-4 modellekhez hasonlóan a GPT-4 Turbo is csevegésre van optimalizálva, és jól működik a hagyományos befejezési feladatokhoz.
A GPT-4 Turbo legújabb GA kiadása a következő:
gpt-4
Verzió:turbo-2024-04-09
Ez a következő előzetes modellek lecserélése:
gpt-4
Verzió:1106-Preview
gpt-4
Verzió:0125-Preview
gpt-4
Verzió:vision-preview
Az OpenAI és az Azure OpenAI GPT-4 Turbo GA modellek közötti különbségek
- Az OpenAI legújabb
0409
turbómodell verziója támogatja a JSON módot és a függvényeket, amelyek minden következtetési kérést meghívnak. - Az Azure OpenAI legújabb
turbo-2024-04-09
verziója jelenleg nem támogatja a JSON mód és a függvényhívás használatát, amikor következtetési kérelmeket készít képi (vision) bemenettel. A szövegalapú bemeneti kérések (képek nélküliimage_url
és beágyazott kérések) támogatják a JSON-módot és a függvényhívást.
Különbségek a gpt-4 vision-preview-tól
- Az Azure AI-specifikus Vision fejlesztései a GPT-4 Turbo és a Vision együttműködésével nem támogatottak a verzióhoz
gpt-4
:turbo-2024-04-09
. Ez magában foglalja az optikai karakterfelismerést (OCR), az objektumok földelését, a videoüzeneteket és az adatok képekkel való jobb kezelését.
GPT-4 Turbo kiosztott felügyelt rendelkezésre állás
gpt-4
Verzió:turbo-2024-04-09
standard és kiépített üzemelő példányokhoz is elérhető. A modell kiépített verziója jelenleg nem támogatja a kép-/látásbeli következtetési kérelmeket. A modell kiépített üzembe helyezései csak szöveges bemeneteket fogadnak el. A standard modelltelepítések szöveges és képi/látási következtetési kéréseket is elfogadnak.
A GPT-4 Turbo üzembe helyezése a Vision GA-val
Ha a GA-modellt a Studio felhasználói felületén szeretné üzembe helyezni, válassza ki GPT-4
, majd válassza ki a turbo-2024-04-09
verziót a legördülő menüből. A modell alapértelmezett kvótája megegyezik a gpt-4-turbo-2024-04-09
GPT-4-Turbo jelenlegi kvótával. Tekintse meg a regionális kvótakorlátokat.
GPT-4
A GPT-4 a GPT-4 Turbo elődje. Mind a GPT-4, mind a GPT-4 Turbo modellek alapmodelljének gpt-4
neve . A GPT-4 és a Turbo modellek között a modellverzió vizsgálatával lehet különbséget tenni.
gpt-4
Verzió0314
gpt-4
Verzió0613
gpt-4-32k
Verzió0613
A modellösszesítő táblázatban láthatja az egyes modellek által támogatott jogkivonat-környezet hosszát.
GPT-4 és GPT-4 Turbo modellek
- Ezek a modellek csak a Csevegés befejezése API-val használhatók.
A modellverziókból megtudhatja, hogyan kezeli az Azure OpenAI Service a modellverzió-frissítéseket, és hogyan dolgozhat modellekkel a GPT-4 üzemelő példányok modellverzió-beállításainak megtekintéséhez és konfigurálásához.
Modellazonosító | Leírás | Maximális kérelem (jogkivonatok) | Betanítási adatok (legfeljebb) |
---|---|---|---|
gpt-4o (2024-08-06) GPT-4o (Omni) |
A legújabb nagy GA-modell - Strukturált kimenetek - Szöveg, képfeldolgozás - JSON mód - párhuzamos függvényhívás - Nagyobb pontosság és válaszkészség - Parity with English text and coding tasks to GPT-4 Turbo with Vision - Kiváló teljesítmény nem angol nyelven és látási feladatokban |
Bemenet: 128 000 Kimenet: 16 384 |
2023. október |
gpt-4o-mini (2024-07-18) GPT-4o mini |
Legújabb kis GA-modell - Gyors, olcsó, képes modell ideális cseréje GPT-3.5 Turbo sorozatú modellek. - Szöveg, képfeldolgozás - JSON mód - párhuzamos függvényhívás |
Bemenet: 128 000 Kimenet: 16 384 |
2023. október |
gpt-4o (2024-05-13) GPT-4o (Omni) |
Szöveg, képfeldolgozás - JSON mód - párhuzamos függvényhívás - Nagyobb pontosság és válaszkészség - Parity with English text and coding tasks to GPT-4 Turbo with Vision - Kiváló teljesítmény nem angol nyelven és látási feladatokban |
Bemenet: 128 000 Kimenet: 4096 |
2023. október |
gpt-4 (turbo-2024-04-09) GPT-4 Turbo és Vision |
Új GA-modell - Az összes korábbi GPT-4 előzetes modell cseréje ( vision-preview , 1106-Preview , ). 0125-Preview - A funkciók rendelkezésre állása jelenleg eltérő a bemeneti módszertől és az üzembe helyezés típusától függően. |
Bemenet: 128 000 Kimenet: 4096 |
2023. december |
gpt-4 (0125-Preview)*GPT-4 Turbo előzetes verzió |
Mintamodell -Lecseréli az 1106-előzetes verziót – Jobb kódgenerálási teljesítmény – Csökkenti azokat az eseteket, amikor a modell nem végez el feladatot - JSON mód - párhuzamos függvényhívás - reprodukálható kimenet (előzetes verzió) |
Bemenet: 128 000 Kimenet: 4096 |
2023. december |
gpt-4 (vision-preview)GPT-4 Turbo a Vision Előzetes verzióval |
Mintamodell – Szöveg- és képbevitelt fogad el. - Támogatja a fejlesztéseket - JSON mód - párhuzamos függvényhívás - reprodukálható kimenet (előzetes verzió) |
Bemenet: 128 000 Kimenet: 4096 |
2023. ápr. |
gpt-4 (1106-előzetes verzió)GPT-4 Turbo előzetes verzió |
Mintamodell - JSON mód - párhuzamos függvényhívás - reprodukálható kimenet (előzetes verzió) |
Bemenet: 128 000 Kimenet: 4096 |
2023. ápr. |
gpt-4-32k (0613) |
Régebbi GA-modell - Alapszintű függvényhívás eszközökkel |
32,768 | 2021. szeptember |
gpt-4 (0613) |
Régebbi GA-modell - Alapszintű függvényhívás eszközökkel |
8,192 | 2021. szeptember |
gpt-4-32k (0314) |
Régebbi GA-modell - Nyugdíjazási információk |
32,768 | 2021. szeptember |
gpt-4 (0314) |
Régebbi GA-modell - Nyugdíjazási információk |
8,192 | 2021. szeptember |
Figyelemfelhívás
Nem javasoljuk, hogy éles környezetben használjunk előzetes verziójú modelleket. Az előzetes modellek összes üzembe helyezését frissítjük a jövőbeli előzetes verziókra vagy a legújabb stabil GA-verzióra. Az előzetes verzióra kijelölt modellek nem követik a standard Azure OpenAI-modell életciklusát.
- A GPT-4 0125-előzetes verziója a GPT-4 Turbo előzetes verzió frissített verziója, amely korábban 1106-os előzetes verzióként jelent meg.
- A GPT-4 0125-előzetes verziója olyan feladatokat hajt végre, mint a kódlétrehozás a gpt-4-1106-előzetes verzióhoz képest. Emiatt a feladattól függően az ügyfelek azt tapasztalhatják, hogy a GPT-4-0125-preview több kimenetet generál a gpt-4-1106-preview-hoz képest. Javasoljuk, hogy az ügyfelek hasonlítsák össze az új modell kimeneteit. A GPT-4-0125-preview a gpt-4-1106-preview hibáit is elhárítja, a nem angol nyelvű UTF-8 kezeléssel.
- A GPT-4 verzió
turbo-2024-04-09
a legújabb GA-kiadás, és lecseréli0125-Preview
a ,1106-preview
ésvision-preview
.
Fontos
A GPT-4 (gpt-4
) verziók1106-Preview
0125-Preview
, és vision-preview
a jövőben egy stabil verzióval gpt-4
lesznek frissítve.
- A verziók
1106-Preview
központi telepítéseigpt-4
,0125-Preview
ésvision-preview
az "Automatikus frissítés alapértelmezettre" és a "Frissítés lejárt" értékre állítás után a rendszer a stabil verzió kiadása után megkezdi a frissítését. Minden üzemelő példány esetében a modellverzió frissítése az API-hívások szolgáltatásának megszakítása nélkül történik. A frissítések régiónként vannak megosztva, és a teljes frissítési folyamat várhatóan 2 hétig tart. - A verziók
1106-Preview
központi telepítéseigpt-4
,0125-Preview
ésvision-preview
a "Nincs automatikus frissítés" beállítás nem lesz frissítve, és leállnak, amikor az előzetes verziót frissítik a régióban. A frissítés időzítésével kapcsolatos további információkért tekintse meg az Azure OpenAI-modell kivonásait és elavulását .
GPT-3.5
A GPT-3.5 modellek képesek megérteni és létrehozni a természetes nyelvet vagy kódot. A GPT-3.5 család leginkább alkalmas és költséghatékony modellje a GPT-3.5 Turbo, amely csevegésre lett optimalizálva, és jól működik a hagyományos befejezési feladatokhoz is. A GPT-3.5 Turbo a Chat Completions API-val használható. A GPT-3.5 Turbo Instruct hasonló képességekkel text-davinci-003
rendelkezik a Befejezések API használatához a Csevegés befejezések API helyett. A GPT-3.5 Turbo és a GPT-3.5 Turbo Instruct örökölt GPT-3.5 és GPT-3 modellek használatát javasoljuk.
Modellazonosító | Leírás | Maximális kérelem (jogkivonatok) | Betanítási adatok (legfeljebb) |
---|---|---|---|
gpt-35-turbo (0125) ÚJ |
Legújabb GA-modell - JSON mód - párhuzamos függvényhívás - reprodukálható kimenet (előzetes verzió) - Nagyobb pontosság a kért formátumokban való válaszadáshoz. – Kijavítottunk egy hibát, amely szövegkódolási hibát okozott a nem angol nyelvű függvényhívások esetében. |
Bemenet: 16 385 Kimenet: 4096 |
2021. szeptember |
gpt-35-turbo (1106) |
Régebbi GA-modell - JSON mód - párhuzamos függvényhívás - reprodukálható kimenet (előzetes verzió) |
Bemenet: 16 385 Kimenet: 4096 |
2021. szeptember |
gpt-35-turbo-instruct (0914) |
Csak befejezési végpont - Régi befejezési modellek cseréje |
4,097 | 2021. szeptember |
gpt-35-turbo-16k (0613) |
Régebbi GA-modell - Alapszintű függvényhívás eszközökkel |
16,384 | 2021. szeptember |
gpt-35-turbo (0613) |
Régebbi GA-modell - Alapszintű függvényhívás eszközökkel |
4,096 | 2021. szeptember |
gpt-35-turbo 1 (0301) |
Régebbi GA-modell - Nyugdíjazási információk |
4,096 | 2021. szeptember |
Ha többet szeretne megtudni a GPT-3.5 Turbo és a Csevegés befejezések API használatáról, tekintse meg részletes útmutatónkat.
1 Ez a modell 4096 jogkivonatot > fogad el. Nem ajánlott túllépni a 4096 bemeneti jogkivonat korlátját, mivel a modell újabb verziója 4096 jogkivonaton van leképezve. Ha 4096 bemeneti jogkivonat túllépésekor problémákat tapasztal ezzel a modellel, ez a konfiguráció hivatalosan nem támogatott.
Beágyazások
text-embedding-3-large
A legújabb és leginkább alkalmas beágyazási modell. A beágyazási modellek közötti frissítés nem lehetséges. Ahhoz, hogy áttérjen a használatról text-embedding-ada-002
, text-embedding-3-large
új beágyazásokat kell létrehoznia.
text-embedding-3-large
text-embedding-3-small
text-embedding-ada-002
A tesztelés során az OpenAI a nagy és a kis harmadik generációs beágyazási modelleket is jobb átlagos többnyelvű lekérési teljesítményt nyújt a MIRACL-teljesítményteszttel , miközben továbbra is fenntartja az angol feladatok teljesítményét az MTEB-teljesítményteszttel .
Kiértékelési teljesítményteszt | text-embedding-ada-002 |
text-embedding-3-small |
text-embedding-3-large |
---|---|---|---|
MIRACL-átlag | 31.4 | 44.0 | 54.9 |
MTEB-átlag | 61,0 | 62.3 | 64.6 |
A harmadik generációs beágyazási modellek támogatják a beágyazás méretének csökkentését egy új dimensions
paraméterrel. A nagyobb beágyazások általában számítási, memória- és tárolási szempontból drágábbak. A dimenziók számának módosításához nagyobb mértékben szabályozható a teljes költség és a teljesítmény. A dimensions
paraméter nem támogatott az OpenAI 1.x Python-kódtár minden verziójában, ezért javasoljuk, hogy a paramétert a legújabb verzióra frissítse: pip install openai --upgrade
.
Az OpenAI MTEB benchmark-tesztje azt találta, hogy még akkor is, ha a harmadik generációs modell méretei 1536-nál text-embeddings-ada-002
kisebbre csökkennek, a teljesítmény kissé jobb marad.
DALL-E
A DALL-E modellek képeket hoznak létre a felhasználó által megadott szöveges kérésekből. A DALL-E 3 általánosan elérhető a REST API-khoz. A DALL-E 2 és a DALL-E 3 ügyféloldali SDK-kkal előzetes verzióban érhető el.
Súg
A Suttogó modellek szövegfelolvasáshoz használhatók.
A Whisper-modellt az Azure AI Speech kötegelt átírási API-val is használhatja. További információ az Azure AI Speech és az Azure OpenAI szolgáltatás használatáról: Mi a Whisper-modell?
Szövegfelolvasás (előzetes verzió)
A jelenleg előzetes verzióban elérhető OpenAI-szöveg-beszédmodellek a szöveg beszédszintézisére használhatók.
Az OpenAI szöveget az Azure AI Speech használatával is beszédre használhatja. További információ: OpenAI text to speech voices via Azure OpenAI Service vagy Azure AI Speech guide.
Modellösszesítő táblázat és régió rendelkezésre állása
Feljegyzés
Ez a cikk elsősorban a Standard üzembehelyezési típusokkal rendelkező összes Azure OpenAI-ügyfélre érvényes modell/régió rendelkezésre állását ismerteti. Egyes kiválasztott ügyfelek hozzáférhetnek az alábbi egyesített táblázatban nem szereplő modell-/régiókombinációkhoz. A kiépített üzembe helyezésekkel kapcsolatos további információkért tekintse meg a kiépített útmutatót.
Standard üzemi modell rendelkezésre állása
Régió | o1-preview, 2024-09-12 | o1-mini, 2024-09-12 | gpt-4, 0613 | gpt-4, 1106-Preview | gpt-4, 0125-Preview | gpt-4, vision-preview | gpt-4, turbo-2024-04-09 | gpt-4o, 2024-05-13 | gpt-4o, 2024-08-06 | gpt-4o-mini, 2024-07-18 | gpt-4-32k, 0613 | gpt-35-turbo, 0301 | gpt-35-turbo, 0613 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 | gpt-35-turbo-16k, 0613 | gpt-35-turbo-instruct, 0914 | text-embedding-ada-002, 1 | text-embedding-ada-002, 2 | text-embedding-3-small, 1 | text-embedding-3-large, 1 | dall-e-2, 2.0 | dall-e-3, 3.0 | babbage-002, 1 | davinci-002, 1 | tts, 001 | tts-hd, 001 | whisper, 001 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
ausztráliaeast | - | - | ✅ | ✅ | - | ✅ | - | - | - | - | ✅ | - | ✅ | ✅ | - | ✅ | - | - | ✅ | - | - | - | ✅ | - | - | - | - | - |
brazilsouth | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - | - |
canadaeast | - | - | ✅ | ✅ | - | - | - | - | - | - | ✅ | - | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
eastus | - | - | - | - | ✅ | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - |
eastus2 | ✅ | ✅ | - | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | ✅ |
francecentral | - | - | ✅ | ✅ | - | - | - | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | - | ✅ | - | - | - | - | - | - | - |
japaneast | - | - | - | - | - | ✅ | - | - | - | - | - | - | ✅ | - | - | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
northcentralus | - | - | - | - | ✅ | - | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | - | ✅ | ✅ | - | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ |
norwayeast | - | - | - | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | ✅ | - | - | - | - | - | - | ✅ |
southafricanorth | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - | - |
USA déli középső régiója | - | - | - | - | ✅ | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | - | - | ✅ | ✅ | - | - | - | - | - | - | - | - | - |
southindia | - | - | - | ✅ | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | ✅ | - | ✅ | - | - | - | - | - | - | ✅ |
swedencentral | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | - | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
switzerlandnorth | - | - | ✅ | - | - | ✅ | - | - | - | - | ✅ | - | ✅ | - | - | ✅ | - | - | ✅ | - | - | - | - | - | - | - | - | ✅ |
uksouth | - | - | - | ✅ | ✅ | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | - | ✅ | - | - | - | - | - | - | - |
westeurope | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - | ✅ |
westus | - | - | - | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | ✅ | ✅ | - | - | - | ✅ | - | - | - | - | - | - | - | - | - |
westus3 | - | - | - | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | - | - | - | - | ✅ | - | - | - | ✅ | - | ✅ | - | - | - | - | - | - | - |
Ez a táblázat nem tartalmazza a regionális rendelkezésre állási adatok finomhangolását. Az információkért tekintse meg a finomhangolási szakaszt .
Az alapértelmezett kvótával kapcsolatos információkért tekintse meg a kvóta és a korlátok című cikket.
Üzembehelyezési modell rendelkezésre állása
Régió | gpt-4, 0613 | gpt-4, 1106-Preview | gpt-4, 0125-Preview | gpt-4, turbo-2024-04-09 | gpt-4o, 2024-05-13 | gpt-4o, 2024-08-06 | gpt-4o-mini, 2024-07-18 | gpt-4-32k, 0613 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 |
---|---|---|---|---|---|---|---|---|---|---|
ausztráliaeast | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ |
brazilsouth | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | ✅ | ✅ | - |
canadacentral | ✅ | - | - | - | - | - | - | ✅ | - | ✅ |
canadaeast | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | - | ✅ | - |
eastus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
eastus2 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
francecentral | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | ✅ | - | ✅ |
germanywestcentral | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - |
japaneast | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ |
koreacentral | ✅ | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - |
northcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
norwayeast | ✅ | - | ✅ | - | - | - | - | ✅ | - | - |
lengyelországcentral | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ |
southafricanorth | ✅ | ✅ | - | ✅ | - | - | - | ✅ | ✅ | - |
USA déli középső régiója | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ |
southindia | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | ✅ | ✅ | ✅ |
swedencentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
switzerlandnorth | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ |
svájcwest | - | - | - | - | - | - | - | - | - | ✅ |
uksouth | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ |
westus | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ |
westus3 | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ |
Feljegyzés
A Verzió kiépített verziója gpt-4
: turbo-2024-04-09
jelenleg csak szövegre korlátozódik.
A kiépített üzembe helyezésekkel kapcsolatos további információkért tekintse meg a kiépített útmutatót.
Globális standard modell rendelkezésre állása
Régió | o1-preview, 2024-09-12 | o1-mini, 2024-09-12 | gpt-4, turbo-2024-04-09 | gpt-4o, 2024-05-13 | gpt-4o, 2024-08-06 | gpt-4o-mini, 2024-07-18 | gpt-4o-realtime-preview, 2024-10-01 |
---|---|---|---|---|---|---|---|
ausztráliaeast | - | - | ✅ | ✅ | - | ✅ | - |
brazilsouth | - | - | ✅ | ✅ | - | ✅ | - |
canadaeast | - | - | ✅ | ✅ | - | ✅ | - |
eastus | - | - | ✅ | ✅ | ✅ | ✅ | - |
eastus2 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
francecentral | - | - | ✅ | ✅ | - | ✅ | - |
germanywestcentral | - | - | ✅ | ✅ | - | ✅ | - |
japaneast | - | - | ✅ | ✅ | - | ✅ | - |
koreacentral | - | - | ✅ | ✅ | - | ✅ | - |
northcentralus | - | - | ✅ | ✅ | ✅ | ✅ | - |
norwayeast | - | - | ✅ | ✅ | - | ✅ | - |
lengyelországcentral | - | - | ✅ | ✅ | - | ✅ | - |
southafricanorth | - | - | ✅ | ✅ | - | ✅ | - |
USA déli középső régiója | - | - | ✅ | ✅ | ✅ | ✅ | - |
southindia | - | - | ✅ | ✅ | - | ✅ | - |
spaincentral | - | - | ✅ | ✅ | - | ✅ | - |
swedencentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
switzerlandnorth | - | - | ✅ | ✅ | - | ✅ | - |
uksouth | - | - | ✅ | ✅ | - | ✅ | - |
westeurope | - | - | ✅ | ✅ | - | ✅ | - |
westus | - | - | ✅ | ✅ | ✅ | ✅ | - |
westus3 | - | - | ✅ | ✅ | ✅ | ✅ | - |
Globálisan kiosztott felügyelt modell rendelkezésre állása
Régió | gpt-4o, 2024-08-06 | gpt-4o-mini, 2024-07-18 |
---|---|---|
ausztráliaeast | ✅ | ✅ |
brazilsouth | ✅ | ✅ |
canadacentral | ✅ | ✅ |
canadaeast | ✅ | ✅ |
eastus | ✅ | ✅ |
eastus2 | ✅ | ✅ |
francecentral | ✅ | ✅ |
germanywestcentral | ✅ | ✅ |
japaneast | ✅ | ✅ |
koreacentral | ✅ | ✅ |
northcentralus | ✅ | ✅ |
norwayeast | ✅ | ✅ |
lengyelországcentral | ✅ | ✅ |
southafricanorth | ✅ | ✅ |
USA déli középső régiója | ✅ | ✅ |
southindia | ✅ | ✅ |
spaincentral | ✅ | ✅ |
swedencentral | ✅ | ✅ |
switzerlandnorth | ✅ | ✅ |
svájcwest | ✅ | ✅ |
uksouth | ✅ | ✅ |
westeurope | ✅ | ✅ |
westus | ✅ | ✅ |
westus3 | ✅ | ✅ |
A kötegelt modell globális rendelkezésre állása
Régió | gpt-4, 0613 | gpt-4, turbo-2024-04-09 | gpt-4o, 2024-05-13 | gpt-4o, 2024-08-06 | gpt-4o-mini, 2024-07-18 | gpt-35-turbo, 0613 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 |
---|---|---|---|---|---|---|---|---|
eastus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
swedencentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
westus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
GPT-4 és GPT-4 Turbo modell rendelkezésre állása
Nyilvános felhőrégiók
Régió | gpt-4, 0613 | gpt-4, 1106-Preview | gpt-4, 0125-Preview | gpt-4, vision-preview | gpt-4, turbo-2024-04-09 | gpt-4o, 2024-05-13 | gpt-4o, 2024-08-06 | gpt-4o-mini, 2024-07-18 | gpt-4-32k, 0613 |
---|---|---|---|---|---|---|---|---|---|
ausztráliaeast | ✅ | ✅ | - | ✅ | - | - | - | - | ✅ |
canadaeast | ✅ | ✅ | - | - | - | - | - | - | ✅ |
eastus | - | - | ✅ | - | ✅ | ✅ | ✅ | ✅ | - |
eastus2 | - | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | - |
francecentral | ✅ | ✅ | - | - | - | - | - | - | ✅ |
japaneast | - | - | - | ✅ | - | - | - | - | - |
northcentralus | - | - | ✅ | - | ✅ | ✅ | ✅ | ✅ | - |
norwayeast | - | ✅ | - | - | - | - | - | - | - |
USA déli középső régiója | - | - | ✅ | - | ✅ | ✅ | ✅ | ✅ | - |
southindia | - | ✅ | - | - | - | - | - | - | - |
swedencentral | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
switzerlandnorth | ✅ | - | - | ✅ | - | - | - | - | ✅ |
uksouth | - | ✅ | ✅ | - | - | - | - | - | - |
westus | - | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | - |
westus3 | - | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | - |
Ügyfélhozzáférés kiválasztása
A fenti régiók mellett, amelyek minden Azure OpenAI-ügyfél számára elérhetők, egyes kiválasztott, már meglévő ügyfelek további régiókban kaptak hozzáférést a GPT-4 verzióihoz:
Modell | Régió |
---|---|
gpt-4 (0314) gpt-4-32k (0314) |
USA keleti régiója Közép-Franciaország USA déli középső régiója Az Egyesült Királyság déli régiója |
gpt-4 (0613) gpt-4-32k (0613) |
USA keleti régiója USA 2. keleti régiója Kelet-Japán Az Egyesült Királyság déli régiója |
GPT-3.5 modellek
Fontos
Az ÚJ gpt-35-turbo (0125)
modell számos fejlesztést tartalmaz, többek között nagyobb pontosságot a kért formátumokban való válaszadáshoz, valamint egy olyan hiba kijavítását, amely a nem angol nyelvű függvényhívások szövegkódolási hibáját okozta.
A GPT-3.5 Turbót a Chat Completion API-val együtt használják. A GPT-3.5 Turbo 0301-es verziója a Completions API-val is használható, bár ez nem ajánlott. A GPT-3.5 Turbo 0613- és 1106-os verziói csak a Chat Completions API-t támogatják.
A GPT-3.5 Turbo 0301-es verziója a modell első verziója. A 0613-es verzió a modell második verziója, és függvényhívási támogatást ad hozzá.
A modellverziókból megtudhatja, hogyan kezeli az Azure OpenAI Service a modellverzió-frissítéseket, és hogyan dolgozhat modellekkel a GPT-3.5 Turbo-környezetek modellverzió-beállításainak megtekintéséhez és konfigurálásához.
GPT-3.5-Turbo modell rendelkezésre állása
Nyilvános felhőrégiók
Régió | gpt-35-turbo, 0301 | gpt-35-turbo, 0613 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 | gpt-35-turbo-16k, 0613 | gpt-35-turbo-instruct, 0914 |
---|---|---|---|---|---|---|
ausztráliaeast | - | ✅ | ✅ | - | ✅ | - |
canadaeast | - | ✅ | ✅ | ✅ | ✅ | - |
eastus | ✅ | ✅ | - | ✅ | ✅ | ✅ |
eastus2 | - | ✅ | - | ✅ | ✅ | - |
francecentral | ✅ | ✅ | ✅ | - | ✅ | - |
japaneast | - | ✅ | - | - | ✅ | - |
northcentralus | - | ✅ | - | ✅ | ✅ | - |
USA déli középső régiója | ✅ | - | - | ✅ | - | - |
southindia | - | - | ✅ | - | - | - |
swedencentral | - | ✅ | ✅ | - | ✅ | ✅ |
switzerlandnorth | - | ✅ | - | - | ✅ | - |
uksouth | ✅ | ✅ | ✅ | - | ✅ | - |
westeurope | ✅ | - | - | - | - | - |
westus | - | - | ✅ | ✅ | - | - |
westus3 | - | - | - | ✅ | - | - |
Beágyazási modellek
Ezek a modellek csak API-kérések beágyazásával használhatók.
Feljegyzés
text-embedding-3-large
A legújabb és leginkább alkalmas beágyazási modell. A beágyazási modellek közötti frissítés nem lehetséges. A használatból text-embedding-ada-002
text-embedding-3-large
való migráláshoz új beágyazásokat kell létrehoznia.
Modellazonosító | Maximális kérelem (jogkivonatok) | Kimeneti dimenziók | Betanítási adatok (naprakész) |
---|---|---|---|
text-embedding-ada-002 (2. verzió) |
8,191 | 1,536 | 2021. szeptember |
text-embedding-ada-002 (1. verzió) |
2,046 | 1,536 | 2021. szeptember |
text-embedding-3-large |
8,191 | 3,072 | 2021. szeptember |
text-embedding-3-small |
8,191 | 1,536 | 2021. szeptember |
Feljegyzés
Bemenetek tömbjének beágyazáshoz való küldésekor a tömbben lévő bemeneti elemek maximális száma a beágyazási végpontra irányuló hívásonként 2048.
Nyilvános felhőrégiók
Régió | text-embedding-ada-002, 1 | text-embedding-ada-002, 2 | text-embedding-3-small, 1 | text-embedding-3-large, 1 |
---|---|---|---|---|
ausztráliaeast | - | ✅ | - | - |
brazilsouth | - | ✅ | - | - |
canadaeast | - | ✅ | ✅ | ✅ |
eastus | ✅ | ✅ | ✅ | ✅ |
eastus2 | - | ✅ | ✅ | ✅ |
francecentral | - | ✅ | - | ✅ |
japaneast | - | ✅ | - | ✅ |
northcentralus | - | ✅ | - | - |
norwayeast | - | ✅ | - | ✅ |
southafricanorth | - | ✅ | - | - |
USA déli középső régiója | ✅ | ✅ | - | - |
southindia | - | ✅ | - | ✅ |
swedencentral | - | ✅ | - | ✅ |
switzerlandnorth | - | ✅ | - | - |
uksouth | - | ✅ | - | ✅ |
westeurope | - | ✅ | - | - |
westus | - | ✅ | - | - |
westus3 | - | ✅ | - | ✅ |
DALL-E modellek
Modellazonosító | Funkció rendelkezésre állása | Maximális kérelem (karakterek) |
---|---|---|
dalle2 (előzetes verzió) | USA keleti régiója | 1000 |
dall-e-3 | USA keleti régiója, Kelet-Ausztrália, Közép-Svédország | 4 000 |
Modellek finomhangolása
babbage-002
és davinci-002
nincsenek betanításuk az utasítások követésére. Ezeknek az alapmodelleknek a lekérdezése csak egy finomhangolt verzió hivatkozási pontjaként végezhető el a betanítás előrehaladásának kiértékeléséhez.
gpt-35-turbo
- A modell finomhangolása a régiók egy részhalmazára korlátozódik, és nem érhető el minden régióban, ahol az alapmodell elérhető.
Modellazonosító | Régiók finomhangolása | Maximális kérelem (jogkivonatok) | Betanítási adatok (legfeljebb) |
---|---|---|---|
babbage-002 |
USA északi középső régiója Svédország középső régiója Nyugat-Svájc |
16,384 | 2021. szeptember |
davinci-002 |
USA északi középső régiója Svédország középső régiója Nyugat-Svájc |
16,384 | 2021. szeptember |
gpt-35-turbo (0613) |
USA 2. keleti régiója USA északi középső régiója Svédország középső régiója Nyugat-Svájc |
4,096 | 2021. szeptember |
gpt-35-turbo (1106) |
USA 2. keleti régiója USA északi középső régiója Svédország középső régiója Nyugat-Svájc |
Bemenet: 16 385 Kimenet: 4096 |
2021. szeptember |
gpt-35-turbo (0125) |
USA 2. keleti régiója USA északi középső régiója Svédország középső régiója Nyugat-Svájc |
16,385 | 2021. szeptember |
gpt-4 (0613) 1 |
USA északi középső régiója Közép-Svédország |
8192 | 2021. szeptember |
gpt-4o-mini 1 (2024-07-18) |
USA északi középső régiója Közép-Svédország |
Bemenet: 128 000 Kimenet: 16 384 Példa betanítási környezet hossza: 64 536 |
2023. október |
gpt-4o 1 (2024-08-06) |
USA 2. keleti régiója USA északi középső régiója Közép-Svédország |
Bemenet: 128 000 Kimenet: 16 384 Példa betanítási környezet hossza: 64 536 |
2023. október |
1 GPT-4, GPT-4o és GPT-4o mini finomhangolás jelenleg nyilvános előzetes verzióban érhető el. További információért tekintse meg a GPT-4, GPT-4o és > GPT-4o mini finomhangolási biztonsági kiértékelési útmutatónkat.
Suttogó modellek
Modellazonosító | Modell rendelkezésre állása | Maximális kérelem (hangfájl mérete) |
---|---|---|
whisper |
USA 2. keleti régiója USA északi középső régiója Kelet-Norvégia Dél-India Svédország középső régiója Nyugat-Európa |
25 MB |
Szöveg–beszédmodellek (előzetes verzió)
Modellazonosító | Modell rendelkezésre állása |
---|---|
tts-1 |
USA északi középső régiója Közép-Svédország |
tts-1-hd |
USA északi középső régiója Közép-Svédország |
Asszisztensek (előzetes verzió)
Az Asszisztensek esetében egy támogatott modell és egy támogatott régió kombinációjára van szükség. Bizonyos eszközökhöz és képességekhez a legújabb modellek szükségesek. A következő modellek érhetők el az Asszisztensek API-ban, az SDK-ban, az Azure AI Studióban és az Azure OpenAI Studióban. Az alábbi táblázat használatalapú fizetésre szolgál. A kiosztott átviteli egység (PTU) rendelkezésre állásáról további információt a kiosztott átviteli sebességben talál. A felsorolt modellek és régiók az Assistants v1 és v2 verzióval is használhatók. Globális standard modelleket akkor használhat, ha az alább felsorolt régiókban támogatottak.
Régió | gpt-35-turbo (0613) |
gpt-35-turbo (1106) |
fine tuned gpt-3.5-turbo-0125 |
gpt-4 (0613) |
gpt-4 (1106) |
gpt-4 (0125) |
gpt-4o (2024-05-13) |
gpt-4o-mini (2024-07-18) |
---|---|---|---|---|---|---|---|---|
Kelet-Ausztrália | ✅ | ✅ | ✅ | ✅ | ||||
USA keleti régiója | ✅ | ✅ | ✅ | ✅ | ||||
USA 2. keleti régiója | ✅ | ✅ | ✅ | ✅ | ✅ | |||
Közép-Franciaország | ✅ | ✅ | ✅ | ✅ | ||||
Kelet-Japán | ✅ | |||||||
Kelet-Norvégia | ✅ | |||||||
Közép-Svédország | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ||
Az Egyesült Királyság déli régiója | ✅ | ✅ | ✅ | ✅ | ||||
USA nyugati régiója | ✅ | ✅ | ✅ | |||||
USA 3. nyugati régiója | ✅ | ✅ |
Modell kivonása
A modell kivonásával kapcsolatos legfrissebb információkért tekintse meg a modell kivonási útmutatójában.