Az Azure OpenAI Service modelljei
Az Azure OpenAI szolgáltatást különböző képességekkel és árpontokkal rendelkező modellek változatos halmaza működteti. A modell rendelkezésre állása régiónként és felhőnként eltérő. Az Azure Government-modell rendelkezésre állásával kapcsolatban tekintse meg az Azure Government OpenAI szolgáltatást.
Modellek | Leírás |
---|---|
o1-preview és o1-mini | Korlátozott hozzáférési modellek, amelyek kifejezetten az érvelési és problémamegoldási feladatok nagyobb összpontosítással és képességgel való kezelésére lettek kialakítva. |
GPT-4o & GPT-4o mini & GPT-4 Turbo | A legújabb, többmodális verziójú Azure OpenAI-modellek, amelyek bemenetként szövegeket és képeket is elfogadnak. |
GPT-4o hang | A GPT-4o modell, amely támogatja az alacsony késleltetésű, "beszéd, beszéd ki" beszélgetési interakciókat. |
GPT-4 | A GPT-3.5-ben fejleszthető modellek, amelyek képesek megérteni és létrehozni a természetes nyelvet és kódot. |
GPT-3.5 | A GPT-3-on fejleszthető modellek, amelyek képesek megérteni és létrehozni a természetes nyelvet és a kódot. |
Beágyazások | Olyan modellek készlete, amelyek a szöveg numerikus vektorformává alakíthatók a szöveg hasonlóságának megkönnyítése érdekében. |
DALL-E | Olyan modellek sorozata, amelyek eredeti képeket hozhatnak létre természetes nyelvről. |
Súg | Előzetes verziójú modellek sorozata, amelyek átírhatják és lefordíthatják a beszédet szöveggé. |
Szövegfelolvasás (előzetes verzió) | Egy előzetes verziójú modellsorozat, amely képes szövegfelolvasásra. |
o1-preview és o1-mini modellek korlátozott hozzáféréssel
Az Azure OpenAI o1-preview
és o1-mini
a modellek kifejezetten az érvelési és problémamegoldási feladatok nagyobb összpontosítással és képességgel való kezelésére lettek kialakítva. Ezek a modellek több időt töltenek a felhasználó kérésének feldolgozásával és megértésével, így rendkívül erősek a korábbi iterációkhoz képest olyan területeken, mint a tudomány, a kódolás és a matematika.
Modellazonosító | Leírás | Maximális kérelem (jogkivonatok) | Betanítási adatok (legfeljebb) |
---|---|---|---|
o1-preview (2024-09-12) |
Az o1 sorozat legtehatósabb modellje, amely továbbfejlesztett érvelési képességeket kínál. | Bemenet: 128 000 Kimenet: 32 768 |
2023. október |
o1-mini (2024-09-12) |
Gyorsabb és költséghatékonyabb megoldás az o1 sorozatban, amely ideális a sebességet és alacsonyabb erőforrás-felhasználást igénylő feladatok kódolásához. | Bemenet: 128 000 Kimenet: 65 536 |
2023. október |
Elérhetőség
A o1-preview
modellek mostantól o1-mini
elérhetők API-hozzáféréshez és modelltelepítéshez. Regisztráció szükséges, és a hozzáférés a Microsoft jogosultsági feltételei alapján lesz megadva.
Hozzáférés kérése: korlátozott hozzáférésű modellalkalmazás
A hozzáférés megadása után minden modellhez létre kell hoznia egy üzembe helyezést.
API-támogatás
Az o1 sorozatú modellek támogatása az API-verzióban 2024-09-01-preview
lett hozzáadva.
A max_tokens
paraméter elavult, és az új max_completion_tokens
paraméterre cserélődött. o1 sorozatú modellek csak a max_completion_tokens
paraméterrel működnek.
Használat
Ezek a modellek jelenleg nem támogatják ugyanazokat a paramétereket, mint a csevegésvégzítési API-t használó többi modell. Jelenleg csak egy nagyon korlátozott részhalmaz támogatott, ezért az olyan gyakori paraméterek, mint például temperature
a , top_p
nem érhetők el, és azokat is beleszámítva a kérés sikertelen lesz. o1-preview
és o1-mini
a modellek nem fogadják el a rendszer üzenetszerepkörét az üzenettömb részeként.
Előfordulhat, hogy frissítenie kell az OpenAI Python-kódtár verzióját, hogy kihasználhassa az új max_completion_tokens
paraméter előnyeit.
pip install openai --upgrade
Ha még nem használta a Microsoft Entra ID-t a hitelesítéshez, olvassa el az Azure OpenAI szolgáltatás Microsoft Entra ID-hitelesítéssel való konfigurálását ismertető témakört.
from openai import AzureOpenAI
from azure.identity import DefaultAzureCredential, get_bearer_token_provider
token_provider = get_bearer_token_provider(
DefaultAzureCredential(), "https://cognitiveservices.azure.com/.default"
)
client = AzureOpenAI(
azure_endpoint = os.getenv("AZURE_OPENAI_ENDPOINT"),
azure_ad_token_provider=token_provider,
api_version="2024-09-01-preview"
)
response = client.chat.completions.create(
model="o1-preview-new", # replace with the model deployment name of your o1-preview, or o1-mini model
messages=[
{"role": "user", "content": "What steps should I think about when writing my first Python API?"},
],
max_completion_tokens = 5000
)
print(response.model_dump_json(indent=2))
Régiónkénti elérhetőség
Standard és globális standard üzembe helyezéshez érhető el az USA keleti régiójában, az USA 2. keleti régiójában, az USA északi középső régiójában, az USA déli középső régiójában, Svédország középső régiójában, az USA nyugati régiójában és az USA 3. nyugati régiójában jóváhagyott ügyfelek számára.
GPT-4o hang
A gpt-4o-realtime-preview
modell a GPT-4o modellcsalád része, és támogatja az alacsony késleltetésű, "beszéd, beszéd ki" beszélgetési interakciókat. A GPT-4o hang a valós idejű, alacsony késleltetésű beszélgetési interakciók kezelésére lett kialakítva, így kiválóan alkalmas támogató ügynökök, asszisztensek, fordítók és egyéb használati esetek kezelésére, amelyekhez a felhasználóval együtt rendkívül rugalmas háttérrendszerre van szükség.
A GPT-4o hang az USA 2. keleti régiójában (eastus2
) és Svédország középső (swedencentral
) régiójában érhető el. A GPT-4o hang használatához létre kell hoznia vagy használnia kell egy meglévő erőforrást az egyik támogatott régióban.
Az erőforrás létrehozásakor üzembe helyezheti a GPT-4o hangmodellt. Ha programozott üzembe helyezést végez, a modell neve .gpt-4o-realtime-preview
A GPT-4o hang használatáról további információt a GPT-4o hangdokumentációjában talál.
A kérelmek maximális jogkivonatairól és a betanítási adatokról az alábbi táblázatban olvashat.
Modellazonosító | Leírás | Maximális kérelem (jogkivonatok) | Betanítási adatok (legfeljebb) |
---|---|---|---|
gpt-4o-realtime-preview (2024-10-01-preview) GPT-4o hang |
Hangmodell valós idejű hangfeldolgozáshoz | Bemenet: 128 000 Kimenet: 4096 |
2023. október |
GPT-4o és GPT-4 Turbo
A GPT-4o egyetlen modellben integrálja a szöveget és a képeket, így egyszerre több adattípust is képes kezelni. Ez a multimodális megközelítés növeli a pontosságot és a válaszkészséget az emberi-számítógépes interakciókban. A GPT-4o megfelel a GPT-4 Turbo angol nyelvű szöveg- és kódolási feladatainak, miközben kiváló teljesítményt nyújt nem angol nyelvű és látási feladatokban, új teljesítményteszteket állít be az AI-képességekhez.
Hogyan elérni a GPT-4o és a GPT-4o mini modelleket?
A GPT-4o és a GPT-4o mini standard és globális modell üzembe helyezéséhez érhető el.
Meglévő erőforrást kell létrehoznia vagy használnia egy támogatott standard vagy globális standard régióban, ahol a modell elérhető.
Az erőforrás létrehozásakor üzembe helyezheti a GPT-4o modelleket. Ha programozott üzembe helyezést végez, a modell nevei a következők:
gpt-4o
Verzió2024-08-06
gpt-4o
, Verzió2024-05-13
gpt-4o-mini
Verzió2024-07-18
GPT-4 Turbo
A GPT-4 Turbo egy nagy multimodális modell (szöveg- vagy képbemenetek elfogadása és szöveg generálása), amely nagyobb pontossággal képes megoldani a nehéz problémákat, mint az OpenAI korábbi modelljei. A GPT-3.5 Turbo és a régebbi GPT-4 modellekhez hasonlóan a GPT-4 Turbo is csevegésre van optimalizálva, és jól működik a hagyományos befejezési feladatokhoz.
A GPT-4 Turbo legújabb GA kiadása a következő:
gpt-4
Verzió:turbo-2024-04-09
Ez a következő előzetes modellek lecserélése:
gpt-4
Verzió:1106-Preview
gpt-4
Verzió:0125-Preview
gpt-4
Verzió:vision-preview
Az OpenAI és az Azure OpenAI GPT-4 Turbo GA modellek közötti különbségek
- Az OpenAI legújabb
0409
turbómodell verziója támogatja a JSON módot és a függvényeket, amelyek minden következtetési kérést meghívnak. - Az Azure OpenAI legújabb
turbo-2024-04-09
verziója jelenleg nem támogatja a JSON mód és a függvényhívás használatát, amikor következtetési kérelmeket készít képi (vision) bemenettel. A szövegalapú bemeneti kérések (képek nélküliimage_url
és beágyazott kérések) támogatják a JSON-módot és a függvényhívást.
Különbségek a gpt-4 vision-preview-tól
- Az Azure AI-specifikus Vision fejlesztései a GPT-4 Turbo és a Vision együttműködésével nem támogatottak a verzióhoz
gpt-4
:turbo-2024-04-09
. Ez magában foglalja az optikai karakterfelismerést (OCR), az objektumok földelését, a videoüzeneteket és az adatok képekkel való jobb kezelését.
Fontos
Vision fejlesztések előzetes funkciók, beleértve az optikai karakterfelismerés (OCR), objektum földelés, video parancssorok lesznek kivonva, és már nem érhető el, ha gpt-4
verzió: vision-preview
frissítve turbo-2024-04-09
van. Ha jelenleg ezen előzetes verziójú funkciók bármelyikére támaszkodik, ez az automatikus modellfrissítés kompatibilitástörő változás lesz.
GPT-4 Turbo kiosztott felügyelt rendelkezésre állás
gpt-4
Verzió:turbo-2024-04-09
standard és kiépített üzemelő példányokhoz is elérhető. A modell kiépített verziója jelenleg nem támogatja a kép-/látásbeli következtetési kérelmeket. A modell kiépített üzembe helyezései csak szöveges bemeneteket fogadnak el. A standard modelltelepítések szöveges és képi/látási következtetési kéréseket is elfogadnak.
A GPT-4 Turbo üzembe helyezése a Vision GA-val
Ha a GA-modellt a Studio felhasználói felületén szeretné üzembe helyezni, válassza ki GPT-4
, majd válassza ki a turbo-2024-04-09
verziót a legördülő menüből. A modell alapértelmezett kvótája megegyezik a gpt-4-turbo-2024-04-09
GPT-4-Turbo jelenlegi kvótával. Tekintse meg a regionális kvótakorlátokat.
GPT-4
A GPT-4 a GPT-4 Turbo elődje. Mind a GPT-4, mind a GPT-4 Turbo modellek alapmodelljének gpt-4
neve . A GPT-4 és a Turbo modellek között a modellverzió vizsgálatával lehet különbséget tenni.
gpt-4
Verzió0314
gpt-4
Verzió0613
gpt-4-32k
Verzió0613
A modellösszesítő táblázatban láthatja az egyes modellek által támogatott jogkivonat-környezet hosszát.
GPT-4 és GPT-4 Turbo modellek
- Ezek a modellek csak a Csevegés befejezése API-val használhatók.
A modellverziókból megtudhatja, hogyan kezeli az Azure OpenAI Service a modellverzió-frissítéseket, és hogyan dolgozhat modellekkel a GPT-4 üzemelő példányok modellverzió-beállításainak megtekintéséhez és konfigurálásához.
Modellazonosító | Leírás | Maximális kérelem (jogkivonatok) | Betanítási adatok (legfeljebb) |
---|---|---|---|
gpt-4o (2024-08-06) GPT-4o (Omni) |
A legújabb nagy GA-modell - Strukturált kimenetek - Szöveg, képfeldolgozás - JSON mód - párhuzamos függvényhívás - Nagyobb pontosság és válaszkészség - Parity with English text and coding tasks to GPT-4 Turbo with Vision - Kiváló teljesítmény nem angol nyelven és látási feladatokban |
Bemenet: 128 000 Kimenet: 16 384 |
2023. október |
gpt-4o-mini (2024-07-18) GPT-4o mini |
Legújabb kis GA-modell - Gyors, olcsó, képes modell ideális cseréje GPT-3.5 Turbo sorozatú modellek. - Szöveg, képfeldolgozás - JSON mód - párhuzamos függvényhívás |
Bemenet: 128 000 Kimenet: 16 384 |
2023. október |
gpt-4o (2024-05-13) GPT-4o (Omni) |
Szöveg, képfeldolgozás - JSON mód - párhuzamos függvényhívás - Nagyobb pontosság és válaszkészség - Parity with English text and coding tasks to GPT-4 Turbo with Vision - Kiváló teljesítmény nem angol nyelven és látási feladatokban |
Bemenet: 128 000 Kimenet: 4096 |
2023. október |
gpt-4 (turbo-2024-04-09) GPT-4 Turbo és Vision |
Új GA-modell - Az összes korábbi GPT-4 előzetes modell cseréje ( vision-preview , 1106-Preview , ). 0125-Preview - A funkciók rendelkezésre állása jelenleg eltérő a bemeneti módszertől és az üzembe helyezés típusától függően. |
Bemenet: 128 000 Kimenet: 4096 |
2023. december |
gpt-4 (0125-Preview)*GPT-4 Turbo előzetes verzió |
Mintamodell -Lecseréli az 1106-előzetes verziót – Jobb kódgenerálási teljesítmény – Csökkenti azokat az eseteket, amikor a modell nem végez el feladatot - JSON mód - párhuzamos függvényhívás - reprodukálható kimenet (előzetes verzió) |
Bemenet: 128 000 Kimenet: 4096 |
2023. december |
gpt-4 (vision-preview)GPT-4 Turbo a Vision Előzetes verzióval |
Mintamodell – Szöveg- és képbevitelt fogad el. - Támogatja a fejlesztéseket - JSON mód - párhuzamos függvényhívás - reprodukálható kimenet (előzetes verzió) |
Bemenet: 128 000 Kimenet: 4096 |
2023. ápr. |
gpt-4 (1106-előzetes verzió)GPT-4 Turbo előzetes verzió |
Mintamodell - JSON mód - párhuzamos függvényhívás - reprodukálható kimenet (előzetes verzió) |
Bemenet: 128 000 Kimenet: 4096 |
2023. ápr. |
gpt-4-32k (0613) |
Régebbi GA-modell - Alapszintű függvényhívás eszközökkel |
32,768 | 2021. szeptember |
gpt-4 (0613) |
Régebbi GA-modell - Alapszintű függvényhívás eszközökkel |
8,192 | 2021. szeptember |
gpt-4-32k (0314) |
Régebbi GA-modell - Nyugdíjazási információk |
32,768 | 2021. szeptember |
gpt-4 (0314) |
Régebbi GA-modell - Nyugdíjazási információk |
8,192 | 2021. szeptember |
Figyelemfelhívás
Nem javasoljuk, hogy éles környezetben használjunk előzetes verziójú modelleket. Az előzetes modellek összes üzembe helyezését frissítjük a jövőbeli előzetes verziókra vagy a legújabb stabil GA-verzióra. Az előzetes verzióra kijelölt modellek nem követik a standard Azure OpenAI-modell életciklusát.
- A GPT-4 0125-előzetes verziója a GPT-4 Turbo előzetes verzió frissített verziója, amely korábban 1106-os előzetes verzióként jelent meg.
- A GPT-4 0125-előzetes verziója olyan feladatokat hajt végre, mint a kódlétrehozás a gpt-4-1106-előzetes verzióhoz képest. Emiatt a feladattól függően az ügyfelek azt tapasztalhatják, hogy a GPT-4-0125-preview több kimenetet generál a gpt-4-1106-preview-hoz képest. Javasoljuk, hogy az ügyfelek hasonlítsák össze az új modell kimeneteit. A GPT-4-0125-preview a gpt-4-1106-preview hibáit is elhárítja, a nem angol nyelvű UTF-8 kezeléssel.
- A GPT-4 verzió
turbo-2024-04-09
a legújabb GA-kiadás, és lecseréli0125-Preview
a ,1106-preview
ésvision-preview
.
Fontos
A GPT-4 (gpt-4
) verziók1106-Preview
0125-Preview
, és vision-preview
a jövőben egy stabil verzióval gpt-4
lesznek frissítve.
- A verziók
1106-Preview
központi telepítéseigpt-4
,0125-Preview
ésvision-preview
az "Automatikus frissítés alapértelmezettre" és a "Frissítés lejárt" értékre állítás után a rendszer a stabil verzió kiadása után megkezdi a frissítését. Minden üzemelő példány esetében a modellverzió frissítése az API-hívások szolgáltatásának megszakítása nélkül történik. A frissítések régiónként vannak megosztva, és a teljes frissítési folyamat várhatóan 2 hétig tart. - A verziók
1106-Preview
központi telepítéseigpt-4
,0125-Preview
ésvision-preview
a "Nincs automatikus frissítés" beállítás nem lesz frissítve, és leállnak, amikor az előzetes verziót frissítik a régióban. A frissítés időzítésével kapcsolatos további információkért tekintse meg az Azure OpenAI-modell kivonásait és elavulását .
GPT-3.5
A GPT-3.5 modellek képesek megérteni és létrehozni a természetes nyelvet vagy kódot. A GPT-3.5 család leginkább alkalmas és költséghatékony modellje a GPT-3.5 Turbo, amely csevegésre lett optimalizálva, és jól működik a hagyományos befejezési feladatokhoz is. A GPT-3.5 Turbo a Chat Completions API-val használható. A GPT-3.5 Turbo Instruct hasonló képességekkel text-davinci-003
rendelkezik a Befejezések API használatához a Csevegés befejezések API helyett. A GPT-3.5 Turbo és a GPT-3.5 Turbo Instruct örökölt GPT-3.5 és GPT-3 modellek használatát javasoljuk.
Modellazonosító | Leírás | Maximális kérelem (jogkivonatok) | Betanítási adatok (legfeljebb) |
---|---|---|---|
gpt-35-turbo (0125) ÚJ |
Legújabb GA-modell - JSON mód - párhuzamos függvényhívás - reprodukálható kimenet (előzetes verzió) - Nagyobb pontosság a kért formátumokban való válaszadáshoz. – Kijavítottunk egy hibát, amely szövegkódolási hibát okozott a nem angol nyelvű függvényhívások esetében. |
Bemenet: 16 385 Kimenet: 4096 |
2021. szeptember |
gpt-35-turbo (1106) |
Régebbi GA-modell - JSON mód - párhuzamos függvényhívás - reprodukálható kimenet (előzetes verzió) |
Bemenet: 16 385 Kimenet: 4096 |
2021. szeptember |
gpt-35-turbo-instruct (0914) |
Csak befejezési végpont - Régi befejezési modellek cseréje |
4,097 | 2021. szeptember |
gpt-35-turbo-16k (0613) |
Régebbi GA-modell - Alapszintű függvényhívás eszközökkel |
16,384 | 2021. szeptember |
gpt-35-turbo (0613) |
Régebbi GA-modell - Alapszintű függvényhívás eszközökkel |
4,096 | 2021. szeptember |
gpt-35-turbo 1 (0301) |
Régebbi GA-modell - Nyugdíjazási információk |
4,096 | 2021. szeptember |
Ha többet szeretne megtudni a GPT-3.5 Turbo és a Csevegés befejezések API használatáról, tekintse meg részletes útmutatónkat.
1 Ez a modell 4096 jogkivonatot > fogad el. Nem ajánlott túllépni a 4096 bemeneti jogkivonat korlátját, mivel a modell újabb verziója 4096 jogkivonaton van leképezve. Ha 4096 bemeneti jogkivonat túllépésekor problémákat tapasztal ezzel a modellel, ez a konfiguráció hivatalosan nem támogatott.
Beágyazások
text-embedding-3-large
A legújabb és leginkább alkalmas beágyazási modell. A beágyazási modellek közötti frissítés nem lehetséges. Ahhoz, hogy áttérjen a használatról text-embedding-ada-002
, text-embedding-3-large
új beágyazásokat kell létrehoznia.
text-embedding-3-large
text-embedding-3-small
text-embedding-ada-002
A tesztelés során az OpenAI a nagy és a kis harmadik generációs beágyazási modelleket is jobb átlagos többnyelvű lekérési teljesítményt nyújt a MIRACL-teljesítményteszttel , miközben továbbra is fenntartja az angol feladatok teljesítményét az MTEB-teljesítményteszttel .
Kiértékelési teljesítményteszt | text-embedding-ada-002 |
text-embedding-3-small |
text-embedding-3-large |
---|---|---|---|
MIRACL-átlag | 31.4 | 44.0 | 54.9 |
MTEB-átlag | 61,0 | 62.3 | 64.6 |
A harmadik generációs beágyazási modellek támogatják a beágyazás méretének csökkentését egy új dimensions
paraméterrel. A nagyobb beágyazások általában számítási, memória- és tárolási szempontból drágábbak. A dimenziók számának módosításához nagyobb mértékben szabályozható a teljes költség és a teljesítmény. A dimensions
paraméter nem támogatott az OpenAI 1.x Python-kódtár minden verziójában, ezért javasoljuk, hogy a paramétert a legújabb verzióra frissítse: pip install openai --upgrade
.
Az OpenAI MTEB benchmark-tesztje azt találta, hogy még akkor is, ha a harmadik generációs modell méretei 1536-nál text-embeddings-ada-002
kisebbre csökkennek, a teljesítmény kissé jobb marad.
DALL-E
A DALL-E modellek képeket hoznak létre a felhasználó által megadott szöveges kérésekből. A DALL-E 3 általánosan elérhető a REST API-khoz. A DALL-E 2 és a DALL-E 3 ügyféloldali SDK-kkal előzetes verzióban érhető el.
Súg
A Suttogó modellek szövegfelolvasáshoz használhatók.
A Whisper-modellt az Azure AI Speech kötegelt átírási API-val is használhatja. További információ az Azure AI Speech és az Azure OpenAI szolgáltatás használatáról: Mi a Whisper-modell?
Szövegfelolvasás (előzetes verzió)
A jelenleg előzetes verzióban elérhető OpenAI-szöveg-beszédmodellek a szöveg beszédszintézisére használhatók.
Az OpenAI szöveget az Azure AI Speech használatával is beszédre használhatja. További információ: OpenAI text to speech voices via Azure OpenAI Service vagy Azure AI Speech guide.
Modellösszesítő táblázat és régió rendelkezésre állása
Modellek üzembe helyezési típus szerint
Az Azure OpenAI az üzleti és használati mintáknak megfelelő üzemeltetési struktúrával kapcsolatos lehetőségeket biztosít az ügyfelek számára. A szolgáltatás két fő üzembe helyezési típust kínál:
- A Standard egy globális üzembe helyezési lehetőséggel érhető el, amely globálisan irányítja a forgalmat, hogy nagyobb átviteli sebességet biztosítson.
- A kiépítés egy globális üzembe helyezési lehetőséggel is elérhető, amely lehetővé teszi az ügyfelek számára a kiépített átviteli egységek megvásárlását és üzembe helyezését az Azure globális infrastruktúrában.
Minden üzemelő példány pontosan ugyanazokat a következtetési műveleteket hajthatja végre, azonban a számlázás, a skálázás és a teljesítmény lényegesen eltérő. Az Azure OpenAI üzembe helyezési típusaival kapcsolatos további információkért tekintse meg az üzembe helyezési típusokra vonatkozó útmutatót.
- Global Standard
- Globálisan kiépített felügyelt
- Globális köteg
- Data Zone Standard
- Standard
- Kiépített felügyelt
Globális standard modell rendelkezésre állása
Régió | o1-preview, 2024-09-12 | o1-mini, 2024-09-12 | gpt-4o, 2024-05-13 | gpt-4o, 2024-08-06 | gpt-4o-mini, 2024-07-18 | gpt-4o-realtime-preview, 2024-10-01 | gpt-4, turbo-2024-04-09 |
---|---|---|---|---|---|---|---|
ausztráliaeast | - | - | ✅ | - | ✅ | - | ✅ |
brazilsouth | - | - | ✅ | - | ✅ | - | ✅ |
canadaeast | - | - | ✅ | - | ✅ | - | ✅ |
eastus | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
eastus2 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
francecentral | - | - | ✅ | - | ✅ | - | ✅ |
germanywestcentral | - | - | ✅ | - | ✅ | - | ✅ |
japaneast | - | - | ✅ | - | ✅ | - | ✅ |
koreacentral | - | - | ✅ | - | ✅ | - | ✅ |
northcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
norwayeast | - | - | ✅ | - | ✅ | - | ✅ |
lengyelországcentral | - | - | ✅ | - | ✅ | - | ✅ |
southafricanorth | - | - | ✅ | - | ✅ | - | ✅ |
USA déli középső régiója | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
southindia | - | - | ✅ | - | ✅ | - | ✅ |
spaincentral | - | - | ✅ | ✅ | ✅ | - | ✅ |
swedencentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
switzerlandnorth | - | - | ✅ | - | ✅ | - | ✅ |
uaenorth | - | - | ✅ | - | ✅ | - | ✅ |
uksouth | - | - | ✅ | - | ✅ | - | ✅ |
westeurope | - | - | ✅ | - | ✅ | - | ✅ |
westus | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
westus3 | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
Ez a táblázat nem tartalmazza a regionális rendelkezésre állási adatok finomhangolását. Az információkért tekintse meg a finomhangolási szakaszt .
Standard modellek végpontok szerint
Csevegés befejezése
Régió | o1-preview, 2024-09-12 | o1-mini, 2024-09-12 | gpt-4o, 2024-05-13 | gpt-4o, 2024-08-06 | gpt-4o-mini, 2024-07-18 | gpt-4, 0613 | gpt-4, 1106-Preview | gpt-4, 0125-Preview | gpt-4, vision-preview | gpt-4, turbo-2024-04-09 | gpt-4-32k, 0613 | gpt-35-turbo, 0301 | gpt-35-turbo, 0613 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 | gpt-35-turbo-16k, 0613 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
ausztráliaeast | - | - | - | - | - | ✅ | ✅ | - | ✅ | - | ✅ | - | ✅ | ✅ | - | ✅ |
canadaeast | - | - | - | - | - | ✅ | ✅ | - | - | - | ✅ | - | ✅ | ✅ | ✅ | ✅ |
eastus | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | - | ✅ | - | ✅ | ✅ | - | ✅ | ✅ |
eastus2 | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | - | - | ✅ | - | ✅ | ✅ |
francecentral | - | - | - | - | - | ✅ | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ |
japaneast | - | - | - | - | - | - | - | - | ✅ | - | - | - | ✅ | - | ✅ | ✅ |
northcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | - | ✅ | - | - | ✅ | - | ✅ | ✅ |
norwayeast | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - | - |
USA déli középső régiója | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | - | ✅ | - | ✅ | - | - | ✅ | - |
southindia | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | ✅ | - | - |
swedencentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ |
switzerlandnorth | - | - | - | - | - | ✅ | - | - | ✅ | - | ✅ | - | ✅ | - | - | ✅ |
uksouth | - | - | - | - | - | - | ✅ | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ |
westeurope | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - |
westus | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | ✅ | - | - | - | ✅ | ✅ | - |
westus3 | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | - | - | - | - | ✅ | - |
GPT-4 és GPT-4 Turbo modell rendelkezésre állása
Ügyfélhozzáférés kiválasztása
A fenti régiók mellett, amelyek minden Azure OpenAI-ügyfél számára elérhetők, egyes kiválasztott, már meglévő ügyfelek további régiókban kaptak hozzáférést a GPT-4 verzióihoz:
Modell | Régió |
---|---|
gpt-4 (0314) gpt-4-32k (0314) |
USA keleti régiója Közép-Franciaország USA déli középső régiója Az Egyesült Királyság déli régiója |
gpt-4 (0613) gpt-4-32k (0613) |
USA keleti régiója USA 2. keleti régiója Kelet-Japán Az Egyesült Királyság déli régiója |
GPT-3.5 modellek
A modellverziókból megtudhatja, hogyan kezeli az Azure OpenAI Service a modellverzió-frissítéseket, és hogyan dolgozhat modellekkel a GPT-3.5 Turbo-környezetek modellverzió-beállításainak megtekintéséhez és konfigurálásához.
Modellek finomhangolása
Feljegyzés
gpt-35-turbo
– A modell finomhangolása a régiók egy részhalmazára korlátozódik, és nem érhető el minden régióban, ahol az alapmodell elérhető.
A finomhangolás támogatott régiói eltérőek lehetnek, ha Azure OpenAI-modelleket használ egy AI Studio-projektben, és nem egy projekten kívül.
Modellazonosító | Régiók finomhangolása | Maximális kérelem (jogkivonatok) | Betanítási adatok (legfeljebb) |
---|---|---|---|
babbage-002 |
USA északi középső régiója Svédország középső régiója Nyugat-Svájc |
16,384 | 2021. szeptember |
davinci-002 |
USA északi középső régiója Svédország középső régiója Nyugat-Svájc |
16,384 | 2021. szeptember |
gpt-35-turbo (0613) |
USA 2. keleti régiója USA északi középső régiója Svédország középső régiója Nyugat-Svájc |
4,096 | 2021. szeptember |
gpt-35-turbo (1106) |
USA 2. keleti régiója USA északi középső régiója Svédország középső régiója Nyugat-Svájc |
Bemenet: 16 385 Kimenet: 4096 |
2021. szeptember |
gpt-35-turbo (0125) |
USA 2. keleti régiója USA északi középső régiója Svédország középső régiója Nyugat-Svájc |
16,385 | 2021. szeptember |
gpt-4 (0613) 1 |
USA északi középső régiója Közép-Svédország |
8192 | 2021. szeptember |
gpt-4o-mini 1 (2024-07-18) |
USA északi középső régiója Közép-Svédország |
Bemenet: 128 000 Kimenet: 16 384 Példa betanítási környezet hossza: 64 536 |
2023. október |
gpt-4o 1 (2024-08-06) |
USA 2. keleti régiója USA északi középső régiója Közép-Svédország |
Bemenet: 128 000 Kimenet: 16 384 Példa betanítási környezet hossza: 64 536 |
2023. október |
Az 1 GPT-4 jelenleg nyilvános előzetes verzióban érhető el.
Asszisztensek (előzetes verzió)
Az Asszisztensek esetében egy támogatott modell és egy támogatott régió kombinációjára van szükség. Bizonyos eszközökhöz és képességekhez a legújabb modellek szükségesek. A következő modellek érhetők el az Assistants API-ban, az SDK-ban és az Azure AI Studióban. Az alábbi táblázat használatalapú fizetésre szolgál. A kiosztott átviteli egység (PTU) rendelkezésre állásáról további információt a kiosztott átviteli sebességben talál. A felsorolt modellek és régiók az Assistants v1 és v2 verzióval is használhatók. Globális standard modelleket akkor használhat, ha az alább felsorolt régiókban támogatottak.
Régió | gpt-35-turbo (0613) |
gpt-35-turbo (1106) |
fine tuned gpt-3.5-turbo-0125 |
gpt-4 (0613) |
gpt-4 (1106) |
gpt-4 (0125) |
gpt-4o (2024-05-13) |
gpt-4o-mini (2024-07-18) |
---|---|---|---|---|---|---|---|---|
Kelet-Ausztrália | ✅ | ✅ | ✅ | ✅ | ||||
USA keleti régiója | ✅ | ✅ | ✅ | ✅ | ||||
USA 2. keleti régiója | ✅ | ✅ | ✅ | ✅ | ✅ | |||
Közép-Franciaország | ✅ | ✅ | ✅ | ✅ | ||||
Kelet-Japán | ✅ | |||||||
Kelet-Norvégia | ✅ | |||||||
Közép-Svédország | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ||
Az Egyesült Királyság déli régiója | ✅ | ✅ | ✅ | ✅ | ||||
USA nyugati régiója | ✅ | ✅ | ✅ | |||||
USA 3. nyugati régiója | ✅ | ✅ |
Modell kivonása
A modell kivonásával kapcsolatos legfrissebb információkért tekintse meg a modell kivonási útmutatójában.