Megosztás a következőn keresztül:


Az Azure OpenAI Service modelljei

Az Azure OpenAI szolgáltatást különböző képességekkel és árpontokkal rendelkező modellek változatos halmaza működteti. A modell rendelkezésre állása régiónként és felhőnként eltérő. Az Azure Government-modell rendelkezésre állásával kapcsolatban tekintse meg az Azure Government OpenAI szolgáltatást.

Modellek Leírás
o1-preview és o1-mini Korlátozott hozzáférési modellek, amelyek kifejezetten az érvelési és problémamegoldási feladatok nagyobb összpontosítással és képességgel való kezelésére lettek kialakítva.
GPT-4o & GPT-4o mini & GPT-4 Turbo A legújabb, többmodális verziójú Azure OpenAI-modellek, amelyek bemenetként szövegeket és képeket is elfogadnak.
GPT-4o hang A GPT-4o modell, amely támogatja az alacsony késleltetésű, "beszéd, beszéd ki" beszélgetési interakciókat.
GPT-4 A GPT-3.5-ben fejleszthető modellek, amelyek képesek megérteni és létrehozni a természetes nyelvet és kódot.
GPT-3.5 A GPT-3-on fejleszthető modellek, amelyek képesek megérteni és létrehozni a természetes nyelvet és a kódot.
Beágyazások Olyan modellek készlete, amelyek a szöveg numerikus vektorformává alakíthatók a szöveg hasonlóságának megkönnyítése érdekében.
DALL-E Olyan modellek sorozata, amelyek eredeti képeket hozhatnak létre természetes nyelvről.
Súg Előzetes verziójú modellek sorozata, amelyek átírhatják és lefordíthatják a beszédet szöveggé.
Szövegfelolvasás (előzetes verzió) Egy előzetes verziójú modellsorozat, amely képes szövegfelolvasásra.

o1-preview és o1-mini modellek korlátozott hozzáféréssel

Az Azure OpenAI o1-preview és o1-mini a modellek kifejezetten az érvelési és problémamegoldási feladatok nagyobb összpontosítással és képességgel való kezelésére lettek kialakítva. Ezek a modellek több időt töltenek a felhasználó kérésének feldolgozásával és megértésével, így rendkívül erősek a korábbi iterációkhoz képest olyan területeken, mint a tudomány, a kódolás és a matematika.

Modellazonosító Leírás Maximális kérelem (jogkivonatok) Betanítási adatok (legfeljebb)
o1-preview (2024-09-12) Az o1 sorozat legtehatósabb modellje, amely továbbfejlesztett érvelési képességeket kínál. Bemenet: 128 000
Kimenet: 32 768
2023. október
o1-mini (2024-09-12) Gyorsabb és költséghatékonyabb megoldás az o1 sorozatban, amely ideális a sebességet és alacsonyabb erőforrás-felhasználást igénylő feladatok kódolásához. Bemenet: 128 000
Kimenet: 65 536
2023. október

Elérhetőség

A o1-preview modellek mostantól o1-mini elérhetők API-hozzáféréshez és modelltelepítéshez. Regisztráció szükséges, és a hozzáférés a Microsoft jogosultsági feltételei alapján lesz megadva.

Hozzáférés kérése: korlátozott hozzáférésű modellalkalmazás

A hozzáférés megadása után minden modellhez létre kell hoznia egy üzembe helyezést.

API-támogatás

Az o1 sorozatú modellek támogatása az API-verzióban 2024-09-01-previewlett hozzáadva.

A max_tokens paraméter elavult, és az új max_completion_tokens paraméterre cserélődött. o1 sorozatú modellek csak a max_completion_tokens paraméterrel működnek.

Használat

Ezek a modellek jelenleg nem támogatják ugyanazokat a paramétereket, mint a csevegésvégzítési API-t használó többi modell. Jelenleg csak egy nagyon korlátozott részhalmaz támogatott, ezért az olyan gyakori paraméterek, mint például temperaturea , top_pnem érhetők el, és azokat is beleszámítva a kérés sikertelen lesz. o1-preview és o1-mini a modellek nem fogadják el a rendszer üzenetszerepkörét az üzenettömb részeként.

Előfordulhat, hogy frissítenie kell az OpenAI Python-kódtár verzióját, hogy kihasználhassa az új max_completion_tokens paraméter előnyeit.

pip install openai --upgrade

Ha még nem használta a Microsoft Entra ID-t a hitelesítéshez, olvassa el az Azure OpenAI szolgáltatás Microsoft Entra ID-hitelesítéssel való konfigurálását ismertető témakört.

from openai import AzureOpenAI
from azure.identity import DefaultAzureCredential, get_bearer_token_provider

token_provider = get_bearer_token_provider(
    DefaultAzureCredential(), "https://cognitiveservices.azure.com/.default"
)

client = AzureOpenAI(
  azure_endpoint = os.getenv("AZURE_OPENAI_ENDPOINT"), 
  azure_ad_token_provider=token_provider,
  api_version="2024-09-01-preview"
)

response = client.chat.completions.create(
    model="o1-preview-new", # replace with the model deployment name of your o1-preview, or o1-mini model
    messages=[
        {"role": "user", "content": "What steps should I think about when writing my first Python API?"},
    ],
    max_completion_tokens = 5000

)

print(response.model_dump_json(indent=2))

Régiónkénti elérhetőség

Standard és globális standard üzembe helyezéshez érhető el az USA keleti régiójában, az USA 2. keleti régiójában, az USA északi középső régiójában, az USA déli középső régiójában, Svédország középső régiójában, az USA nyugati régiójában és az USA 3. nyugati régiójában jóváhagyott ügyfelek számára.

GPT-4o hang

A gpt-4o-realtime-preview modell a GPT-4o modellcsalád része, és támogatja az alacsony késleltetésű, "beszéd, beszéd ki" beszélgetési interakciókat. A GPT-4o hang a valós idejű, alacsony késleltetésű beszélgetési interakciók kezelésére lett kialakítva, így kiválóan alkalmas támogató ügynökök, asszisztensek, fordítók és egyéb használati esetek kezelésére, amelyekhez a felhasználóval együtt rendkívül rugalmas háttérrendszerre van szükség.

A GPT-4o hang az USA 2. keleti régiójában (eastus2) és Svédország középső (swedencentral) régiójában érhető el. A GPT-4o hang használatához létre kell hoznia vagy használnia kell egy meglévő erőforrást az egyik támogatott régióban.

Az erőforrás létrehozásakor üzembe helyezheti a GPT-4o hangmodellt. Ha programozott üzembe helyezést végez, a modell neve .gpt-4o-realtime-preview A GPT-4o hang használatáról további információt a GPT-4o hangdokumentációjában talál.

A kérelmek maximális jogkivonatairól és a betanítási adatokról az alábbi táblázatban olvashat.

Modellazonosító Leírás Maximális kérelem (jogkivonatok) Betanítási adatok (legfeljebb)
gpt-4o-realtime-preview (2024-10-01-preview)
GPT-4o hang
Hangmodell valós idejű hangfeldolgozáshoz Bemenet: 128 000
Kimenet: 4096
2023. október

GPT-4o és GPT-4 Turbo

A GPT-4o egyetlen modellben integrálja a szöveget és a képeket, így egyszerre több adattípust is képes kezelni. Ez a multimodális megközelítés növeli a pontosságot és a válaszkészséget az emberi-számítógépes interakciókban. A GPT-4o megfelel a GPT-4 Turbo angol nyelvű szöveg- és kódolási feladatainak, miközben kiváló teljesítményt nyújt nem angol nyelvű és látási feladatokban, új teljesítményteszteket állít be az AI-képességekhez.

Hogyan elérni a GPT-4o és a GPT-4o mini modelleket?

A GPT-4o és a GPT-4o mini standard és globális modell üzembe helyezéséhez érhető el.

Meglévő erőforrást kell létrehoznia vagy használnia egy támogatott standard vagy globális standard régióban, ahol a modell elérhető.

Az erőforrás létrehozásakor üzembe helyezheti a GPT-4o modelleket. Ha programozott üzembe helyezést végez, a modell nevei a következők:

  • gpt-4oVerzió 2024-08-06
  • gpt-4o, Verzió 2024-05-13
  • gpt-4o-miniVerzió 2024-07-18

GPT-4 Turbo

A GPT-4 Turbo egy nagy multimodális modell (szöveg- vagy képbemenetek elfogadása és szöveg generálása), amely nagyobb pontossággal képes megoldani a nehéz problémákat, mint az OpenAI korábbi modelljei. A GPT-3.5 Turbo és a régebbi GPT-4 modellekhez hasonlóan a GPT-4 Turbo is csevegésre van optimalizálva, és jól működik a hagyományos befejezési feladatokhoz.

A GPT-4 Turbo legújabb GA kiadása a következő:

  • gpt-4Verzió: turbo-2024-04-09

Ez a következő előzetes modellek lecserélése:

  • gpt-4Verzió: 1106-Preview
  • gpt-4Verzió: 0125-Preview
  • gpt-4Verzió: vision-preview

Az OpenAI és az Azure OpenAI GPT-4 Turbo GA modellek közötti különbségek

  • Az OpenAI legújabb 0409 turbómodell verziója támogatja a JSON módot és a függvényeket, amelyek minden következtetési kérést meghívnak.
  • Az Azure OpenAI legújabb turbo-2024-04-09 verziója jelenleg nem támogatja a JSON mód és a függvényhívás használatát, amikor következtetési kérelmeket készít képi (vision) bemenettel. A szövegalapú bemeneti kérések (képek nélküli image_url és beágyazott kérések) támogatják a JSON-módot és a függvényhívást.

Különbségek a gpt-4 vision-preview-tól

  • Az Azure AI-specifikus Vision fejlesztései a GPT-4 Turbo és a Vision együttműködésével nem támogatottak a verzióhoz gpt-4 : turbo-2024-04-09. Ez magában foglalja az optikai karakterfelismerést (OCR), az objektumok földelését, a videoüzeneteket és az adatok képekkel való jobb kezelését.

Fontos

Vision fejlesztések előzetes funkciók, beleértve az optikai karakterfelismerés (OCR), objektum földelés, video parancssorok lesznek kivonva, és már nem érhető el, ha gpt-4 verzió: vision-preview frissítve turbo-2024-04-09van. Ha jelenleg ezen előzetes verziójú funkciók bármelyikére támaszkodik, ez az automatikus modellfrissítés kompatibilitástörő változás lesz.

GPT-4 Turbo kiosztott felügyelt rendelkezésre állás

  • gpt-4Verzió: turbo-2024-04-09 standard és kiépített üzemelő példányokhoz is elérhető. A modell kiépített verziója jelenleg nem támogatja a kép-/látásbeli következtetési kérelmeket. A modell kiépített üzembe helyezései csak szöveges bemeneteket fogadnak el. A standard modelltelepítések szöveges és képi/látási következtetési kéréseket is elfogadnak.

A GPT-4 Turbo üzembe helyezése a Vision GA-val

Ha a GA-modellt a Studio felhasználói felületén szeretné üzembe helyezni, válassza ki GPT-4 , majd válassza ki a turbo-2024-04-09 verziót a legördülő menüből. A modell alapértelmezett kvótája megegyezik a gpt-4-turbo-2024-04-09 GPT-4-Turbo jelenlegi kvótával. Tekintse meg a regionális kvótakorlátokat.

GPT-4

A GPT-4 a GPT-4 Turbo elődje. Mind a GPT-4, mind a GPT-4 Turbo modellek alapmodelljének gpt-4neve . A GPT-4 és a Turbo modellek között a modellverzió vizsgálatával lehet különbséget tenni.

  • gpt-4Verzió 0314
  • gpt-4Verzió 0613
  • gpt-4-32kVerzió 0613

A modellösszesítő táblázatban láthatja az egyes modellek által támogatott jogkivonat-környezet hosszát.

GPT-4 és GPT-4 Turbo modellek

  • Ezek a modellek csak a Csevegés befejezése API-val használhatók.

A modellverziókból megtudhatja, hogyan kezeli az Azure OpenAI Service a modellverzió-frissítéseket, és hogyan dolgozhat modellekkel a GPT-4 üzemelő példányok modellverzió-beállításainak megtekintéséhez és konfigurálásához.

Modellazonosító Leírás Maximális kérelem (jogkivonatok) Betanítási adatok (legfeljebb)
gpt-4o (2024-08-06)
GPT-4o (Omni)
A legújabb nagy GA-modell
- Strukturált kimenetek
- Szöveg, képfeldolgozás
- JSON mód
- párhuzamos függvényhívás
- Nagyobb pontosság és válaszkészség
- Parity with English text and coding tasks to GPT-4 Turbo with Vision
- Kiváló teljesítmény nem angol nyelven és látási feladatokban
Bemenet: 128 000
Kimenet: 16 384
2023. október
gpt-4o-mini (2024-07-18)
GPT-4o mini
Legújabb kis GA-modell
- Gyors, olcsó, képes modell ideális cseréje GPT-3.5 Turbo sorozatú modellek.
- Szöveg, képfeldolgozás
- JSON mód
- párhuzamos függvényhívás
Bemenet: 128 000
Kimenet: 16 384
2023. október
gpt-4o (2024-05-13)
GPT-4o (Omni)
Szöveg, képfeldolgozás
- JSON mód
- párhuzamos függvényhívás
- Nagyobb pontosság és válaszkészség
- Parity with English text and coding tasks to GPT-4 Turbo with Vision
- Kiváló teljesítmény nem angol nyelven és látási feladatokban
Bemenet: 128 000
Kimenet: 4096
2023. október
gpt-4 (turbo-2024-04-09)
GPT-4 Turbo és Vision
Új GA-modell
- Az összes korábbi GPT-4 előzetes modell cseréje (vision-preview, 1106-Preview, ). 0125-Preview
- A funkciók rendelkezésre állása jelenleg eltérő a bemeneti módszertől és az üzembe helyezés típusától függően.
Bemenet: 128 000
Kimenet: 4096
2023. december
gpt-4 (0125-Preview)*
GPT-4 Turbo előzetes verzió
Mintamodell
-Lecseréli az 1106-előzetes verziót
– Jobb kódgenerálási teljesítmény
– Csökkenti azokat az eseteket, amikor a modell nem végez el feladatot
- JSON mód
- párhuzamos függvényhívás
- reprodukálható kimenet (előzetes verzió)
Bemenet: 128 000
Kimenet: 4096
2023. december
gpt-4 (vision-preview)
GPT-4 Turbo a Vision Előzetes verzióval
Mintamodell
– Szöveg- és képbevitelt fogad el.
- Támogatja a fejlesztéseket
- JSON mód
- párhuzamos függvényhívás
- reprodukálható kimenet (előzetes verzió)
Bemenet: 128 000
Kimenet: 4096
2023. ápr.
gpt-4 (1106-előzetes verzió)
GPT-4 Turbo előzetes verzió
Mintamodell
- JSON mód
- párhuzamos függvényhívás
- reprodukálható kimenet (előzetes verzió)
Bemenet: 128 000
Kimenet: 4096
2023. ápr.
gpt-4-32k (0613) Régebbi GA-modell
- Alapszintű függvényhívás eszközökkel
32,768 2021. szeptember
gpt-4 (0613) Régebbi GA-modell
- Alapszintű függvényhívás eszközökkel
8,192 2021. szeptember
gpt-4-32k(0314) Régebbi GA-modell
- Nyugdíjazási információk
32,768 2021. szeptember
gpt-4 (0314) Régebbi GA-modell
- Nyugdíjazási információk
8,192 2021. szeptember

Figyelemfelhívás

Nem javasoljuk, hogy éles környezetben használjunk előzetes verziójú modelleket. Az előzetes modellek összes üzembe helyezését frissítjük a jövőbeli előzetes verziókra vagy a legújabb stabil GA-verzióra. Az előzetes verzióra kijelölt modellek nem követik a standard Azure OpenAI-modell életciklusát.

  • A GPT-4 0125-előzetes verziója a GPT-4 Turbo előzetes verzió frissített verziója, amely korábban 1106-os előzetes verzióként jelent meg.
  • A GPT-4 0125-előzetes verziója olyan feladatokat hajt végre, mint a kódlétrehozás a gpt-4-1106-előzetes verzióhoz képest. Emiatt a feladattól függően az ügyfelek azt tapasztalhatják, hogy a GPT-4-0125-preview több kimenetet generál a gpt-4-1106-preview-hoz képest. Javasoljuk, hogy az ügyfelek hasonlítsák össze az új modell kimeneteit. A GPT-4-0125-preview a gpt-4-1106-preview hibáit is elhárítja, a nem angol nyelvű UTF-8 kezeléssel.
  • A GPT-4 verzió turbo-2024-04-09 a legújabb GA-kiadás, és lecseréli 0125-Previewa , 1106-previewés vision-preview.

Fontos

A GPT-4 (gpt-4) verziók1106-Preview0125-Preview, és vision-preview a jövőben egy stabil verzióval gpt-4 lesznek frissítve.

  • A verziók 1106-Previewközponti telepítéseigpt-4, 0125-Previewés vision-preview az "Automatikus frissítés alapértelmezettre" és a "Frissítés lejárt" értékre állítás után a rendszer a stabil verzió kiadása után megkezdi a frissítését. Minden üzemelő példány esetében a modellverzió frissítése az API-hívások szolgáltatásának megszakítása nélkül történik. A frissítések régiónként vannak megosztva, és a teljes frissítési folyamat várhatóan 2 hétig tart.
  • A verziók 1106-Previewközponti telepítéseigpt-4, 0125-Previewés vision-preview a "Nincs automatikus frissítés" beállítás nem lesz frissítve, és leállnak, amikor az előzetes verziót frissítik a régióban. A frissítés időzítésével kapcsolatos további információkért tekintse meg az Azure OpenAI-modell kivonásait és elavulását .

GPT-3.5

A GPT-3.5 modellek képesek megérteni és létrehozni a természetes nyelvet vagy kódot. A GPT-3.5 család leginkább alkalmas és költséghatékony modellje a GPT-3.5 Turbo, amely csevegésre lett optimalizálva, és jól működik a hagyományos befejezési feladatokhoz is. A GPT-3.5 Turbo a Chat Completions API-val használható. A GPT-3.5 Turbo Instruct hasonló képességekkel text-davinci-003 rendelkezik a Befejezések API használatához a Csevegés befejezések API helyett. A GPT-3.5 Turbo és a GPT-3.5 Turbo Instruct örökölt GPT-3.5 és GPT-3 modellek használatát javasoljuk.

Modellazonosító Leírás Maximális kérelem (jogkivonatok) Betanítási adatok (legfeljebb)
gpt-35-turbo (0125) ÚJ Legújabb GA-modell
- JSON mód
- párhuzamos függvényhívás
- reprodukálható kimenet (előzetes verzió)
- Nagyobb pontosság a kért formátumokban való válaszadáshoz.
– Kijavítottunk egy hibát, amely szövegkódolási hibát okozott a nem angol nyelvű függvényhívások esetében.
Bemenet: 16 385
Kimenet: 4096
2021. szeptember
gpt-35-turbo (1106) Régebbi GA-modell
- JSON mód
- párhuzamos függvényhívás
- reprodukálható kimenet (előzetes verzió)
Bemenet: 16 385
Kimenet: 4096
2021. szeptember
gpt-35-turbo-instruct (0914) Csak befejezési végpont
- Régi befejezési modellek cseréje
4,097 2021. szeptember
gpt-35-turbo-16k (0613) Régebbi GA-modell
- Alapszintű függvényhívás eszközökkel
16,384 2021. szeptember
gpt-35-turbo (0613) Régebbi GA-modell
- Alapszintű függvényhívás eszközökkel
4,096 2021. szeptember
gpt-35-turbo1 (0301) Régebbi GA-modell
- Nyugdíjazási információk
4,096 2021. szeptember

Ha többet szeretne megtudni a GPT-3.5 Turbo és a Csevegés befejezések API használatáról, tekintse meg részletes útmutatónkat.

1 Ez a modell 4096 jogkivonatot > fogad el. Nem ajánlott túllépni a 4096 bemeneti jogkivonat korlátját, mivel a modell újabb verziója 4096 jogkivonaton van leképezve. Ha 4096 bemeneti jogkivonat túllépésekor problémákat tapasztal ezzel a modellel, ez a konfiguráció hivatalosan nem támogatott.

Beágyazások

text-embedding-3-large A legújabb és leginkább alkalmas beágyazási modell. A beágyazási modellek közötti frissítés nem lehetséges. Ahhoz, hogy áttérjen a használatról text-embedding-ada-002 , text-embedding-3-large új beágyazásokat kell létrehoznia.

  • text-embedding-3-large
  • text-embedding-3-small
  • text-embedding-ada-002

A tesztelés során az OpenAI a nagy és a kis harmadik generációs beágyazási modelleket is jobb átlagos többnyelvű lekérési teljesítményt nyújt a MIRACL-teljesítményteszttel , miközben továbbra is fenntartja az angol feladatok teljesítményét az MTEB-teljesítményteszttel .

Kiértékelési teljesítményteszt text-embedding-ada-002 text-embedding-3-small text-embedding-3-large
MIRACL-átlag 31.4 44.0 54.9
MTEB-átlag 61,0 62.3 64.6

A harmadik generációs beágyazási modellek támogatják a beágyazás méretének csökkentését egy új dimensions paraméterrel. A nagyobb beágyazások általában számítási, memória- és tárolási szempontból drágábbak. A dimenziók számának módosításához nagyobb mértékben szabályozható a teljes költség és a teljesítmény. A dimensions paraméter nem támogatott az OpenAI 1.x Python-kódtár minden verziójában, ezért javasoljuk, hogy a paramétert a legújabb verzióra frissítse: pip install openai --upgrade.

Az OpenAI MTEB benchmark-tesztje azt találta, hogy még akkor is, ha a harmadik generációs modell méretei 1536-nál text-embeddings-ada-002 kisebbre csökkennek, a teljesítmény kissé jobb marad.

DALL-E

A DALL-E modellek képeket hoznak létre a felhasználó által megadott szöveges kérésekből. A DALL-E 3 általánosan elérhető a REST API-khoz. A DALL-E 2 és a DALL-E 3 ügyféloldali SDK-kkal előzetes verzióban érhető el.

Súg

A Suttogó modellek szövegfelolvasáshoz használhatók.

A Whisper-modellt az Azure AI Speech kötegelt átírási API-val is használhatja. További információ az Azure AI Speech és az Azure OpenAI szolgáltatás használatáról: Mi a Whisper-modell?

Szövegfelolvasás (előzetes verzió)

A jelenleg előzetes verzióban elérhető OpenAI-szöveg-beszédmodellek a szöveg beszédszintézisére használhatók.

Az OpenAI szöveget az Azure AI Speech használatával is beszédre használhatja. További információ: OpenAI text to speech voices via Azure OpenAI Service vagy Azure AI Speech guide.

Modellösszesítő táblázat és régió rendelkezésre állása

Modellek üzembe helyezési típus szerint

Az Azure OpenAI az üzleti és használati mintáknak megfelelő üzemeltetési struktúrával kapcsolatos lehetőségeket biztosít az ügyfelek számára. A szolgáltatás két fő üzembe helyezési típust kínál:

  • A Standard egy globális üzembe helyezési lehetőséggel érhető el, amely globálisan irányítja a forgalmat, hogy nagyobb átviteli sebességet biztosítson.
  • A kiépítés egy globális üzembe helyezési lehetőséggel is elérhető, amely lehetővé teszi az ügyfelek számára a kiépített átviteli egységek megvásárlását és üzembe helyezését az Azure globális infrastruktúrában.

Minden üzemelő példány pontosan ugyanazokat a következtetési műveleteket hajthatja végre, azonban a számlázás, a skálázás és a teljesítmény lényegesen eltérő. Az Azure OpenAI üzembe helyezési típusaival kapcsolatos további információkért tekintse meg az üzembe helyezési típusokra vonatkozó útmutatót.

Globális standard modell rendelkezésre állása

Régió o1-preview, 2024-09-12 o1-mini, 2024-09-12 gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4o-realtime-preview, 2024-10-01 gpt-4, turbo-2024-04-09
ausztráliaeast - - - -
brazilsouth - - - -
canadaeast - - - -
eastus -
eastus2
francecentral - - - -
germanywestcentral - - - -
japaneast - - - -
koreacentral - - - -
northcentralus -
norwayeast - - - -
lengyelországcentral - - - -
southafricanorth - - - -
USA déli középső régiója -
southindia - - - -
spaincentral - - -
swedencentral
switzerlandnorth - - - -
uaenorth - - - -
uksouth - - - -
westeurope - - - -
westus -
westus3 -

Ez a táblázat nem tartalmazza a regionális rendelkezésre állási adatok finomhangolását. Az információkért tekintse meg a finomhangolási szakaszt .

Standard modellek végpontok szerint

Csevegés befejezése

Régió o1-preview, 2024-09-12 o1-mini, 2024-09-12 gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, vision-preview gpt-4, turbo-2024-04-09 gpt-4-32k, 0613 gpt-35-turbo, 0301 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613
ausztráliaeast - - - - - - - - -
canadaeast - - - - - - - - -
eastus - - - - -
eastus2 - - - - - -
francecentral - - - - - - - - -
japaneast - - - - - - - - - - - -
northcentralus - - - - - -
norwayeast - - - - - - - - - - - - - - -
USA déli középső régiója - - - - - - -
southindia - - - - - - - - - - - - - -
swedencentral - - -
switzerlandnorth - - - - - - - - - - -
uksouth - - - - - - - - -
westeurope - - - - - - - - - - - - - - -
westus - - - - - -
westus3 - - - - - - - -

GPT-4 és GPT-4 Turbo modell rendelkezésre állása

Ügyfélhozzáférés kiválasztása

A fenti régiók mellett, amelyek minden Azure OpenAI-ügyfél számára elérhetők, egyes kiválasztott, már meglévő ügyfelek további régiókban kaptak hozzáférést a GPT-4 verzióihoz:

Modell Régió
gpt-4 (0314)
gpt-4-32k (0314)
USA keleti régiója
Közép-Franciaország
USA déli középső régiója
Az Egyesült Királyság déli régiója
gpt-4 (0613)
gpt-4-32k (0613)
USA keleti régiója
USA 2. keleti régiója
Kelet-Japán
Az Egyesült Királyság déli régiója

GPT-3.5 modellek

A modellverziókból megtudhatja, hogyan kezeli az Azure OpenAI Service a modellverzió-frissítéseket, és hogyan dolgozhat modellekkel a GPT-3.5 Turbo-környezetek modellverzió-beállításainak megtekintéséhez és konfigurálásához.

Modellek finomhangolása

Feljegyzés

gpt-35-turbo – A modell finomhangolása a régiók egy részhalmazára korlátozódik, és nem érhető el minden régióban, ahol az alapmodell elérhető.

A finomhangolás támogatott régiói eltérőek lehetnek, ha Azure OpenAI-modelleket használ egy AI Studio-projektben, és nem egy projekten kívül.

Modellazonosító Régiók finomhangolása Maximális kérelem (jogkivonatok) Betanítási adatok (legfeljebb)
babbage-002 USA északi középső régiója
Svédország középső régiója
Nyugat-Svájc
16,384 2021. szeptember
davinci-002 USA északi középső régiója
Svédország középső régiója
Nyugat-Svájc
16,384 2021. szeptember
gpt-35-turbo (0613) USA 2. keleti régiója
USA északi középső régiója
Svédország középső régiója
Nyugat-Svájc
4,096 2021. szeptember
gpt-35-turbo (1106) USA 2. keleti régiója
USA északi középső régiója
Svédország középső régiója
Nyugat-Svájc
Bemenet: 16 385
Kimenet: 4096
2021. szeptember
gpt-35-turbo (0125) USA 2. keleti régiója
USA északi középső régiója
Svédország középső régiója
Nyugat-Svájc
16,385 2021. szeptember
gpt-4 (0613) 1 USA északi középső régiója
Közép-Svédország
8192 2021. szeptember
gpt-4o-mini1 (2024-07-18) USA északi középső régiója
Közép-Svédország
Bemenet: 128 000
Kimenet: 16 384
Példa betanítási környezet hossza: 64 536
2023. október
gpt-4o1 (2024-08-06) USA 2. keleti régiója
USA északi középső régiója
Közép-Svédország
Bemenet: 128 000
Kimenet: 16 384
Példa betanítási környezet hossza: 64 536
2023. október

Az 1 GPT-4 jelenleg nyilvános előzetes verzióban érhető el.

Asszisztensek (előzetes verzió)

Az Asszisztensek esetében egy támogatott modell és egy támogatott régió kombinációjára van szükség. Bizonyos eszközökhöz és képességekhez a legújabb modellek szükségesek. A következő modellek érhetők el az Assistants API-ban, az SDK-ban és az Azure AI Studióban. Az alábbi táblázat használatalapú fizetésre szolgál. A kiosztott átviteli egység (PTU) rendelkezésre állásáról további információt a kiosztott átviteli sebességben talál. A felsorolt modellek és régiók az Assistants v1 és v2 verzióval is használhatók. Globális standard modelleket akkor használhat, ha az alább felsorolt régiókban támogatottak.

Régió gpt-35-turbo (0613) gpt-35-turbo (1106) fine tuned gpt-3.5-turbo-0125 gpt-4 (0613) gpt-4 (1106) gpt-4 (0125) gpt-4o (2024-05-13) gpt-4o-mini (2024-07-18)
Kelet-Ausztrália
USA keleti régiója
USA 2. keleti régiója
Közép-Franciaország
Kelet-Japán
Kelet-Norvégia
Közép-Svédország
Az Egyesült Királyság déli régiója
USA nyugati régiója
USA 3. nyugati régiója

Modell kivonása

A modell kivonásával kapcsolatos legfrissebb információkért tekintse meg a modell kivonási útmutatójában.

Következő lépések