Megosztás a következőn keresztül:


Az Azure OpenAI Service modelljei

Az Azure OpenAI szolgáltatást különböző képességekkel és árpontokkal rendelkező modellek változatos halmaza működteti. A modell rendelkezésre állása régiónként és felhőnként eltérő. Az Azure Government-modell rendelkezésre állásával kapcsolatban tekintse meg az Azure Government OpenAI szolgáltatást.

Modellek Leírás
o1-preview és o1-mini Korlátozott hozzáférési modellek, amelyek kifejezetten az érvelési és problémamegoldási feladatok nagyobb összpontosítással és képességgel való kezelésére lettek kialakítva.
GPT-4o & GPT-4o mini & GPT-4 Turbo A legújabb, többmodális verziójú Azure OpenAI-modellek, amelyek bemenetként szövegeket és képeket is elfogadnak.
GPT-4o hang A GPT-4o modell, amely támogatja az alacsony késleltetésű, "beszéd, beszéd ki" beszélgetési interakciókat.
GPT-4 A GPT-3.5-ben fejleszthető modellek, amelyek képesek megérteni és létrehozni a természetes nyelvet és kódot.
GPT-3.5 A GPT-3-on fejleszthető modellek, amelyek képesek megérteni és létrehozni a természetes nyelvet és a kódot.
Beágyazások Olyan modellek készlete, amelyek a szöveg numerikus vektorformává alakíthatók a szöveg hasonlóságának megkönnyítése érdekében.
DALL-E Olyan modellek sorozata, amelyek eredeti képeket hozhatnak létre természetes nyelvről.
Súg Előzetes verziójú modellek sorozata, amelyek átírhatják és lefordíthatják a beszédet szöveggé.
Szövegfelolvasás (előzetes verzió) Egy előzetes verziójú modellsorozat, amely képes szövegfelolvasásra.

o1-preview és o1-mini modellek korlátozott hozzáféréssel

Az Azure OpenAI o1-preview és o1-mini a modellek kifejezetten az érvelési és problémamegoldási feladatok nagyobb összpontosítással és képességgel való kezelésére lettek kialakítva. Ezek a modellek több időt töltenek a felhasználó kérésének feldolgozásával és megértésével, így rendkívül erősek a korábbi iterációkhoz képest olyan területeken, mint a tudomány, a kódolás és a matematika.

Modellazonosító Leírás Maximális kérelem (jogkivonatok) Betanítási adatok (legfeljebb)
o1-preview (2024-09-12) Az o1 sorozat legtehatósabb modellje, amely továbbfejlesztett érvelési képességeket kínál. Bemenet: 128 000
Kimenet: 32 768
2023. október
o1-mini (2024-09-12) Gyorsabb és költséghatékonyabb megoldás az o1 sorozatban, amely ideális a sebességet és alacsonyabb erőforrás-felhasználást igénylő feladatok kódolásához. Bemenet: 128 000
Kimenet: 65 536
2023. október

Elérhetőség

A o1-preview modellek mostantól o1-mini elérhetők API-hozzáféréshez és modelltelepítéshez. Regisztráció szükséges, és a hozzáférés a Microsoft jogosultsági feltételei alapján lesz megadva.

Hozzáférés kérése: korlátozott hozzáférésű modellalkalmazás

A hozzáférés megadása után minden modellhez létre kell hoznia egy üzembe helyezést.

API-támogatás

Az o1 sorozatú modellek támogatása az API-verzióban 2024-09-01-previewlett hozzáadva.

A max_tokens paraméter elavult, és az új max_completion_tokens paraméterre cserélődött. o1 sorozatú modellek csak a max_completion_tokens paraméterrel működnek.

Használat

Ezek a modellek jelenleg nem támogatják ugyanazokat a paramétereket, mint a csevegésvégzítési API-t használó többi modell. Jelenleg csak egy nagyon korlátozott részhalmaz támogatott, ezért az olyan gyakori paraméterek, mint például temperaturea , top_pnem érhetők el, és azokat is beleszámítva a kérés sikertelen lesz. o1-preview és o1-mini a modellek nem fogadják el a rendszer üzenetszerepkörét az üzenettömb részeként.

Előfordulhat, hogy frissítenie kell az OpenAI Python-kódtár verzióját, hogy kihasználhassa az új max_completion_tokens paraméter előnyeit.

pip install openai --upgrade

Ha még nem használta a Microsoft Entra ID-t a hitelesítéshez, olvassa el az Azure OpenAI szolgáltatás Microsoft Entra ID-hitelesítéssel való konfigurálását ismertető témakört.

from openai import AzureOpenAI
from azure.identity import DefaultAzureCredential, get_bearer_token_provider

token_provider = get_bearer_token_provider(
    DefaultAzureCredential(), "https://cognitiveservices.azure.com/.default"
)

client = AzureOpenAI(
  azure_endpoint = os.getenv("AZURE_OPENAI_ENDPOINT"), 
  azure_ad_token_provider=token_provider,
  api_version="2024-09-01-preview"
)

response = client.chat.completions.create(
    model="o1-preview-new", # replace with the model deployment name of your o1-preview, or o1-mini model
    messages=[
        {"role": "user", "content": "What steps should I think about when writing my first Python API?"},
    ],
    max_completion_tokens = 5000

)

print(response.model_dump_json(indent=2))

Régiónkénti elérhetőség

Standard és globális standard üzembe helyezéshez érhető el az USA 2. keleti régiójában és a Svédország középső régiójában jóváhagyott ügyfelek számára.

GPT-4o hang

A gpt-4o-realtime-preview modell a GPT-4o modellcsalád része, és támogatja az alacsony késleltetésű, "beszéd, beszéd ki" beszélgetési interakciókat. A GPT-4o hang a valós idejű, alacsony késleltetésű beszélgetési interakciók kezelésére lett kialakítva, így kiválóan alkalmas támogató ügynökök, asszisztensek, fordítók és egyéb használati esetek kezelésére, amelyekhez a felhasználóval együtt rendkívül rugalmas háttérrendszerre van szükség.

A GPT-4o hang az USA 2. keleti régiójában (eastus2) és Svédország középső (swedencentral) régiójában érhető el. A GPT-4o hang használatához létre kell hoznia vagy használnia kell egy meglévő erőforrást az egyik támogatott régióban.

Az erőforrás létrehozásakor üzembe helyezheti a GPT-4o hangmodellt. Ha programozott üzembe helyezést végez, a modell neve .gpt-4o-realtime-preview A GPT-4o hang használatáról további információt a GPT-4o hangdokumentációjában talál.

A kérelmek maximális jogkivonatairól és a betanítási adatokról az alábbi táblázatban olvashat.

Modellazonosító Leírás Maximális kérelem (jogkivonatok) Betanítási adatok (legfeljebb)
gpt-4o-realtime-preview (2024-10-01-preview)
GPT-4o hang
Hangmodell valós idejű hangfeldolgozáshoz Bemenet: 128 000
Kimenet: 4096
2023. október

GPT-4o és GPT-4 Turbo

A GPT-4o egyetlen modellben integrálja a szöveget és a képeket, így egyszerre több adattípust is képes kezelni. Ez a multimodális megközelítés növeli a pontosságot és a válaszkészséget az emberi-számítógépes interakciókban. A GPT-4o megfelel a GPT-4 Turbo angol nyelvű szöveg- és kódolási feladatainak, miközben kiváló teljesítményt nyújt nem angol nyelvű és látási feladatokban, új teljesítményteszteket állít be az AI-képességekhez.

Hogyan elérni a GPT-4o és a GPT-4o mini modelleket?

A GPT-4o és a GPT-4o mini standard és globális modell üzembe helyezéséhez érhető el.

Meglévő erőforrást kell létrehoznia vagy használnia egy támogatott standard vagy globális standard régióban, ahol a modell elérhető.

Az erőforrás létrehozásakor üzembe helyezheti a GPT-4o modelleket. Ha programozott üzembe helyezést végez, a modell nevei a következők:

  • gpt-4oVerzió 2024-08-06
  • gpt-4o, Verzió 2024-05-13
  • gpt-4o-miniVerzió 2024-07-18

GPT-4 Turbo

A GPT-4 Turbo egy nagy multimodális modell (szöveg- vagy képbemenetek elfogadása és szöveg generálása), amely nagyobb pontossággal képes megoldani a nehéz problémákat, mint az OpenAI korábbi modelljei. A GPT-3.5 Turbo és a régebbi GPT-4 modellekhez hasonlóan a GPT-4 Turbo is csevegésre van optimalizálva, és jól működik a hagyományos befejezési feladatokhoz.

A GPT-4 Turbo legújabb GA kiadása a következő:

  • gpt-4Verzió: turbo-2024-04-09

Ez a következő előzetes modellek lecserélése:

  • gpt-4Verzió: 1106-Preview
  • gpt-4Verzió: 0125-Preview
  • gpt-4Verzió: vision-preview

Az OpenAI és az Azure OpenAI GPT-4 Turbo GA modellek közötti különbségek

  • Az OpenAI legújabb 0409 turbómodell verziója támogatja a JSON módot és a függvényeket, amelyek minden következtetési kérést meghívnak.
  • Az Azure OpenAI legújabb turbo-2024-04-09 verziója jelenleg nem támogatja a JSON mód és a függvényhívás használatát, amikor következtetési kérelmeket készít képi (vision) bemenettel. A szövegalapú bemeneti kérések (képek nélküli image_url és beágyazott kérések) támogatják a JSON-módot és a függvényhívást.

Különbségek a gpt-4 vision-preview-tól

  • Az Azure AI-specifikus Vision fejlesztései a GPT-4 Turbo és a Vision együttműködésével nem támogatottak a verzióhoz gpt-4 : turbo-2024-04-09. Ez magában foglalja az optikai karakterfelismerést (OCR), az objektumok földelését, a videoüzeneteket és az adatok képekkel való jobb kezelését.

GPT-4 Turbo kiosztott felügyelt rendelkezésre állás

  • gpt-4Verzió: turbo-2024-04-09 standard és kiépített üzemelő példányokhoz is elérhető. A modell kiépített verziója jelenleg nem támogatja a kép-/látásbeli következtetési kérelmeket. A modell kiépített üzembe helyezései csak szöveges bemeneteket fogadnak el. A standard modelltelepítések szöveges és képi/látási következtetési kéréseket is elfogadnak.

A GPT-4 Turbo üzembe helyezése a Vision GA-val

Ha a GA-modellt a Studio felhasználói felületén szeretné üzembe helyezni, válassza ki GPT-4 , majd válassza ki a turbo-2024-04-09 verziót a legördülő menüből. A modell alapértelmezett kvótája megegyezik a gpt-4-turbo-2024-04-09 GPT-4-Turbo jelenlegi kvótával. Tekintse meg a regionális kvótakorlátokat.

GPT-4

A GPT-4 a GPT-4 Turbo elődje. Mind a GPT-4, mind a GPT-4 Turbo modellek alapmodelljének gpt-4neve . A GPT-4 és a Turbo modellek között a modellverzió vizsgálatával lehet különbséget tenni.

  • gpt-4Verzió 0314
  • gpt-4Verzió 0613
  • gpt-4-32kVerzió 0613

A modellösszesítő táblázatban láthatja az egyes modellek által támogatott jogkivonat-környezet hosszát.

GPT-4 és GPT-4 Turbo modellek

  • Ezek a modellek csak a Csevegés befejezése API-val használhatók.

A modellverziókból megtudhatja, hogyan kezeli az Azure OpenAI Service a modellverzió-frissítéseket, és hogyan dolgozhat modellekkel a GPT-4 üzemelő példányok modellverzió-beállításainak megtekintéséhez és konfigurálásához.

Modellazonosító Leírás Maximális kérelem (jogkivonatok) Betanítási adatok (legfeljebb)
gpt-4o (2024-08-06)
GPT-4o (Omni)
A legújabb nagy GA-modell
- Strukturált kimenetek
- Szöveg, képfeldolgozás
- JSON mód
- párhuzamos függvényhívás
- Nagyobb pontosság és válaszkészség
- Parity with English text and coding tasks to GPT-4 Turbo with Vision
- Kiváló teljesítmény nem angol nyelven és látási feladatokban
Bemenet: 128 000
Kimenet: 16 384
2023. október
gpt-4o-mini (2024-07-18)
GPT-4o mini
Legújabb kis GA-modell
- Gyors, olcsó, képes modell ideális cseréje GPT-3.5 Turbo sorozatú modellek.
- Szöveg, képfeldolgozás
- JSON mód
- párhuzamos függvényhívás
Bemenet: 128 000
Kimenet: 16 384
2023. október
gpt-4o (2024-05-13)
GPT-4o (Omni)
Szöveg, képfeldolgozás
- JSON mód
- párhuzamos függvényhívás
- Nagyobb pontosság és válaszkészség
- Parity with English text and coding tasks to GPT-4 Turbo with Vision
- Kiváló teljesítmény nem angol nyelven és látási feladatokban
Bemenet: 128 000
Kimenet: 4096
2023. október
gpt-4 (turbo-2024-04-09)
GPT-4 Turbo és Vision
Új GA-modell
- Az összes korábbi GPT-4 előzetes modell cseréje (vision-preview, 1106-Preview, ). 0125-Preview
- A funkciók rendelkezésre állása jelenleg eltérő a bemeneti módszertől és az üzembe helyezés típusától függően.
Bemenet: 128 000
Kimenet: 4096
2023. december
gpt-4 (0125-Preview)*
GPT-4 Turbo előzetes verzió
Mintamodell
-Lecseréli az 1106-előzetes verziót
– Jobb kódgenerálási teljesítmény
– Csökkenti azokat az eseteket, amikor a modell nem végez el feladatot
- JSON mód
- párhuzamos függvényhívás
- reprodukálható kimenet (előzetes verzió)
Bemenet: 128 000
Kimenet: 4096
2023. december
gpt-4 (vision-preview)
GPT-4 Turbo a Vision Előzetes verzióval
Mintamodell
– Szöveg- és képbevitelt fogad el.
- Támogatja a fejlesztéseket
- JSON mód
- párhuzamos függvényhívás
- reprodukálható kimenet (előzetes verzió)
Bemenet: 128 000
Kimenet: 4096
2023. ápr.
gpt-4 (1106-előzetes verzió)
GPT-4 Turbo előzetes verzió
Mintamodell
- JSON mód
- párhuzamos függvényhívás
- reprodukálható kimenet (előzetes verzió)
Bemenet: 128 000
Kimenet: 4096
2023. ápr.
gpt-4-32k (0613) Régebbi GA-modell
- Alapszintű függvényhívás eszközökkel
32,768 2021. szeptember
gpt-4 (0613) Régebbi GA-modell
- Alapszintű függvényhívás eszközökkel
8,192 2021. szeptember
gpt-4-32k(0314) Régebbi GA-modell
- Nyugdíjazási információk
32,768 2021. szeptember
gpt-4 (0314) Régebbi GA-modell
- Nyugdíjazási információk
8,192 2021. szeptember

Figyelemfelhívás

Nem javasoljuk, hogy éles környezetben használjunk előzetes verziójú modelleket. Az előzetes modellek összes üzembe helyezését frissítjük a jövőbeli előzetes verziókra vagy a legújabb stabil GA-verzióra. Az előzetes verzióra kijelölt modellek nem követik a standard Azure OpenAI-modell életciklusát.

  • A GPT-4 0125-előzetes verziója a GPT-4 Turbo előzetes verzió frissített verziója, amely korábban 1106-os előzetes verzióként jelent meg.
  • A GPT-4 0125-előzetes verziója olyan feladatokat hajt végre, mint a kódlétrehozás a gpt-4-1106-előzetes verzióhoz képest. Emiatt a feladattól függően az ügyfelek azt tapasztalhatják, hogy a GPT-4-0125-preview több kimenetet generál a gpt-4-1106-preview-hoz képest. Javasoljuk, hogy az ügyfelek hasonlítsák össze az új modell kimeneteit. A GPT-4-0125-preview a gpt-4-1106-preview hibáit is elhárítja, a nem angol nyelvű UTF-8 kezeléssel.
  • A GPT-4 verzió turbo-2024-04-09 a legújabb GA-kiadás, és lecseréli 0125-Previewa , 1106-previewés vision-preview.

Fontos

A GPT-4 (gpt-4) verziók1106-Preview0125-Preview, és vision-preview a jövőben egy stabil verzióval gpt-4 lesznek frissítve.

  • A verziók 1106-Previewközponti telepítéseigpt-4, 0125-Previewés vision-preview az "Automatikus frissítés alapértelmezettre" és a "Frissítés lejárt" értékre állítás után a rendszer a stabil verzió kiadása után megkezdi a frissítését. Minden üzemelő példány esetében a modellverzió frissítése az API-hívások szolgáltatásának megszakítása nélkül történik. A frissítések régiónként vannak megosztva, és a teljes frissítési folyamat várhatóan 2 hétig tart.
  • A verziók 1106-Previewközponti telepítéseigpt-4, 0125-Previewés vision-preview a "Nincs automatikus frissítés" beállítás nem lesz frissítve, és leállnak, amikor az előzetes verziót frissítik a régióban. A frissítés időzítésével kapcsolatos további információkért tekintse meg az Azure OpenAI-modell kivonásait és elavulását .

GPT-3.5

A GPT-3.5 modellek képesek megérteni és létrehozni a természetes nyelvet vagy kódot. A GPT-3.5 család leginkább alkalmas és költséghatékony modellje a GPT-3.5 Turbo, amely csevegésre lett optimalizálva, és jól működik a hagyományos befejezési feladatokhoz is. A GPT-3.5 Turbo a Chat Completions API-val használható. A GPT-3.5 Turbo Instruct hasonló képességekkel text-davinci-003 rendelkezik a Befejezések API használatához a Csevegés befejezések API helyett. A GPT-3.5 Turbo és a GPT-3.5 Turbo Instruct örökölt GPT-3.5 és GPT-3 modellek használatát javasoljuk.

Modellazonosító Leírás Maximális kérelem (jogkivonatok) Betanítási adatok (legfeljebb)
gpt-35-turbo (0125) ÚJ Legújabb GA-modell
- JSON mód
- párhuzamos függvényhívás
- reprodukálható kimenet (előzetes verzió)
- Nagyobb pontosság a kért formátumokban való válaszadáshoz.
– Kijavítottunk egy hibát, amely szövegkódolási hibát okozott a nem angol nyelvű függvényhívások esetében.
Bemenet: 16 385
Kimenet: 4096
2021. szeptember
gpt-35-turbo (1106) Régebbi GA-modell
- JSON mód
- párhuzamos függvényhívás
- reprodukálható kimenet (előzetes verzió)
Bemenet: 16 385
Kimenet: 4096
2021. szeptember
gpt-35-turbo-instruct (0914) Csak befejezési végpont
- Régi befejezési modellek cseréje
4,097 2021. szeptember
gpt-35-turbo-16k (0613) Régebbi GA-modell
- Alapszintű függvényhívás eszközökkel
16,384 2021. szeptember
gpt-35-turbo (0613) Régebbi GA-modell
- Alapszintű függvényhívás eszközökkel
4,096 2021. szeptember
gpt-35-turbo1 (0301) Régebbi GA-modell
- Nyugdíjazási információk
4,096 2021. szeptember

Ha többet szeretne megtudni a GPT-3.5 Turbo és a Csevegés befejezések API használatáról, tekintse meg részletes útmutatónkat.

1 Ez a modell 4096 jogkivonatot > fogad el. Nem ajánlott túllépni a 4096 bemeneti jogkivonat korlátját, mivel a modell újabb verziója 4096 jogkivonaton van leképezve. Ha 4096 bemeneti jogkivonat túllépésekor problémákat tapasztal ezzel a modellel, ez a konfiguráció hivatalosan nem támogatott.

Beágyazások

text-embedding-3-large A legújabb és leginkább alkalmas beágyazási modell. A beágyazási modellek közötti frissítés nem lehetséges. Ahhoz, hogy áttérjen a használatról text-embedding-ada-002 , text-embedding-3-large új beágyazásokat kell létrehoznia.

  • text-embedding-3-large
  • text-embedding-3-small
  • text-embedding-ada-002

A tesztelés során az OpenAI a nagy és a kis harmadik generációs beágyazási modelleket is jobb átlagos többnyelvű lekérési teljesítményt nyújt a MIRACL-teljesítményteszttel , miközben továbbra is fenntartja az angol feladatok teljesítményét az MTEB-teljesítményteszttel .

Kiértékelési teljesítményteszt text-embedding-ada-002 text-embedding-3-small text-embedding-3-large
MIRACL-átlag 31.4 44.0 54.9
MTEB-átlag 61,0 62.3 64.6

A harmadik generációs beágyazási modellek támogatják a beágyazás méretének csökkentését egy új dimensions paraméterrel. A nagyobb beágyazások általában számítási, memória- és tárolási szempontból drágábbak. A dimenziók számának módosításához nagyobb mértékben szabályozható a teljes költség és a teljesítmény. A dimensions paraméter nem támogatott az OpenAI 1.x Python-kódtár minden verziójában, ezért javasoljuk, hogy a paramétert a legújabb verzióra frissítse: pip install openai --upgrade.

Az OpenAI MTEB benchmark-tesztje azt találta, hogy még akkor is, ha a harmadik generációs modell méretei 1536-nál text-embeddings-ada-002 kisebbre csökkennek, a teljesítmény kissé jobb marad.

DALL-E

A DALL-E modellek képeket hoznak létre a felhasználó által megadott szöveges kérésekből. A DALL-E 3 általánosan elérhető a REST API-khoz. A DALL-E 2 és a DALL-E 3 ügyféloldali SDK-kkal előzetes verzióban érhető el.

Súg

A Suttogó modellek szövegfelolvasáshoz használhatók.

A Whisper-modellt az Azure AI Speech kötegelt átírási API-val is használhatja. További információ az Azure AI Speech és az Azure OpenAI szolgáltatás használatáról: Mi a Whisper-modell?

Szövegfelolvasás (előzetes verzió)

A jelenleg előzetes verzióban elérhető OpenAI-szöveg-beszédmodellek a szöveg beszédszintézisére használhatók.

Az OpenAI szöveget az Azure AI Speech használatával is beszédre használhatja. További információ: OpenAI text to speech voices via Azure OpenAI Service vagy Azure AI Speech guide.

Modellösszesítő táblázat és régió rendelkezésre állása

Feljegyzés

Ez a cikk elsősorban a Standard üzembehelyezési típusokkal rendelkező összes Azure OpenAI-ügyfélre érvényes modell/régió rendelkezésre állását ismerteti. Egyes kiválasztott ügyfelek hozzáférhetnek az alábbi egyesített táblázatban nem szereplő modell-/régiókombinációkhoz. A kiépített üzembe helyezésekkel kapcsolatos további információkért tekintse meg a kiépített útmutatót.

Standard üzemi modell rendelkezésre állása

Régió o1-preview, 2024-09-12 o1-mini, 2024-09-12 gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, vision-preview gpt-4, turbo-2024-04-09 gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4-32k, 0613 gpt-35-turbo, 0301 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613 gpt-35-turbo-instruct, 0914 text-embedding-ada-002, 1 text-embedding-ada-002, 2 text-embedding-3-small, 1 text-embedding-3-large, 1 dall-e-2, 2.0 dall-e-3, 3.0 babbage-002, 1 davinci-002, 1 tts, 001 tts-hd, 001 whisper, 001
ausztráliaeast - - - - - - - - - - - - - - - - - - -
brazilsouth - - - - - - - - - - - - - - - - - - - - - - - - - - -
canadaeast - - - - - - - - - - - - - - - - - -
eastus - - - - - - - - - - - -
eastus2 - - - - - - - - - - - - - -
francecentral - - - - - - - - - - - - - - - - - - -
japaneast - - - - - - - - - - - - - - - - - - - - - -
northcentralus - - - - - - - - - - - - - -
norwayeast - - - - - - - - - - - - - - - - - - - - - - - -
southafricanorth - - - - - - - - - - - - - - - - - - - - - - - - - - -
USA déli középső régiója - - - - - - - - - - - - - - - - - - -
southindia - - - - - - - - - - - - - - - - - - - - - - -
swedencentral - - - - - -
switzerlandnorth - - - - - - - - - - - - - - - - - - - - -
uksouth - - - - - - - - - - - - - - - - - - - -
westeurope - - - - - - - - - - - - - - - - - - - - - - - - -
westus - - - - - - - - - - - - - - - - - - -
westus3 - - - - - - - - - - - - - - - - - - - -

Ez a táblázat nem tartalmazza a regionális rendelkezésre állási adatok finomhangolását. Az információkért tekintse meg a finomhangolási szakaszt .

Az alapértelmezett kvótával kapcsolatos információkért tekintse meg a kvóta és a korlátok című cikket.

Üzembehelyezési modell rendelkezésre állása

Régió gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, turbo-2024-04-09 gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4-32k, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125
ausztráliaeast -
brazilsouth - - -
canadacentral - - - - - - -
canadaeast - - - -
eastus
eastus2
francecentral - - -
germanywestcentral - - -
japaneast - - - -
koreacentral - - - -
northcentralus
norwayeast - - - - - - -
lengyelországcentral - -
southafricanorth - - - - -
USA déli középső régiója - -
southindia - -
swedencentral
switzerlandnorth -
svájcwest - - - - - - - - -
uksouth - -
westus -
westus3 - -

Feljegyzés

A Verzió kiépített verziója gpt-4 : turbo-2024-04-09 jelenleg csak szövegre korlátozódik.

A kiépített üzembe helyezésekkel kapcsolatos további információkért tekintse meg a kiépített útmutatót.

Globális standard modell rendelkezésre állása

Régió o1-preview, 2024-09-12 o1-mini, 2024-09-12 gpt-4, turbo-2024-04-09 gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4o-realtime-preview, 2024-10-01
ausztráliaeast - - - -
brazilsouth - - - -
canadaeast - - - -
eastus - - -
eastus2
francecentral - - - -
germanywestcentral - - - -
japaneast - - - -
koreacentral - - - -
northcentralus - - -
norwayeast - - - -
lengyelországcentral - - - -
southafricanorth - - - -
USA déli középső régiója - - -
southindia - - - -
spaincentral - - - -
swedencentral
switzerlandnorth - - - -
uksouth - - - -
westeurope - - - -
westus - - -
westus3 - - -

Globálisan kiosztott felügyelt modell rendelkezésre állása

Régió gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18
ausztráliaeast
brazilsouth
canadacentral
canadaeast
eastus
eastus2
francecentral
germanywestcentral
japaneast
koreacentral
northcentralus
norwayeast
lengyelországcentral
southafricanorth
USA déli középső régiója
southindia
spaincentral
swedencentral
switzerlandnorth
svájcwest
uksouth
westeurope
westus
westus3

A kötegelt modell globális rendelkezésre állása

Régió gpt-4, 0613 gpt-4, turbo-2024-04-09 gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125
eastus
swedencentral
westus

GPT-4 és GPT-4 Turbo modell rendelkezésre állása

Nyilvános felhőrégiók

Régió gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, vision-preview gpt-4, turbo-2024-04-09 gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4-32k, 0613
ausztráliaeast - - - - -
canadaeast - - - - - -
eastus - - - -
eastus2 - - - -
francecentral - - - - - -
japaneast - - - - - - - -
northcentralus - - - -
norwayeast - - - - - - - -
USA déli középső régiója - - - -
southindia - - - - - - - -
swedencentral -
switzerlandnorth - - - - - -
uksouth - - - - - - -
westus - - -
westus3 - - - -

Ügyfélhozzáférés kiválasztása

A fenti régiók mellett, amelyek minden Azure OpenAI-ügyfél számára elérhetők, egyes kiválasztott, már meglévő ügyfelek további régiókban kaptak hozzáférést a GPT-4 verzióihoz:

Modell Régió
gpt-4 (0314)
gpt-4-32k (0314)
USA keleti régiója
Közép-Franciaország
USA déli középső régiója
Az Egyesült Királyság déli régiója
gpt-4 (0613)
gpt-4-32k (0613)
USA keleti régiója
USA 2. keleti régiója
Kelet-Japán
Az Egyesült Királyság déli régiója

GPT-3.5 modellek

Fontos

Az ÚJ gpt-35-turbo (0125) modell számos fejlesztést tartalmaz, többek között nagyobb pontosságot a kért formátumokban való válaszadáshoz, valamint egy olyan hiba kijavítását, amely a nem angol nyelvű függvényhívások szövegkódolási hibáját okozta.

A GPT-3.5 Turbót a Chat Completion API-val együtt használják. A GPT-3.5 Turbo 0301-es verziója a Completions API-val is használható, bár ez nem ajánlott. A GPT-3.5 Turbo 0613- és 1106-os verziói csak a Chat Completions API-t támogatják.

A GPT-3.5 Turbo 0301-es verziója a modell első verziója. A 0613-es verzió a modell második verziója, és függvényhívási támogatást ad hozzá.

A modellverziókból megtudhatja, hogyan kezeli az Azure OpenAI Service a modellverzió-frissítéseket, és hogyan dolgozhat modellekkel a GPT-3.5 Turbo-környezetek modellverzió-beállításainak megtekintéséhez és konfigurálásához.

GPT-3.5-Turbo modell rendelkezésre állása

Nyilvános felhőrégiók

Régió gpt-35-turbo, 0301 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613 gpt-35-turbo-instruct, 0914
ausztráliaeast - - -
canadaeast - -
eastus -
eastus2 - - -
francecentral - -
japaneast - - - -
northcentralus - - -
USA déli középső régiója - - - -
southindia - - - - -
swedencentral - -
switzerlandnorth - - - -
uksouth - -
westeurope - - - - -
westus - - - -
westus3 - - - - -

Beágyazási modellek

Ezek a modellek csak API-kérések beágyazásával használhatók.

Feljegyzés

text-embedding-3-large A legújabb és leginkább alkalmas beágyazási modell. A beágyazási modellek közötti frissítés nem lehetséges. A használatból text-embedding-ada-002 text-embedding-3-large való migráláshoz új beágyazásokat kell létrehoznia.

Modellazonosító Maximális kérelem (jogkivonatok) Kimeneti dimenziók Betanítási adatok (naprakész)
text-embedding-ada-002 (2. verzió) 8,191 1,536 2021. szeptember
text-embedding-ada-002 (1. verzió) 2,046 1,536 2021. szeptember
text-embedding-3-large 8,191 3,072 2021. szeptember
text-embedding-3-small 8,191 1,536 2021. szeptember

Feljegyzés

Bemenetek tömbjének beágyazáshoz való küldésekor a tömbben lévő bemeneti elemek maximális száma a beágyazási végpontra irányuló hívásonként 2048.

Nyilvános felhőrégiók

Régió text-embedding-ada-002, 1 text-embedding-ada-002, 2 text-embedding-3-small, 1 text-embedding-3-large, 1
ausztráliaeast - - -
brazilsouth - - -
canadaeast -
eastus
eastus2 -
francecentral - -
japaneast - -
northcentralus - - -
norwayeast - -
southafricanorth - - -
USA déli középső régiója - -
southindia - -
swedencentral - -
switzerlandnorth - - -
uksouth - -
westeurope - - -
westus - - -
westus3 - -

DALL-E modellek

Modellazonosító Funkció rendelkezésre állása Maximális kérelem (karakterek)
dalle2 (előzetes verzió) USA keleti régiója 1000
dall-e-3 USA keleti régiója, Kelet-Ausztrália, Közép-Svédország 4 000

Modellek finomhangolása

babbage-002 és davinci-002 nincsenek betanításuk az utasítások követésére. Ezeknek az alapmodelleknek a lekérdezése csak egy finomhangolt verzió hivatkozási pontjaként végezhető el a betanítás előrehaladásának kiértékeléséhez.

gpt-35-turbo - A modell finomhangolása a régiók egy részhalmazára korlátozódik, és nem érhető el minden régióban, ahol az alapmodell elérhető.

Modellazonosító Régiók finomhangolása Maximális kérelem (jogkivonatok) Betanítási adatok (legfeljebb)
babbage-002 USA északi középső régiója
Svédország középső régiója
Nyugat-Svájc
16,384 2021. szeptember
davinci-002 USA északi középső régiója
Svédország középső régiója
Nyugat-Svájc
16,384 2021. szeptember
gpt-35-turbo (0613) USA 2. keleti régiója
USA északi középső régiója
Svédország középső régiója
Nyugat-Svájc
4,096 2021. szeptember
gpt-35-turbo (1106) USA 2. keleti régiója
USA északi középső régiója
Svédország középső régiója
Nyugat-Svájc
Bemenet: 16 385
Kimenet: 4096
2021. szeptember
gpt-35-turbo (0125) USA 2. keleti régiója
USA északi középső régiója
Svédország középső régiója
Nyugat-Svájc
16,385 2021. szeptember
gpt-4 (0613) 1 USA északi középső régiója
Közép-Svédország
8192 2021. szeptember
gpt-4o-mini1 (2024-07-18) USA északi középső régiója
Közép-Svédország
Bemenet: 128 000
Kimenet: 16 384
Példa betanítási környezet hossza: 64 536
2023. október
gpt-4o1 (2024-08-06) USA 2. keleti régiója
USA északi középső régiója
Közép-Svédország
Bemenet: 128 000
Kimenet: 16 384
Példa betanítási környezet hossza: 64 536
2023. október

1 GPT-4, GPT-4o és GPT-4o mini finomhangolás jelenleg nyilvános előzetes verzióban érhető el. További információért tekintse meg a GPT-4, GPT-4o és > GPT-4o mini finomhangolási biztonsági kiértékelési útmutatónkat.

Suttogó modellek

Modellazonosító Modell rendelkezésre állása Maximális kérelem (hangfájl mérete)
whisper USA 2. keleti régiója
USA északi középső régiója
Kelet-Norvégia
Dél-India
Svédország középső régiója
Nyugat-Európa
25 MB

Szöveg–beszédmodellek (előzetes verzió)

Modellazonosító Modell rendelkezésre állása
tts-1 USA északi középső régiója
Közép-Svédország
tts-1-hd USA északi középső régiója
Közép-Svédország

Asszisztensek (előzetes verzió)

Az Asszisztensek esetében egy támogatott modell és egy támogatott régió kombinációjára van szükség. Bizonyos eszközökhöz és képességekhez a legújabb modellek szükségesek. A következő modellek érhetők el az Asszisztensek API-ban, az SDK-ban, az Azure AI Studióban és az Azure OpenAI Studióban. Az alábbi táblázat használatalapú fizetésre szolgál. A kiosztott átviteli egység (PTU) rendelkezésre állásáról további információt a kiosztott átviteli sebességben talál. A felsorolt modellek és régiók az Assistants v1 és v2 verzióval is használhatók. Globális standard modelleket akkor használhat, ha az alább felsorolt régiókban támogatottak.

Régió gpt-35-turbo (0613) gpt-35-turbo (1106) fine tuned gpt-3.5-turbo-0125 gpt-4 (0613) gpt-4 (1106) gpt-4 (0125) gpt-4o (2024-05-13) gpt-4o-mini (2024-07-18)
Kelet-Ausztrália
USA keleti régiója
USA 2. keleti régiója
Közép-Franciaország
Kelet-Japán
Kelet-Norvégia
Közép-Svédország
Az Egyesült Királyság déli régiója
USA nyugati régiója
USA 3. nyugati régiója

Modell kivonása

A modell kivonásával kapcsolatos legfrissebb információkért tekintse meg a modell kivonási útmutatójában.

Következő lépések