Az Azure OpenAI Service modelljei

Az Azure OpenAI szolgáltatást különböző képességekkel és árpontokkal rendelkező modellek változatos halmaza működteti. A modellek elérhetősége régiónként változik. A GPT-3 és más, 2024 júliusában nyugdíjba vonuló modellekkel kapcsolatban lásd: Azure OpenAI Service legacy modellek.

Modellek Leírás
GPT-4 Turbo 🆕 A legújabb, többmodális verziójú Azure OpenAI-modellek, amelyek bemenetként szöveget és képeket is elfogadnak.
GPT-4 A GPT-3.5-ben fejleszthető modellek, amelyek képesek megérteni és létrehozni a természetes nyelvet és kódot.
GPT-3.5 A GPT-3-on fejleszthető modellek, amelyek képesek megérteni és létrehozni a természetes nyelvet és a kódot.
Beágyazások Olyan modellek készlete, amelyek a szöveg numerikus vektorformává alakíthatók a szöveg hasonlóságának megkönnyítése érdekében.
DALL-E Olyan modellek sorozata, amelyek eredeti képeket hozhatnak létre természetes nyelvről.
Suttogás Előzetes verziójú modellek sorozata, amelyek átírhatják és lefordíthatják a beszédet szöveggé.
Szövegfelolvasás (előzetes verzió) Egy előzetes verziójú modellsorozat, amely képes szövegfelolvasásra.

GPT-4 Turbo

A GPT-4 Turbo egy nagy multimodális modell (szöveg- vagy képbemenetek elfogadása és szöveg generálása), amely nagyobb pontossággal képes megoldani a nehéz problémákat, mint az OpenAI korábbi modelljei. A GPT-3.5 Turbo és a régebbi GPT-4 modellekhez hasonlóan a GPT-4 Turbo is csevegésre van optimalizálva, és jól működik a hagyományos befejezési feladatokhoz.

A GPT-4 Turbo legújabb GA kiadása a következő:

  • gpt-4Verzió:turbo-2024-04-09

Ez a következő előzetes modellek lecserélése:

  • gpt-4Verzió:1106-Preview
  • gpt-4Verzió:0125-Preview
  • gpt-4Verzió:vision-preview

Az OpenAI és az Azure OpenAI GPT-4 Turbo GA modellek közötti különbségek

  • Az OpenAI legújabb 0409 turbómodell verziója támogatja a JSON módot és a függvényeket, amelyek minden következtetési kérést meghívnak.
  • Az Azure OpenAI legújabb turbo-2024-04-09 verziója jelenleg nem támogatja a JSON mód és a függvényhívás használatát, amikor következtetési kérelmeket készít képi (vision) bemenettel. A szövegalapú bemeneti kérések (képek nélküli image_url és beágyazott kérések) támogatják a JSON-módot és a függvényhívást.

Különbségek a gpt-4 vision-preview-tól

  • Az Azure AI-specifikus Vision-fejlesztések a GPT-4 Turbo és a Vision integrációját nem támogatják a gpt-4Verzió:turbo-2024-04-09. Ez magában foglalja az optikai karakterfelismerést (OCR), az objektumok földelését, a videoüzeneteket és az adatok képekkel való jobb kezelését.

GPT-4 Turbo kiosztott felügyelt rendelkezésre állás

  • gpt-4Verzió:turbo-2024-04-09 standard és kiépített üzemelő példányokhoz is elérhető. A modell kiépített verziója jelenleg nem támogatja a kép-/látásbeli következtetési kérelmeket. A modell kiépített üzembe helyezései csak szöveges bemeneteket fogadnak el. A standard modelltelepítések szöveges és képi/látási következtetési kéréseket is elfogadnak.

Régiónkénti elérhetőség

A modell regionális elérhetőségével kapcsolatos információkért tekintse meg a standard és a kiépített üzemelő példányok modellmátrixát.

A GPT-4 Turbo üzembe helyezése a Vision GA-val

Ha a GA-modellt a Studio felhasználói felületén szeretné üzembe helyezni, válassza ki GPT-4 , majd válassza ki a turbo-2024-04-09 verziót a legördülő menüből. A modell alapértelmezett kvótája megegyezik a gpt-4-turbo-2024-04-09 GPT-4-Turbo jelenlegi kvótával. Tekintse meg a regionális kvótakorlátokat.

GPT-4

A GPT-4 a GPT-4 Turbo elődje. Mind a GPT-4, mind a GPT-4 Turbo modellek alapmodelljének gpt-4neve . A GPT-4 és a Turbo modellek között a modellverzió vizsgálatával lehet különbséget tenni.

  • gpt-4Verzió0314
  • gpt-4Verzió0613
  • gpt-4-32kVerzió0613

A modellösszesítő táblázatban láthatja az egyes modellek által támogatott jogkivonat-környezet hosszát.

GPT-4 és GPT-4 Turbo modellek

  • Ezek a modellek csak a Csevegés befejezése API-val használhatók.

A modellverziókból megtudhatja, hogyan kezeli az Azure OpenAI Service a modellverzió-frissítéseket, és hogyan dolgozhat modellekkel a GPT-4 üzemelő példányok modellverzió-beállításainak megtekintéséhez és konfigurálásához.

Modellazonosító Maximális kérelem (jogkivonatok) Betanítási adatok (legfeljebb)
gpt-4 (0314) 8,192 2021. szeptember
gpt-4-32k(0314) 32,768 2021. szeptember
gpt-4 (0613) 8,192 2021. szeptember
gpt-4-32k (0613) 32,768 2021. szeptember
gpt-4 (1106-előzetes verzió)1
GPT-4 Turbo előzetes verzió
Bemenet: 128 000
Kimenet: 4096
2023. ápr.
gpt-4 (0125-preview)1
GPT-4 Turbo előzetes verzió
Bemenet: 128 000
Kimenet: 4096
2023. december
gpt-4 (vision-preview)2
GPT-4 Turbo a Vision Előzetes verzióval
Bemenet: 128 000
Kimenet: 4096
2023. ápr.
gpt-4 (turbo-2024-04-09) 🆕
GPT-4 Turbo a Vision GA-val
Bemenet: 128 000
Kimenet: 4096
2023. december

1 GPT-4 Turbo Preview = gpt-4 (0125-Preview) vagy gpt-4 (1106-Preview). A modell üzembe helyezéséhez válassza a gpt-4 modellt az Üzembe helyezések csoportban. A verzió alatt válassza a (0125-Preview) vagy a (1106-Preview) lehetőséget.

2 GPT-4 Turbo Vision Preview = gpt-4 (vision-preview). A modell üzembe helyezéséhez válassza a gpt-4 modellt az Üzembe helyezések csoportban. A modellverzióhoz válassza a vision-preview lehetőséget.

Figyelemfelhívás

Nem javasoljuk, hogy éles környezetben használjunk előzetes verziójú modelleket. Az előzetes modellek összes üzembe helyezését a jövőbeli előzetes verziókra és egy stabil verzióra frissítjük. Az előzetes verzióra kijelölt modellek nem követik a standard Azure OpenAI-modell életciklusát.

Feljegyzés

A verziót 0314gpt-4gpt-4-32k legkésőbb 2024. július 5-én kivonjuk. A verziót 0613gpt-4gpt-4-32k legkésőbb 2024. szeptember 30-án kivonjuk. A modellfrissítési viselkedést a modellfrissítési viselkedést tekintheti meg.

  • A GPT-4 0125-előzetes verziója a GPT-4 Turbo előzetes verzió frissített verziója, amely korábban 1106-os előzetes verzióként jelent meg.
  • A GPT-4 0125-előzetes verziója olyan feladatokat hajt végre, mint a kódlétrehozás a gpt-4-1106-előzetes verzióhoz képest. Emiatt a feladattól függően az ügyfelek azt tapasztalhatják, hogy a GPT-4-0125-preview több kimenetet generál a gpt-4-1106-preview-hoz képest. Javasoljuk, hogy az ügyfelek hasonlítsák össze az új modell kimeneteit. A GPT-4-0125-preview a gpt-4-1106-preview hibáit is elhárítja, a nem angol nyelvű UTF-8 kezeléssel. A GPT-4 verzió turbo-2024-04-09 a legújabb GA-kiadás, és lecseréli 0125-Previewa , 1106-previewés vision-preview.

Fontos

  • gpt-4 Az 1106-preview és a 0125-Preview verziók a jövőben stabil verzióval gpt-4 lesznek frissítve. gpt-4 Az 1106-os és a 0125-ös előzetes verzió "Automatikus frissítés alapértelmezettre" és "Frissítés lejárt" értékre állításával a stabil verzió kiadása után a rendszer frissíteni kezdi a frissítést. Minden üzemelő példány esetében a modellverzió frissítése az API-hívások szolgáltatásának megszakítása nélkül történik. A frissítések régiónként vannak megosztva, és a teljes frissítési folyamat várhatóan 2 hétig tart. gpt-4 Az 1106-előzetes verzió és a 0125-Preview "Nincs automatikus frissítés" beállítású üzembe helyezése nem frissül, és a régióban az előzetes verzió frissítésekor leáll. A frissítés időzítésével kapcsolatos további információkért tekintse meg az Azure OpenAI-modell kivonásait és elavulását .

GPT-3.5

A GPT-3.5 modellek képesek megérteni és létrehozni a természetes nyelvet vagy kódot. A GPT-3.5 család leginkább alkalmas és költséghatékony modellje a GPT-3.5 Turbo, amely csevegésre lett optimalizálva, és jól működik a hagyományos befejezési feladatokhoz is. A GPT-3.5 Turbo a Chat Completions API-val használható. A GPT-3.5 Turbo Instruct hasonló képességekkel text-davinci-003 rendelkezik a Befejezések API használatához a Csevegés befejezések API helyett. A GPT-3.5 Turbo és a GPT-3.5 Turbo Instruct örökölt GPT-3.5 és GPT-3 modellek használatát javasoljuk.

  • gpt-35-turbo
  • gpt-35-turbo-16k
  • gpt-35-turbo-instruct

A modellösszesítő táblázatban láthatja az egyes modellek által támogatott jogkivonat-környezet hosszát.

Ha többet szeretne megtudni a GPT-3.5 Turbo és a Csevegés befejezések API használatáról, tekintse meg részletes útmutatónkat.

Beágyazások

text-embedding-3-large A legújabb és leginkább alkalmas beágyazási modell. A beágyazási modellek közötti frissítés nem lehetséges. Ahhoz, hogy áttérjen a használatról text-embedding-ada-002 , text-embedding-3-large új beágyazásokat kell létrehoznia.

  • text-embedding-3-large
  • text-embedding-3-small
  • text-embedding-ada-002

A tesztelés során az OpenAI a nagy és a kis harmadik generációs beágyazási modelleket is jobb átlagos többnyelvű lekérési teljesítményt nyújt a MIRACL-teljesítményteszttel , miközben továbbra is fenntartja az angol feladatok teljesítményét az MTEB-teljesítményteszttel .

Kiértékelési teljesítményteszt text-embedding-ada-002 text-embedding-3-small text-embedding-3-large
MIRACL-átlag 31.4 44.0 54.9
MTEB-átlag 61,0 62.3 64.6

A harmadik generációs beágyazási modellek támogatják a beágyazás méretének csökkentését egy új dimensions paraméterrel. A nagyobb beágyazások általában számítási, memória- és tárolási szempontból drágábbak. A dimenziók számának módosításához nagyobb mértékben szabályozható a teljes költség és a teljesítmény. A dimensions paraméter nem támogatott az OpenAI 1.x Python-kódtár minden verziójában, ezért javasoljuk, hogy a paramétert a legújabb verzióra frissítse: pip install openai --upgrade.

Az OpenAI MTEB benchmark-tesztje azt találta, hogy még akkor is, ha a harmadik generációs modell méretei 1536-nál text-embeddings-ada-002 kisebbre csökkennek, a teljesítmény kissé jobb marad.

DALL-E

A DALL-E modellek képeket hoznak létre a felhasználó által megadott szöveges kérésekből. A DALL-E 3 általánosan elérhető a REST API-khoz. A DALL-E 2 és a DALL-E 3 ügyféloldali SDK-kkal előzetes verzióban érhető el.

Suttogás

A Suttogó modellek szövegfelolvasáshoz használhatók.

A Whisper-modellt az Azure AI Speech kötegelt átírási API-val is használhatja. További információ az Azure AI Speech és az Azure OpenAI szolgáltatás használatáról: Mi a Whisper-modell?

Szövegfelolvasás (előzetes verzió)

A jelenleg előzetes verzióban elérhető OpenAI-szöveg-beszédmodellek a szöveg beszédszintézisére használhatók.

Az OpenAI szöveget az Azure AI Speech használatával is beszédre használhatja. További információ: OpenAI text to speech voices via Azure OpenAI Service vagy Azure AI Speech guide.

Modellösszesítő táblázat és régió rendelkezésre állása

Feljegyzés

Ez a cikk elsősorban a Standard üzembehelyezési típusokkal rendelkező összes Azure OpenAI-ügyfélre érvényes modell/régió rendelkezésre állását ismerteti. Egyes kiválasztott ügyfelek hozzáférhetnek az alábbi egyesített táblázatban nem szereplő modell-/régiókombinációkhoz. A kiépített üzembe helyezésekkel kapcsolatos további információkért tekintse meg a kiépített útmutatót.

Standard üzemi modell rendelkezésre állása

Régió gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, vision-preview gpt-4, turbo-2024-04-09 gpt-4-32k, 0613 gpt-35-turbo, 0301 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613 gpt-35-turbo-instruct, 0914 text-embedding-ada-002, 1 text-embedding-ada-002, 2 text-embedding-3-small, 1 text-embedding-3-large, 1 babbage-002, 1 dall-e-3, 3.0 davinci-002, 1 tts, 001 tts-hd, 001 whisper, 001
ausztráliaeast - - - - - - - - - - - - -
brazilsouth - - - - - - - - - - - - - - - - - - - - -
canadaeast - - - - - - - - - - - -
eastus - - - - - - - - - - - -
eastus2 - - - - - - - - - - - - - -
francecentral - - - - - - - - - - - - - -
japaneast - - - - - - - - - - - - - - - - - -
northcentralus - - - - - - - - - - - -
norwayeast - - - - - - - - - - - - - - - - - - -
southafricanorth - - - - - - - - - - - - - - - - - - - - -
USA déli középső régiója - - - - - - - - - - - - - - - - -
southindia - - - - - - - - - - - - - - - - - -
swedencentral - - - - - -
switzerlandnorth - - - - - - - - - - - - - - - -
uksouth - - - - - - - - - - - - - - -
westeurope - - - - - - - - - - - - - - - - - - -
westus - - - - - - - - - - - - - - - - - -
westus3 - - - - - - - - - - - - - - - - -

Ez a táblázat nem tartalmazza a regionális rendelkezésre állás finomhangolását, erről a dedikált finomhangolási szakaszból tájékozódhat.

Standard üzemi modell kvótája

A modellek alapértelmezett kvótája modelltől és régiótól függően változik. Az alapértelmezett kvótakorlátok változhatnak.

A standard üzemelő példányok kvótáját a Tokens-Per-Minute (TPM) kifejezések ismertetik.

Régió GPT-4 GPT-4-32K GPT-4-Turbo GPT-4-Turbo-V GPT-35-Turbo GPT-35-Turbo-Instruct Text-Embedding-Ada-002 text-embedding-3-small text-embedding-3-large Babbage-002 Babbage-002 - finetune Davinci-002 Davinci-002 - finetune GPT-35-Turbo - finetune GPT-35-Turbo-1106 - finetune GPT-35-Turbo-0125 - finetune
ausztráliaeast 40 K 80 K 80 K 30 K 300 K - 350 K - - - - - - - - -
brazilsouth - - - - - - 350 K - - - - - - - - -
canadaeast 40 K 80 K 80 K - 300 K - 350 K 350 K 350 K - - - - - - -
eastus - - 80 K - 240 K 240 K 240 K 350 K 350 K - - - - - - -
eastus2 - - 80 K - 300 K - 350 K 350 K 350 K - - - - 250 K 250 K 250 K
francecentral 20 e 60 K 80 K - 240 K - 240 K - - - - - - - - -
japaneast - - - 30 K 300 K - 350 K - - - - - - - - -
northcentralus - - 80 K - 300 K - 350 K - - 240 K 250 K 240 K 250 K 250 K 250 K 250 K
norwayeast - - 150 K - - - 350 K - - - - - - - - -
southafricanorth - - - - - - 350 K - - - - - - - - -
USA déli középső régiója - - 80 K - 240 K - 240 K - - - - - - - - -
southindia - - 150 K - 300 K - 350 K - - - - - - - - -
swedencentral 40 K 80 K 150 K 30 K 300 K 240 K 350 K - - 240 K 250 K 240 K 250 K 250 K 250 K 250 K
switzerlandnorth 40 K 80 K - 30 K 300 K - 350 K - - - - - - - - -
svájcwest - - - - - - - - - - 250 K - 250 K 250 K 250 K 250 K
uksouth - - 80 K - 240 K - 350 K - - - - - - - - -
westeurope - - - - 240 K - 240 K - - - - - - - - -
westus - - 80 K 30 K 300 K - 350 K - - - - - - - - -
westus3 - - 80 K - - - 350 K - - - - - - - - -

1 K = 1000 token/perc (TPM). A TPM és a percenkénti kérések (RPM) közötti kapcsolat jelenleg 6 RPM/1000 TPM-ként van definiálva.

Üzembehelyezési modell rendelkezésre állása

Régió gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, turbo-2024-04-09 gpt-4-32k, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125
ausztráliaeast -
brazilsouth - - -
canadacentral - - - -
canadaeast - - - -
eastus -
eastus2 -
francecentral - -
germanywestcentral - -
japaneast - - - -
koreacentral - - - -
northcentralus -
norwayeast - - - -
lengyelországcentral -
southafricanorth - - -
USA déli középső régiója -
southindia -
swedencentral
switzerlandnorth -
svájcwest - - - - - -
uksouth -
westus -
westus3

Feljegyzés

A Verzió kiépített verziója gpt-4:turbo-2024-04-09 jelenleg csak szövegre korlátozódik.

Hogyan hozzáférést kap a kiépítetthez?

A kiosztott átviteli sebesség beszerzéséhez a Microsoft értékesítési/fiókcsapatával kell beszélnie. Ha nincs értékesítési/fiókcsapata, sajnos jelenleg nem vásárolhat kiosztott átviteli sebességet.

A kiépített üzembe helyezésekkel kapcsolatos további információkért tekintse meg a kiépített útmutatót.

GPT-4 és GPT-4 Turbo modell rendelkezésre állása

Nyilvános felhőrégiók

Régió gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, vision-preview gpt-4, turbo-2024-04-09 gpt-4-32k, 0613
ausztráliaeast - -
canadaeast - - -
eastus - - - - -
eastus2 - - - -
francecentral - - -
japaneast - - - - -
northcentralus - - - - -
norwayeast - - - - -
USA déli középső régiója - - - - -
southindia - - - - -
swedencentral -
switzerlandnorth - - -
uksouth - - - -
westus - - - -
westus3 - - - - -

Ügyfélhozzáférés kiválasztása

A fenti régiók mellett, amelyek minden Azure OpenAI-ügyfél számára elérhetők, egyes kiválasztott, már meglévő ügyfelek további régiókban kaptak hozzáférést a GPT-4 verzióihoz:

Modell Régió
gpt-4 (0314) USA keleti régiója
Közép-Franciaország
USA déli középső régiója
Az Egyesült Királyság déli régiója
gpt-4 (0613) USA keleti régiója
USA 2. keleti régiója
Kelet-Japán
Az Egyesült Királyság déli régiója

Azure Government-régiók

Az Azure Governmentben az alábbi GPT-4 modellek érhetők el:

Modellazonosító Modell rendelkezésre állása
gpt-4 (1106-előzetes verzió) USA-beli államigazgatás – Virginia
USA-beli államigazgatás – Arizona

GPT-3.5 modellek

Fontos

Az ÚJ gpt-35-turbo (0125) modell számos fejlesztést tartalmaz, többek között nagyobb pontosságot a kért formátumokban való válaszadáshoz, valamint egy olyan hiba kijavítását, amely a nem angol nyelvű függvényhívások szövegkódolási hibáját okozta.

A GPT-3.5 Turbót a Chat Completion API-val együtt használják. A GPT-3.5 Turbo 0301-es verziója a Completions API-val is használható, bár ez nem ajánlott. A GPT-3.5 Turbo 0613- és 1106-os verziói csak a Chat Completions API-t támogatják.

A GPT-3.5 Turbo 0301-es verziója a modell első verziója. A 0613-es verzió a modell második verziója, és függvényhívási támogatást ad hozzá.

A modellverziókból megtudhatja, hogyan kezeli az Azure OpenAI Service a modellverzió-frissítéseket, és hogyan dolgozhat modellekkel a GPT-3.5 Turbo-környezetek modellverzió-beállításainak megtekintéséhez és konfigurálásához.

Feljegyzés

A verzió 0613 és gpt-35-turbo-16kgpt-35-turbo a kivonás legkorábban 2024. augusztus 1-jére lesz kivezetve. A verzió 0301 legkésőbb gpt-35-turbo 2024. augusztus 1-jére megszűnik. A modellfrissítési viselkedést a modellfrissítési viselkedést tekintheti meg.

Modellazonosító Maximális kérelem (jogkivonatok) Betanítási adatok (legfeljebb)
gpt-35-turbo1 (0301) 4,096 2021. szeptember
gpt-35-turbo (0613) 4,096 2021. szeptember
gpt-35-turbo-16k (0613) 16,384 2021. szeptember
gpt-35-turbo-instruct (0914) 4,097 2021. szeptember
gpt-35-turbo (1106) Bemenet: 16 385
Kimenet: 4096
2021. szeptember
gpt-35-turbo (0125) ÚJ Bemenet: 16 385
Kimenet: 4096
2021. szeptember

GPT-3.5-Turbo modell rendelkezésre állása

Nyilvános felhőrégiók

Régió gpt-35-turbo, 0301 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613 gpt-35-turbo-instruct, 0914
ausztráliaeast - - -
canadaeast - -
eastus - -
eastus2 - - - -
francecentral - -
japaneast - - - -
northcentralus - - -
USA déli középső régiója - - - -
southindia - - - - -
swedencentral - -
switzerlandnorth - - - -
uksouth - -
westeurope - - - - -
westus - - - - -

1 Ez a modell 4096 jogkivonatot > fogad el. Nem ajánlott túllépni a 4096 bemeneti jogkivonat korlátját, mivel a modell újabb verziója 4096 jogkivonaton van leképezve. Ha 4096 bemeneti jogkivonat túllépésekor problémákat tapasztal ezzel a modellel, ez a konfiguráció hivatalosan nem támogatott.

Azure Government-régiók

Az Azure Governmentben az alábbi GPT-3.5 turbómodellek érhetők el:

Modellazonosító Modell rendelkezésre állása
gpt-35-turbo (1106-előzetes verzió) USA-beli államigazgatás – Virginia

Beágyazási modellek

Ezek a modellek csak API-kérések beágyazásával használhatók.

Feljegyzés

text-embedding-3-large A legújabb és leginkább alkalmas beágyazási modell. A beágyazási modellek közötti frissítés nem lehetséges. A használatból text-embedding-ada-002text-embedding-3-large való migráláshoz új beágyazásokat kell létrehoznia.

Modellazonosító Maximális kérelem (jogkivonatok) Kimeneti dimenziók Betanítási adatok (naprakész)
text-embedding-ada-002 (2. verzió) 8,191 1,536 2021. szeptember
text-embedding-ada-002 (1. verzió) 2,046 1,536 2021. szeptember
text-embedding-3-large 8,191 3,072 2021. szeptember
text-embedding-3-small 8,191 1,536 2021. szeptember

Feljegyzés

Bemenetek tömbjének beágyazáshoz való küldésekor a tömbben lévő bemeneti elemek maximális száma a beágyazási végpontra irányuló hívásonként 2048.

Nyilvános felhőrégiók

Régió text-embedding-ada-002, 1 text-embedding-ada-002, 2 text-embedding-3-small, 1 text-embedding-3-large, 1
ausztráliaeast - - -
brazilsouth - - -
canadaeast -
eastus
eastus2 -
francecentral - - -
japaneast - - -
northcentralus - - -
norwayeast - - -
southafricanorth - - -
USA déli középső régiója - -
southindia - - -
swedencentral - - -
switzerlandnorth - - -
uksouth - - -
westeurope - - -
westus - - -
westus3 - - -

Azure Government-régiók

A következő beágyazási modellek érhetők el az Azure Governmentben:

Modellazonosító Modell rendelkezésre állása
text-embedding-ada-002 (2. verzió) USA-beli államigazgatás – Virginia
USA-beli államigazgatás – Arizona

DALL-E modellek

Modellazonosító Funkció rendelkezésre állása Maximális kérelem (karakterek)
dalle2 (előzetes verzió) USA keleti régiója 1000
dall-e-3 USA keleti régiója, Kelet-Ausztrália, Közép-Svédország 4 000

Modellek finomhangolása

babbage-002 és davinci-002 nincsenek betanításuk az utasítások követésére. Ezeknek az alapmodelleknek a lekérdezése csak egy finomhangolt verzió hivatkozási pontjaként végezhető el a betanítás előrehaladásának kiértékeléséhez.

gpt-35-turbo - A modell finomhangolása a régiók egy részhalmazára korlátozódik, és nem érhető el minden régióban, ahol az alapmodell elérhető.

Modellazonosító Régiók finomhangolása Maximális kérelem (jogkivonatok) Betanítási adatok (legfeljebb)
babbage-002 USA északi középső régiója
Svédország középső régiója
Nyugat-Svájc
16,384 2021. szeptember
davinci-002 USA északi középső régiója
Svédország középső régiója
Nyugat-Svájc
16,384 2021. szeptember
gpt-35-turbo (0613) USA 2. keleti régiója
USA északi középső régiója
Svédország középső régiója
Nyugat-Svájc
4,096 2021. szeptember
gpt-35-turbo (1106) USA 2. keleti régiója
USA északi középső régiója
Svédország középső régiója
Nyugat-Svájc
Bemenet: 16 385
Kimenet: 4096
2021. szeptember
gpt-35-turbo (0125) USA 2. keleti régiója
USA északi középső régiója
Svédország középső régiója
Nyugat-Svájc
16,385 2021. szeptember

Suttogó modellek

Modellazonosító Modell rendelkezésre állása Maximális kérelem (hangfájl mérete)
whisper USA 2. keleti régiója
USA északi középső régiója
Kelet-Norvégia
Dél-India
Svédország középső régiója
Nyugat-Európa
25 MB

Szöveg–beszédmodellek (előzetes verzió)

Modellazonosító Modell rendelkezésre állása
tts-1 USA északi középső régiója
Közép-Svédország
tts-1-hd USA északi középső régiója
Közép-Svédország

Asszisztensek (előzetes verzió)

Az Asszisztensek esetében egy támogatott modell és egy támogatott régió kombinációjára van szükség. Bizonyos eszközökhöz és képességekhez a legújabb modellek szükségesek. A következő modellek érhetők el az Assistants API-ban, az SDK-ban, az Azure AI Studióban és az Azure OpenAI Studióban. Az alábbi táblázat használatalapú fizetésre szolgál. A kiosztott átviteli egység (PTU) rendelkezésre állásáról további információt a kiosztott átviteli sebességben talál.

Régió gpt-35-turbo (0613) gpt-35-turbo (1106) gpt-4 (0613) gpt-4 (1106) gpt-4 (0125)
Kelet-Ausztrália
USA keleti régiója
USA 2. keleti régiója
Közép-Franciaország
Kelet-Norvégia
Közép-Svédország
Az Egyesült Királyság déli régiója

Következő lépések