Azure OpenAI Service-Modelle
Azure OpenAI Service basiert auf einer Vielzahl von Modellen mit unterschiedlichen Funktionen und Preispunkten. Die Verfügbarkeit der Modelle variiert je nach Region. Informationen zu GPT-3 und anderen Modellen, die im Juli 2024 eingestellt werden, finden Sie unter Legacymodelle von Azure OpenAI Service.
Modelle | BESCHREIBUNG |
---|---|
GPT-4 | Eine Reihe von Modellen, die GPT-3.5 verbessern und natürliche Sprache sowie Code verstehen und generieren können. |
GPT-3.5 | Eine Reihe von Modellen, die GPT-3 verbessern und natürliche Sprache sowie Code verstehen und generieren können. |
Einbettungen | Eine Reihe von Modellen, die Text in numerische Vektorform konvertieren können, um die Textähnlichkeit zu erleichtern. |
DALL-E | Eine Reihe von Modellen, die Originalbilder aus natürlicher Sprache generieren können. |
Whisper | Eine Reihe von Modellen in der Vorschau, die Sprache transkribieren und in Text übersetzen können. |
Sprachsynthese (Vorschau) | Eine Reihe von Modellen in der Vorschau, die Text in Sprache synthetisieren können. |
GPT-4 and GPT-4 Turbo-Preview
GPT-4 ist ein großes multimodales Modell, das Text- oder Bildeingaben akzeptiert und Text generiert und schwierige Probleme mit höherer Genauigkeit als alle früheren Modelle von OpenAI lösen kann. GPT-4 ist genau wie GPT-3.5-Turbo für Chats optimiert und funktioniert auch gut für herkömmliche Vervollständigungsaufgaben. Verwenden Sie die Chatvervollständigungs-API, um GPT-4 zu verwenden. Weitere Informationen zu GPT-4 und zur Chatvervollständigungs-API finden Sie in unserer ausführlichen Anleitung.
GPT-4 Turbo mit Vision ist die Version von GPT-4, die Bildeingaben akzeptiert. Sie ist als vision-preview
-Modell von gpt-4
verfügbar.
gpt-4
gpt-4-32k
Sie können die Tokenkontextlänge, die von jedem Modell unterstützt wird, in der Modellzusammenfassungstabelle sehen.
GPT-3.5
GPT-3.5-Modelle können natürliche Sprache oder Code verstehen und generieren. Das leistungsfähigste und kostengünstigste Modell in der GPT-3.5-Familie ist GPT-3.5 Turbo, das für den Chat optimiert wurde und auch für herkömmliche Vervollständigungsaufgaben gut geeignet ist. GPT-3.5 Turbo ist für die Verwendung mit der Chatvervollständigungs-API verfügbar. GPT-3.5 Turbo Instruct verfügt über ähnliche Funktionen wie text-davinci-003
und nutzt die Vervollständigungs-API anstelle der Chatvervollständigungs-API. Es wird empfohlen, GPT-3.5 Turbo und GPT-3.5 Turbo Instruct anstatt der älteren GPT-3.5- und GPT-3.5-Modelle zu verwenden.
gpt-35-turbo
gpt-35-turbo-16k
gpt-35-turbo-instruct
Sie können die Tokenkontextlänge, die von jedem Modell unterstützt wird, in der Modellzusammenfassungstabelle sehen.
Weitere Informationen zu GPT-3.5 Turbo und zur Chatvervollständigungs-API finden Sie in unserer ausführlichen Anleitung.
Einbettungen
text-embedding-3-large
ist das neueste und leistungsfähigste Einbettungsmodell. Das Upgrade zwischen Einbettungsmodellen ist nicht möglich. Um von text-embedding-ada-002
zu text-embedding-3-large
zu wechseln, müssen Sie neue Einbettungen generieren.
text-embedding-3-large
text-embedding-3-small
text-embedding-ada-002
In Tests berichtet OpenAI, dass sowohl das große als auch das kleine Einbettungsmodell der dritten Generation eine bessere durchschnittliche Leistung beim Abruf mehrerer Sprachen mit der MIRACL-Benchmark bietet, während die Leistung für englische Aufgaben mit der MTEB-Benchmark aufrechterhalten bleibt.
Bewertungsbenchmark | text-embedding-ada-002 |
text-embedding-3-small |
text-embedding-3-large |
---|---|---|---|
MIRACL-Durchschnitt | 31,4 | 44,0 | 54.9 |
MTEB-Durchschnitt | 61.0 | 62,3 | 64,6 |
Die Einbettungsmodelle der dritten Generation unterstützen die Reduzierung der Einbettungsgröße über einen neuen dimensions
-Parameter. In der Regel sind größere Einbettungen aus Compute-, Arbeitsspeicher- und Speicherperspektive teurer. Die Möglichkeit, die Anzahl der Dimensionen anzupassen, ermöglicht eine bessere Kontrolle über die Gesamtkosten und die Leistung. Der Parameter dimensions
wird nicht in allen Versionen der OpenAI 1.x-Python-Bibliothek unterstützt. Um diesen Parameter zu nutzen, empfehlen wir ein Upgrade auf die neueste Version: pip install openai --upgrade
.
Bei den MTEB-Benchmarktests von OpenAI wurde festgestellt, dass die Leistung des Modells der dritten Generation auch dann noch geringfügig besser ist, wenn die Dimensionen auf weniger als 1.536 Dimensionen für text-embeddings-ada-002
reduziert werden.
DALL-E
Die DALL-E-Modelle generieren Bilder aus Textprompts, die der Benutzer bereitstellt. DALL-E 3 ist allgemein verfügbar für die Verwendung mit den REST-APIs. DALL-E 2 und DALL-E 3 mit Client-SDKs befinden sich in der Vorschau.
Whisper
Die Whisper-Modelle können für Spracherkennung verwendet werden.
Sie können das Whisper-Modell auch über die API Batch-Transkription von Azure AI Speech verwenden. Im Artikel Was ist das Whisper-Modell? erfahren Sie mehr darüber, wann Azure KI Speech bzw. wann Azure OpenAI Service verwendet werden sollte.
Sprachsynthese (Vorschau)
Der OpenAI-Sprachsynthesemodelle, die sich derzeit in der Vorschau befinden, können verwendet werden, um Text in Sprache zu synthetisieren.
Sie können den OpenAI-Stimmen für die Sprachsynthese über Azure KI Speech verwenden. Weitere Informationen finden Sie im Leitfaden OpenAI-Stimmen für die Sprachsynthese über Azure OpenAI Service oder über Azure KI Speech.
Tabelle mit Modellzusammenfassung und Regionsverfügbarkeit
Hinweis
Dieser Artikel behandelt nur die Verfügbarkeit von Modellen/Regionen, die für alle Azure OpenAI-Kunden mit Bereitstellungstypen von Standard gelten. Einige ausgewählte Kunden haben Zugriff auf Modell-/Regionskombinationen, die nicht in der einheitlichen Tabelle unten aufgeführt sind. Diese Tabellen gelten auch nicht für Kunden, die nur bereitgestellte Bereitstellungstypen verwenden, die über eine eigene eindeutige Modell-/Regionsverfügbarkeitsmatrix verfügen. Weitere Informationen zu bereitgestellten Bereitstellungen finden Sie in unseren bereitgestellten Richtlinien.
Verfügbarkeit des Standardbereitstellungsmodells
Region |
gpt-4 , 0613 |
gpt-4 , 1106-Preview |
gpt-4 , 0125-Preview |
gpt-4 , vision-preview |
gpt-4-32k , 0613 |
gpt-35-turbo , 0301 |
gpt-35-turbo , 0613 |
gpt-35-turbo , 1106 |
gpt-35-turbo , 0125 |
gpt-35-turbo-16k , 0613 |
gpt-35-turbo-instruct , 0914 |
text-embedding-ada-002 , 1 |
text-embedding-ada-002 , 2 |
text-embedding-3-small , 1 |
text-embedding-3-large , 1 |
babbage-002 , 1 |
dall-e-3 , 3.0 |
davinci-002 , 1 |
tts , 001 |
tts-hd , 001 |
whisper , 001 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
australiaeast | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | - | - | ✅ | - | - | - | ✅ | - | - | - | - |
brazilsouth | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - |
canadaeast | ✅ | ✅ | - | - | ✅ | - | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - |
eastus | - | - | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | - | - |
eastus2 | - | ✅ | - | - | - | - | ✅ | - | - | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | ✅ |
francecentral | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | - | - | - | - | - | - | - | - |
japaneast | - | - | - | ✅ | - | - | ✅ | - | - | ✅ | - | - | ✅ | - | - | - | - | - | - | - | - |
northcentralus | - | - | ✅ | - | - | - | ✅ | - | ✅ | ✅ | - | - | ✅ | - | - | ✅ | - | ✅ | ✅ | ✅ | ✅ |
norwayeast | - | ✅ | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | ✅ |
southafricanorth | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - |
southcentralus | - | - | ✅ | - | - | ✅ | - | - | ✅ | - | - | ✅ | ✅ | - | - | - | - | - | - | - | - |
southindia | - | ✅ | - | - | - | - | - | ✅ | - | - | - | - | ✅ | - | - | - | - | - | - | - | ✅ |
swedencentral | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
switzerlandnorth | ✅ | - | - | ✅ | ✅ | - | ✅ | - | - | ✅ | - | - | ✅ | - | - | - | - | - | - | - | - |
uksouth | - | ✅ | - | - | - | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | - | - | - | - | - | - | - | - |
westeurope | - | - | - | - | - | ✅ | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | ✅ |
westus | - | ✅ | - | ✅ | - | - | - | ✅ | - | - | - | - | ✅ | - | - | - | - | - | - | - | - |
westus3 | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - |
Standardbereitstellungsmodellkontingent
Das Standardkontingent für Modelle variiert je nach Modell und Region. Die Standardkontingentgrenzwerte können sich ändern.
Das Kontingent für Standardbereitstellungen wird in Bezug auf Token-Per-Minute (TPM) beschrieben.
Region | GPT-4 | GPT-4-32K | GPT-4-Turbo | GPT-4-Turbo-V | GPT-35-Turbo | GPT-35-Turbo-Instruct | Text-Embedding-Ada-002 | text-embedding-3-small | text-embedding-3-large | Babbage-002 | Babbage-002 – Optimierung | Davinci-002 | Davinci-002 – Optimierung | GPT-35-Turbo – Optimierung | GPT-35-Turbo-1106 – Optimierung | GPT-35-Turbo-0125 – Optimierung |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
australiaeast | 40 Tsd. | 80.000 | 80.000 | 30.000 | 300 K | - | 350 K | - | - | - | - | - | - | - | - | - |
brazilsouth | - | - | - | - | - | - | 350 K | - | - | - | - | - | - | - | - | - |
canadaeast | 40 Tsd. | 80.000 | 80.000 | - | 300 K | - | 350 K | 350 K | 350 K | - | - | - | - | - | - | - |
eastus | - | - | 80.000 | - | 240.000 | 240.000 | 240.000 | 350 K | 350 K | - | - | - | - | - | - | - |
eastus2 | - | 80.000 | 80.000 | - | 300 K | - | 350 K | 350 K | 350 K | - | - | - | - | 250 Tsd. | 250 Tsd. | 250 Tsd. |
francecentral | 20 Tsd. | 60.000 | 80.000 | - | 240.000 | - | 240.000 | - | - | - | - | - | - | - | - | - |
japaneast | - | - | - | 30.000 | 300 K | - | 350 K | - | - | - | - | - | - | - | - | - |
northcentralus | - | - | 80.000 | - | 300 K | - | 350 K | - | - | 240.000 | 250 Tsd. | 240.000 | 250 Tsd. | 250 Tsd. | 250 Tsd. | 250 Tsd. |
norwayeast | - | - | 150 K | - | - | - | 350 K | - | - | - | - | - | - | - | - | - |
southafricanorth | - | - | - | - | - | - | 350 K | - | - | - | - | - | - | - | - | - |
southcentralus | - | - | 80.000 | - | 240.000 | - | 240.000 | - | - | - | - | - | - | - | - | - |
southindia | - | - | 150 K | - | 300 K | - | 350 K | - | - | - | - | - | - | - | - | - |
swedencentral | 40 Tsd. | 80.000 | 150 K | 30.000 | 300 K | 240.000 | 350 K | - | - | 240.000 | 250 Tsd. | 240.000 | 250 Tsd. | 250 Tsd. | 250 Tsd. | 250 Tsd. |
switzerlandnorth | 40 Tsd. | 80.000 | - | 30.000 | 300 K | - | 350 K | - | - | - | - | - | - | - | - | - |
uksouth | - | - | 80.000 | - | 240.000 | - | 350 K | - | - | - | - | - | - | - | - | - |
westeurope | - | - | - | - | 240.000 | - | 240.000 | - | - | - | - | - | - | - | - | - |
westus | - | - | 80.000 | 30.000 | 300 K | - | 350 K | - | - | - | - | - | - | - | - | - |
westus3 | - | - | - | - | - | - | 350 K | - | - | - | - | - | - | - | - | - |
1 K = 1.000 Token pro Minute (TPM). Die Beziehung zwischen TPM und Anforderungen pro Minute (RPM) ist derzeit auf 6 U/MIN pro 1000 TPM festgelegt.
GPT-4 and GPT-4 Turbo-Previewmodelle
GPT-4, GPT-4-32k und GPT-4 Turbo mit Vision sind jetzt für alle Azure OpenAI Service-Kund*innen verfügbar. Die Verfügbarkeit variiert nach Region. Wenn Sie GPT-4 in Ihrer Region nicht sehen, schauen Sie bitte später noch einmal nach.
Diese Modelle können nur mit der Chatvervollständigungs-API verwendet werden.
GPT-4 Version 0314, ist die erste Version des veröffentlichten Modells. Version 0613 ist die zweite Version des Modells und fügt Unterstützung für Funktionsaufrufe hinzu.
In Modellversionen erfahren Sie, wie Azure OpenAI Service Modellversionsupgrades verarbeitet, und Arbeiten mit Modellen, um zu erfahren, wie Sie die Modellversionseinstellungen Ihrer GPT-4-Bereitstellungen anzeigen und konfigurieren.
Hinweis
Version 0314
von gpt-4
und gpt-4-32k
wird nicht vor dem 5. Juli 2024 eingestellt. Version 0613
von gpt-4
und gpt-4-32k
wird nicht vor dem 30. September 2024 eingestellt. Informationen zum Modellupgradeverhalten finden Sie unter Modellupdates.
GPT-4 Version 0125-preview ist eine aktualisierte Version der GPT-4 Turbo Preview, die zuvor als Version 1106-preview veröffentlicht wurde. GPT-4 Version 0125-preview erledigt Aufgaben wie die Codegenerierung vollständiger als die Version gpt-4-1106-preview. Je nach Aufgabe stellen Kund*innen möglicherweise fest, dass GPT-4-0125-preview im Vergleich zur gpt-4-1106-preview mehr Ausgaben generiert. Wir empfehlen Kund*innen, die Ausgaben des neuen Modells zu vergleichen. GPT-4-0125-preview behebt auch Fehler von gpt-4-1106-preview mit UTF-8-Behandlung für nicht englische Sprachen.
Wichtig
- Die
gpt-4
-Versionen 1106-Vorschau und 0125-Vorschau werden zukünftig mit einer stabilengpt-4
-Version aktualisiert. Das für den 8. März 2024 geplante Bereitstellungsupgrade vongpt-4
1106-Vorschau aufgpt-4
0125-Vorschau erfolgt nicht mehr. Bereitstellungen dergpt-4
-Versionen 1106-Vorschau und 0125-Vorschau werden auf „Automatisches Update auf Standard“ festgelegt, und „Upgrade nach Ablauf“ wird gestartet, nachdem die stabile Version veröffentlicht wurde. Für jede Bereitstellung erfolgt ein Upgrade der Modellversion ohne Unterbrechung des Diensts für API-Aufrufe. Upgrades werden nach Region gestaffelt, und der gesamte Upgradevorgang wird voraussichtlich 2 Wochen dauern. Bereitstellungen dergpt-4
-Versionen 1106-Vorschau und 0125-Vorschau, die auf „Kein Autoupgrade“ festgelegt sind, werden nicht aktualisiert und werden nicht mehr ausgeführt, wenn die Vorschauversion in der Region aktualisiert wird.
Modell-ID | Maximale Anforderung (Token) | Trainingsdaten (bis) |
---|---|---|
gpt-4 (0314) |
8\.192 | September 2021 |
gpt-4-32k (0314) |
32,768 | September 2021 |
gpt-4 (0613) |
8\.192 | September 2021 |
gpt-4-32k (0613) |
32,768 | September 2021 |
gpt-4 (1106-Vorschau)1GPT-4 Turbo-Preview |
Eingabe: 128.000 Ausgabe: 4.096 |
Apr 2023 |
gpt-4 (0125-Vorschau)1GPT-4 Turbo-Preview |
Eingabe: 128.000 Ausgabe: 4.096 |
Dez. 2023 |
gpt-4 (vision-preview)2GPT-4 Turbo mit Vision-Vorschau |
Eingabe: 128.000 Ausgabe: 4.096 |
Apr 2023 |
1 GPT-4 Turbo Preview = gpt-4
(0125-Vorschau) oder gpt-4
(1106-Vorschau). Um dieses Modell bereitzustellen, wählen Sie unter Bereitstellungen das Modell gpt-4 aus. Wählen Sie unter Version (0125-Vorschau) oder (1106-Vorschau).
2 GPT-4 Turbo mit Vision-Vorschau = gpt-4
(vision-preview). Um dieses Modell bereitzustellen, wählen Sie unter Bereitstellungen das Modell gpt-4 aus. Wählen Sie als Modellversion die Option vision-preview aus.
Achtung
Es wird nicht empfohlen, Vorschaumodelle in der Produktion zu verwenden. Wir aktualisieren alle Bereitstellungen von Vorschaumodellen auf zukünftige Vorschauversionen und eine stabile Version. Modelle, die als Vorschau bezeichnet wurden, entsprechen nicht dem standardmäßigen Azure OpenAI-Modelllebenszyklus.
Hinweis
Regionen, in denen GPT-4 (0314) und (0613) als verfügbar aufgeführt ist, haben Zugriff auf die 8K- und 32K-Versionen des Modells.
GPT-4 and GPT-4 Turbo-Preview Modellverfügbarkeit
Öffentliche Cloudregionen
Region |
gpt-4 , 0613 |
gpt-4 , 1106-Preview |
gpt-4 , 0125-Preview |
gpt-4 , vision-preview |
gpt-4-32k , 0613 |
---|---|---|---|---|---|
australiaeast | ✅ | ✅ | - | ✅ | ✅ |
canadaeast | ✅ | ✅ | - | - | ✅ |
eastus | - | - | ✅ | - | - |
eastus2 | - | ✅ | - | - | - |
francecentral | ✅ | ✅ | - | - | ✅ |
japaneast | - | - | - | ✅ | - |
northcentralus | - | - | ✅ | - | - |
norwayeast | - | ✅ | - | - | - |
southcentralus | - | - | ✅ | - | - |
southindia | - | ✅ | - | - | - |
swedencentral | ✅ | ✅ | - | ✅ | ✅ |
switzerlandnorth | ✅ | - | - | ✅ | ✅ |
uksouth | - | ✅ | - | - | - |
westus | - | ✅ | - | ✅ | - |
Kundenzugriff auswählen
Zusätzlich zu den oben genannten Regionen, die allen Azure OpenAI-Kunden zur Verfügung stehen, wurden einigen ausgewählten bereits bestehenden Kunden in zusätzlichen Regionen Zugriff auf Versionen von GPT-4 gewährt:
Modell | Region |
---|---|
gpt-4 (0314) |
East US Frankreich, Mitte USA Süd Mitte UK, Süden |
gpt-4 (0613) |
East US USA (Ost) 2 Japan, Osten UK, Süden |
Azure Government-Regionen
Die folgenden GPT-4-Modelle sind in Azure Government verfügbar:
Modell-ID | Modellverfügbarkeit |
---|---|
gpt-4 (1106-Vorschau) |
US Government, Virginia US Gov Arizona |
GPT-3.5-Modelle
Wichtig
Das NEUE Modell gpt-35-turbo (0125)
bietet verschiedene Verbesserungen, darunter eine höhere Genauigkeit bei der Reaktion auf angeforderte Formate und ein Fix für einen Fehler, der zu einem Textcodierungsproblem bei nicht englischsprachigen Funktionsaufrufen führte.
GPT-3.5 Turbo wird mit der Chatvervollständigungs-API verwendet. GPT-3.5 Turbo Version 0301 kann auch mit der Vervollständigungs-API verwendet werden. GPT-3.5 Turbo-Versionen 0613 und 1106 unterstützen nur die Chat-Abschluss-API.
GPT-3.5 Turbo Version 0301 ist die erste Version des veröffentlichten Modells. Version 0613 ist die zweite Version des Modells und fügt Unterstützung für Funktionsaufrufe hinzu.
In Modellversionen erfahren Sie, wie Azure OpenAI Service Modellversionsupgrades verarbeitet, und Arbeiten mit Modellen, um zu erfahren, wie Sie die Modellversionseinstellungen Ihrer GPT-3.5 Turbo-Bereitstellungen anzeigen und konfigurieren.
Hinweis
Version 0613
von gpt-35-turbo
und gpt-35-turbo-16k
wird nicht vor dem 13. Juli 2024 eingestellt. Version 0301
von gpt-35-turbo
wird nicht vor dem 13. Juli 2024 eingestellt. Informationen zum Modellupgradeverhalten finden Sie unter Modellupdates.
Modell-ID | Maximale Anforderung (Token) | Trainingsdaten (bis) |
---|---|---|
gpt-35-turbo 1 (0301) |
4\.096 | September 2021 |
gpt-35-turbo (0613) |
4\.096 | September 2021 |
gpt-35-turbo-16k (0613) |
16.384 | September 2021 |
gpt-35-turbo-instruct (0914) |
4.097 | September 2021 |
gpt-35-turbo (1106) |
Eingabe: 16.385 Ausgabe: 4.096 |
September 2021 |
gpt-35-turbo (0125) NEU |
16.385 | September 2021 |
GPT-3.5-Turbo-Modellverfügbarkeit
Öffentliche Cloudregionen
Region |
gpt-35-turbo , 0301 |
gpt-35-turbo , 0613 |
gpt-35-turbo , 1106 |
gpt-35-turbo , 0125 |
gpt-35-turbo-16k , 0613 |
gpt-35-turbo-instruct , 0914 |
---|---|---|---|---|---|---|
australiaeast | - | ✅ | ✅ | - | ✅ | - |
canadaeast | - | ✅ | ✅ | ✅ | ✅ | - |
eastus | ✅ | ✅ | - | - | ✅ | ✅ |
eastus2 | - | ✅ | - | - | ✅ | - |
francecentral | ✅ | ✅ | ✅ | - | ✅ | - |
japaneast | - | ✅ | - | - | ✅ | - |
northcentralus | - | ✅ | - | ✅ | ✅ | - |
southcentralus | ✅ | - | - | ✅ | - | - |
southindia | - | - | ✅ | - | - | - |
swedencentral | - | ✅ | ✅ | - | ✅ | ✅ |
switzerlandnorth | - | ✅ | - | - | ✅ | - |
uksouth | ✅ | ✅ | ✅ | - | ✅ | - |
westeurope | ✅ | - | - | - | - | - |
westus | - | - | ✅ | - | - | - |
1 Dieses Modell akzeptiert Anforderungen von mehr als 4.096 Token. Es wird nicht empfohlen, den Grenzwert von 4.096 Eingabetoken zu überschreiten, da die neuere Version des Modells auf 4.096 Token begrenzt ist. Wenn bei diesem Modell 4.096 Eingabetoken überschritten werden und Probleme auftreten, ist zu beachten, dass diese Konfiguration nicht offiziell unterstützt wird.
Azure Government-Regionen
Die folgenden GPT-3.5-Turbomodelle sind in Azure Government verfügbar:
Modell-ID | Modellverfügbarkeit |
---|---|
gpt-35-turbo (1106-Vorschau) |
US Government, Virginia |
Einbettungsmodelle
Diese Modelle können mit einbetteten API-Anforderungen verwendet werden.
Hinweis
text-embedding-3-large
ist das neueste und leistungsfähigste Einbettungsmodell. Das Upgrade zwischen Einbettungsmodellen ist nicht möglich. Für die Migration von text-embedding-ada-002
zu text-embedding-3-large
müssen Sie neue Einbettungen generieren.
Modell-ID | Maximale Anforderung (Token) | Ausgabedimensionen | Trainingsdaten (bis) |
---|---|---|---|
text-embedding-ada-002 (Version 2) |
8.191 | 1\.536 | September 2021 |
text-embedding-ada-002 (Version 1) |
2.046 | 1\.536 | September 2021 |
text-embedding-3-large |
8.191 | 3\.072 | September 2021 |
text-embedding-3-small |
8.191 | 1\.536 | September 2021 |
Hinweis
Wenn ein Array von Eingaben für die Einbettung gesendet wird, können pro Aufruf des Einbettungsendpunkts maximal 2.048 Eingabeelemente im Array verwendet werden.
Öffentliche Cloudregionen
Region |
text-embedding-ada-002 , 1 |
text-embedding-ada-002 , 2 |
text-embedding-3-small , 1 |
text-embedding-3-large , 1 |
---|---|---|---|---|
australiaeast | - | ✅ | - | - |
brazilsouth | - | ✅ | - | - |
canadaeast | - | ✅ | ✅ | ✅ |
eastus | ✅ | ✅ | ✅ | ✅ |
eastus2 | - | ✅ | ✅ | ✅ |
francecentral | - | ✅ | - | - |
japaneast | - | ✅ | - | - |
northcentralus | - | ✅ | - | - |
norwayeast | - | ✅ | - | - |
southafricanorth | - | ✅ | - | - |
southcentralus | ✅ | ✅ | - | - |
southindia | - | ✅ | - | - |
swedencentral | - | ✅ | - | - |
switzerlandnorth | - | ✅ | - | - |
uksouth | - | ✅ | - | - |
westeurope | - | ✅ | - | - |
westus | - | ✅ | - | - |
westus3 | - | ✅ | - | - |
Azure Government-Regionen
Die folgenden Einbettungsmodelle sind in Azure Government verfügbar:
Modell-ID | Modellverfügbarkeit |
---|---|
text-embedding-ada-002 (Version 2) |
US Government, Virginia US Gov Arizona |
DALL-E-Modelle
Modell-ID | Verfügbarkeit von Funktionen | Max. Anforderung (Zeichen) |
---|---|---|
dalle2 (Vorschau) | East US | 1.000 |
dall-e-3 | „USA, Osten“, „Australien, Osten“, „Schweden, Mitte“ | 4\.000 |
Optimierung von Modellen
babbage-002
und davinci-002
sind nicht trainiert, Anweisungen zu befolgen. Das Abfragen dieser Basismodelle sollte nur als Referenzpunkt für eine fein abgestimmte Version dienen, um den Fortschritt Ihres Trainings zu bewerten.
gpt-35-turbo-0613
– Die Feinabstimmung dieses Modells ist auf eine Teilmenge von Regionen beschränkt und ist nicht in allen Regionen, in denen das Basismodell verfügbar ist, verfügbar.
Modell-ID | Regionen mit Feinabstimmung | Maximale Anforderung (Token) | Trainingsdaten (bis) |
---|---|---|---|
babbage-002 |
USA Nord Mitte Schweden, Mitte |
16.384 | September 2021 |
davinci-002 |
USA Nord Mitte Schweden, Mitte |
16.384 | September 2021 |
gpt-35-turbo (0613) |
USA (Ost 2) USA Nord Mitte Schweden, Mitte |
4\.096 | September 2021 |
gpt-35-turbo (1106) |
USA (Ost 2) USA Nord Mitte Schweden, Mitte |
Eingabe: 16.385 Ausgabe: 4.096 |
September 2021 |
gpt-35-turbo (0125) |
USA (Ost 2) USA Nord Mitte Schweden, Mitte |
16.385 | September 2021 |
Whisper-Modelle
Modell-ID | Modellverfügbarkeit | Maximale Anforderung (Größe der Audiodatei) |
---|---|---|
whisper |
USA (Ost) 2 USA Nord Mitte Norwegen, Osten Indien (Süden) Schweden, Mitte Europa, Westen |
25 MB |
Sprachsynthesemodelle (Vorschau)
Modell-ID | Modellverfügbarkeit |
---|---|
tts-1 |
USA Nord Mitte Schweden, Mitte |
tts-1-hd |
USA Nord Mitte Schweden, Mitte |
Assistants (Vorschau)
Für Assistants benötigen Sie eine Kombination aus einem unterstützten Modell und einer unterstützten Region. Für bestimmte Tools und Funktionen sind die neuesten Modelle erforderlich. Die folgenden Modelle sind in der Assistants-API, SDK, Azure KI Studio und Azure OpenAI Studio verfügbar. Die folgende Tabelle ist für die nutzungsbasierte Bezahlung. Informationen zur Verfügbarkeit der bereitgestellten Durchsatzeinheit (PTU) finden Sie unter bereitgestellten Durchsatz.
Region | gpt-35-turbo (0613) |
gpt-35-turbo (1106) |
gpt-4 (0613) |
gpt-4 (1106) |
gpt-4 (0125) |
---|---|---|---|---|---|
Australien (Osten) | ✅ | ✅ | ✅ | ✅ | |
East US | ✅ | ✅ | |||
USA (Ost) 2 | ✅ | ✅ | ✅ | ||
Frankreich, Mitte | ✅ | ✅ | ✅ | ✅ | |
Norwegen, Osten | ✅ | ||||
Schweden, Mitte | ✅ | ✅ | ✅ | ✅ | |
UK, Süden | ✅ | ✅ | ✅ | ✅ |