Azure OpenAI Service-Modelle

Azure OpenAI Service basiert auf einer Vielzahl von Modellen mit unterschiedlichen Funktionen und Preispunkten. Die Verfügbarkeit der Modelle variiert je nach Region. Informationen zu GPT-3 und anderen Modellen, die im Juli 2024 eingestellt werden, finden Sie unter Legacymodelle von Azure OpenAI Service.

Modelle BESCHREIBUNG
GPT-4 Eine Reihe von Modellen, die GPT-3.5 verbessern und natürliche Sprache sowie Code verstehen und generieren können.
GPT-3.5 Eine Reihe von Modellen, die GPT-3 verbessern und natürliche Sprache sowie Code verstehen und generieren können.
Einbettungen Eine Reihe von Modellen, die Text in numerische Vektorform konvertieren können, um die Textähnlichkeit zu erleichtern.
DALL-E (Vorschau) Eine Reihe von Modellen in der Vorschau, die Originalbilder aus natürlicher Sprache generieren können.
Whisper (Vorschau) Eine Reihe von Modellen in der Vorschau, die Sprache transkribieren und in Text übersetzen können.
Sprachsynthese (Vorschau) Eine Reihe von Modellen in der Vorschau, die Text in Sprache synthetisieren können.

GPT-4 and GPT-4 Turbo-Preview

GPT-4 kann schwierige Probleme mit größerer Genauigkeit lösen als jedes der vorherigen OpenAI-Modelle. GPT-4 ist genau wie GPT-3.5-Turbo für Chats optimiert und funktioniert auch gut für herkömmliche Vervollständigungsaufgaben. Verwenden Sie die Chatvervollständigungs-API, um GPT-4 zu verwenden. Weitere Informationen zu GPT-4 und zur Chatvervollständigungs-API finden Sie in unserer ausführlichen Anleitung.

  • gpt-4
  • gpt-4-32k
  • gpt-4-vision

Sie können die Tokenkontextlänge, die von jedem Modell unterstützt wird, in der Modellzusammenfassungstabelle sehen.

GPT-3.5

GPT-3.5-Modelle können natürliche Sprache oder Code verstehen und generieren. Das leistungsfähigste und kostengünstigste Modell in der GPT-3.5-Familie ist GPT-3.5 Turbo, das für den Chat optimiert wurde und auch für herkömmliche Vervollständigungsaufgaben gut geeignet ist. GPT-3.5 Turbo ist für die Verwendung mit der Chatvervollständigungs-API verfügbar. GPT-3.5 Turbo Instruct verfügt über ähnliche Funktionen wie text-davinci-003 und nutzt die Vervollständigungs-API anstelle der Chatvervollständigungs-API. Es wird empfohlen, GPT-3.5 Turbo und GPT-3.5 Turbo Instruct anstatt der älteren GPT-3.5- und GPT-3.5-Modelle zu verwenden.

  • gpt-35-turbo
  • gpt-35-turbo-16k
  • gpt-35-turbo-instruct

Sie können die Tokenkontextlänge, die von jedem Modell unterstützt wird, in der Modellzusammenfassungstabelle sehen.

Weitere Informationen zu GPT-3.5 Turbo und zur Chatvervollständigungs-API finden Sie in unserer ausführlichen Anleitung.

Einbettungen

Wichtig

Es wird dringend empfohlen, text-embedding-ada-002 (Version 2) zu verwenden. Diese/s Modell/Version bietet Parität mit text-embedding-ada-002 von OpenAI. Weitere Informationen zu den Verbesserungen, die dieses Modell bietet, finden Sie in dem Blogbeitrag von OpenAI. Auch wenn Sie derzeit Version 1 verwenden, sollten Sie zu Version 2 migrieren, um die neuesten Gewichtungen/aktualisierten Tokenlimits zu nutzen. Version 1 und Version 2 sind nicht austauschbar, sodass die Einbettung von Dokumenten und die Dokumentsuche mit derselben Version des Modells erfolgen müssen.

Die vorherigen Einbettungsmodelle wurden in das folgende neue Modell konsolidiert, das diese Modelle ersetzt:

text-embedding-ada-002

DALL-E (Vorschau)

Die DALL-E-Modelle, die sich derzeit in der Vorschau befinden, generieren Bilder aus Textaufforderungen, die der Benutzer bereitstellt.

Whisper (Vorschau)

Die Whisper-Modelle, die sich derzeit in der Vorschau befinden, können für die Spracherkennung verwendet werden.

Sie können das Whisper-Modell auch über die API Batch-Transkription von Azure AI Speech verwenden. Im Artikel Was ist das Whisper-Modell? erfahren Sie mehr darüber, wann Azure KI Speech bzw. wann Azure OpenAI Service verwendet werden sollte.

Sprachsynthese (Vorschau)

Der OpenAI-Sprachsynthesemodelle, die sich derzeit in der Vorschau befinden, können verwendet werden, um Text in Sprache zu synthetisieren.

Sie können den OpenAI-Stimmen für die Sprachsynthese über Azure KI Speech verwenden. Weitere Informationen finden Sie im Leitfaden OpenAI-Stimmen für die Sprachsynthese über Azure OpenAI Service oder über Azure KI Speech.

Tabelle mit Modellzusammenfassung und Regionsverfügbarkeit

GPT-4 and GPT-4 Turbo-Previewmodelle

GPT-4, GPT-4-32k und GPT-4 Turbo mit Vision sind jetzt für alle Azure OpenAI Service-Kund*innen verfügbar. Die Verfügbarkeit variiert nach Region. Wenn Sie GPT-4 in Ihrer Region nicht sehen, schauen Sie bitte später noch einmal nach.

Diese Modelle können nur mit der Chatvervollständigungs-API verwendet werden.

GPT-4 Version 0314, ist die erste Version des veröffentlichten Modells. Version 0613 ist die zweite Version des Modells und fügt Unterstützung für Funktionsaufrufe hinzu.

In Modellversionen erfahren Sie, wie Azure OpenAI Service Modellversionsupgrades verarbeitet, und Arbeiten mit Modellen, um zu erfahren, wie Sie die Modellversionseinstellungen Ihrer GPT-4-Bereitstellungen anzeigen und konfigurieren.

Hinweis

Version 0314 von gpt-4 und gpt-4-32k wird nicht vor dem 5. Juli 2024 eingestellt. Version 0613 von gpt-4 und gpt-4-32k wird nicht vor dem 30. September 2024 eingestellt. Informationen zum Modellupgradeverhalten finden Sie unter Modellupdates.

GPT-4 Version 0125-preview ist eine aktualisierte Version der GPT-4 Turbo Preview, die zuvor als Version 1106-preview veröffentlicht wurde. GPT-4 Version 0125-preview erledigt Aufgaben wie die Codegenerierung vollständiger als die Version gpt-4-1106-preview. Je nach Aufgabe stellen Kund*innen möglicherweise fest, dass GPT-4-0125-preview im Vergleich zur gpt-4-1106-preview mehr Ausgaben generiert. Wir empfehlen Kund*innen, die Ausgaben des neuen Modells zu vergleichen. GPT-4-0125-preview behebt auch Fehler von gpt-4-1106-preview mit UTF-8-Behandlung für nicht englische Sprachen.

Wichtig

  • gpt-4 Version 0125-preview ersetzt Version 1106-preview. Bereitstellungen der gpt-4 Version 1106-preview, die auf „Automatisch auf Standard aktualisieren“ und „Upgrade nach Ablauf“ festgelegt sind, beginnen am 20. Februar 2024 mit der Aktualisierung und beenden diese innerhalb von 2 Wochen. Bereitstellungen der gpt-4 Version 1106-Vorschau, die auf „Nicht automatisch aktualisieren“ festgelegt sind, funktionieren ab dem 20. Februar 2024 nicht mehr. Wenn Sie über eine Bereitstellung der gpt-4 Version 1106-preview verfügen, können Sie die Version 0125-preview in den unten verfügbaren Regionen testen.
Modell-ID Maximale Anforderung (Token) Trainingsdaten (bis)
gpt-4 (0314) 8\.192 September 2021
gpt-4-32k(0314) 32,768 September 2021
gpt-4 (0613) 8\.192 September 2021
gpt-4-32k (0613) 32,768 September 2021
gpt-4 (1106-preview)1
GPT-4 Turbo-Preview
Eingabe: 128.000
Ausgabe: 4.096
Apr 2023
gpt-4 (0125-preview)1
GPT-4 Turbo-Preview
Eingabe: 128.000
Ausgabe: 4.096
Apr 2023
gpt-4 (vision-preview)2
GPT-4 Turbo mit Vision-Vorschau
Eingabe: 128.000
Ausgabe: 4.096
Apr 2023

1 GPT-4 Turbo Preview = gpt-4 (0125-preview). Um dieses Modell bereitzustellen, wählen Sie unter Bereitstellungen das Modell gpt-4 aus. Für die Modellversion wählen Sie 0125-preview aus.

2 GPT-4 Turbo mit Vision-Vorschau = gpt-4 (vision-preview). Um dieses Modell bereitzustellen, wählen Sie unter Bereitstellungen das Modell gpt-4 aus. Wählen Sie als Modellversion die Option vision-preview aus.

Achtung

Es wird nicht empfohlen, Vorschaumodelle in der Produktion zu verwenden. Wir aktualisieren alle Bereitstellungen von Vorschaumodellen auf zukünftige Vorschauversionen und eine stabile Version. Modelle, die als Vorschau bezeichnet wurden, entsprechen nicht dem standardmäßigen Azure OpenAI-Modelllebenszyklus.

Hinweis

Regionen, in denen GPT-4 (0314) und (0613) als verfügbar aufgeführt ist, haben Zugriff auf die 8K- und 32K-Versionen des Modells.

GPT-4 and GPT-4 Turbo-Preview Modellverfügbarkeit

Öffentliche Cloudregionen

Modell Regionen, in denen das Modell für alle Abonnements mit Azure OpenAI-Zugriff verfügbar ist Regionen, in denen das Modell nur für Abonnements mit vorherigem Zugriff auf dieses Modell/diese Region verfügbar ist
GPT-4 (0314) East US
Frankreich, Mitte
USA Süd Mitte
UK, Süden
GPT-4 (0613) Australien (Osten)
Kanada, Osten
Frankreich, Mitte
Schweden, Mitte
Schweiz, Norden
East US
USA (Ost) 2
Japan, Osten
Vereinigtes Königreich, Süden
gpt-4 (1106-preview) Australien (Osten)
Kanada, Osten
USA (Ost) 2
Frankreich, Mitte
Norwegen, Osten
Indien (Süden)
Schweden, Mitte
UK, Süden
USA (Westen)
gpt-4 (0125-preview) East US
USA Nord Mitte
USA Süd Mitte
gpt-4 (vision-preview) Schweden, Mitte
USA (Westen)
Japan, Osten
Schweiz, Norden
Australien (Osten)

Azure Government-Regionen

Die folgenden GPT-4-Modelle sind in Azure Government verfügbar:

Modell-ID Modellverfügbarkeit
gpt-4 (1106-preview) US Government, Virginia
US Gov Arizona

GPT-3.5-Modelle

GPT-3.5 Turbo wird mit der Chatvervollständigungs-API verwendet. GPT-3.5 Turbo Version 0301 kann auch mit der Vervollständigungs-API verwendet werden. GPT-3.5 Turbo-Versionen 0613 und 1106 unterstützen nur die Chat-Abschluss-API.

GPT-3.5 Turbo Version 0301 ist die erste Version des veröffentlichten Modells. Version 0613 ist die zweite Version des Modells und fügt Unterstützung für Funktionsaufrufe hinzu.

In Modellversionen erfahren Sie, wie Azure OpenAI Service Modellversionsupgrades verarbeitet, und Arbeiten mit Modellen, um zu erfahren, wie Sie die Modellversionseinstellungen Ihrer GPT-3.5 Turbo-Bereitstellungen anzeigen und konfigurieren.

Hinweis

Version 0613 von gpt-35-turbo und gpt-35-turbo-16k wird nicht vor dem 13. Juni 2024 eingestellt. Version 0301 von gpt-35-turbo wird nicht vor dem 5. Juli 2024 eingestellt. Informationen zum Modellupgradeverhalten finden Sie unter Modellupdates.

GPT-3.5-Turbo-Modellverfügbarkeit

Öffentliche Cloudregionen

Modell-ID Modellverfügbarkeit Maximale Anforderung (Token) Trainingsdaten (bis)
gpt-35-turbo1 (0301) East US
Frankreich, Mitte
USA Süd Mitte
UK, Süden
Europa, Westen
4\.096 September 2021
gpt-35-turbo (0613) Australien (Osten)
Kanada, Osten
East US
USA (Ost) 2
Frankreich, Mitte
Japan, Osten
USA Nord Mitte
Schweden, Mitte
Schweiz, Norden
UK, Süden
4\.096 September 2021
gpt-35-turbo-16k (0613) Australien (Osten)
Kanada, Osten
East US
USA (Ost) 2
Frankreich, Mitte
Japan, Osten
USA Nord Mitte
Schweden, Mitte
Schweiz, Norden
UK, Süden
16.384 September 2021
gpt-35-turbo-instruct (0914) East US
Schweden, Mitte
4.097 September 2021
gpt-35-turbo (1106) Australien (Osten)
Kanada, Osten
Frankreich, Mitte
Indien (Süden)
Schweden, Mitte
UK, Süden
USA (Westen)
Eingabe: 16.385
Ausgabe: 4.096
September 2021

1 Dieses Modell akzeptiert Anforderungen von mehr als 4.096 Token. Es wird nicht empfohlen, den Grenzwert von 4.096 Eingabetoken zu überschreiten, da die neuere Version des Modells auf 4.096 Token begrenzt ist. Wenn bei diesem Modell 4.096 Eingabetoken überschritten werden und Probleme auftreten, ist zu beachten, dass diese Konfiguration nicht offiziell unterstützt wird.

Einbettungsmodelle

Diese Modelle können mit einbetteten API-Anforderungen verwendet werden.

Hinweis

Es wird dringend empfohlen, text-embedding-ada-002 (Version 2) zu verwenden. Diese/s Modell/Version bietet Parität mit text-embedding-ada-002 von OpenAI. Weitere Informationen zu den Verbesserungen, die dieses Modell bietet, finden Sie in dem Blogbeitrag von OpenAI. Auch wenn Sie derzeit Version 1 verwenden, sollten Sie zu Version 2 migrieren, um die neuesten Gewichtungen/aktualisierten Tokenlimits zu nutzen. Version 1 und Version 2 sind nicht austauschbar, sodass die Einbettung von Dokumenten und die Dokumentsuche mit derselben Version des Modells erfolgen müssen.

Modell-ID Modellverfügbarkeit Maximale Anforderung (Token) Trainingsdaten (bis) Ausgabedimensionen
text-embedding-ada-002 (Version 2) Australien (Osten)
Kanada, Osten
East US
USA (Ost 2)
Frankreich, Mitte
Japan, Osten
USA Nord Mitte
Norwegen, Osten
USA Süd Mitte
Schweden, Mitte
Schweiz, Norden
UK, Süden
Europa, Westen
USA (Westen)
8.191 September 2021 1\.536
text-embedding-ada-002 (Version 1) East US
USA Süd Mitte
Europa, Westen
2.046 September 2021 1\.536

Hinweis

Wenn ein Array von Eingaben für die Einbettung gesendet wird, können pro Aufruf des Einbettungsendpunkts maximal 2.048 Eingabeelemente im Array verwendet werden.

Azure Government-Regionen

Die folgenden Einbettungsmodelle sind in Azure Government verfügbar:

Modell-ID Modellverfügbarkeit
text-embedding-ada-002 (Version 2) US Government, Virginia
US Gov Arizona

DALL-E-Modelle (Vorschau)

Modell-ID Verfügbarkeit von Funktionen Max. Anforderung (Zeichen)
dalle2 East US 1.000
dalle3 Schweden, Mitte 4\.000

Optimierung von Modellen

babbage-002 und davinci-002 sind nicht trainiert, Anweisungen zu befolgen. Das Abfragen dieser Basismodelle sollte nur als Referenzpunkt für eine fein abgestimmte Version dienen, um den Fortschritt Ihres Trainings zu bewerten.

gpt-35-turbo-0613 – Die Feinabstimmung dieses Modells ist auf eine Teilmenge von Regionen beschränkt und ist nicht in allen Regionen, in denen das Basismodell verfügbar ist, verfügbar.

Modell-ID Regionen mit Feinabstimmung Maximale Anforderung (Token) Trainingsdaten (bis)
babbage-002 USA Nord Mitte
Schweden, Mitte
16.384 September 2021
davinci-002 USA Nord Mitte
Schweden, Mitte
16.384 September 2021
gpt-35-turbo (0613) USA Nord Mitte
Schweden, Mitte
4\.096 September 2021
gpt-35-turbo (1106) USA Nord Mitte
Schweden, Mitte
Eingabe: 16.385
Ausgabe: 4.096
September 2021

Whisper-Modelle (Vorschau)

Modell-ID Modellverfügbarkeit Maximale Anforderung (Größe der Audiodatei)
whisper USA Nord Mitte
Europa, Westen
25 MB

Sprachsynthesemodelle (Vorschau)

Modell-ID Modellverfügbarkeit
tts-1 USA Nord Mitte
Schweden, Mitte
tts-1-hd USA Nord Mitte
Schweden, Mitte

Assistants (Vorschau)

Für Assistants benötigen Sie eine Kombination aus einem unterstützten Modell und einer unterstützten Region. Für bestimmte Tools und Funktionen sind die neuesten Modelle erforderlich. Für parallele Funktionsaufrufe sind beispielsweise die neuesten 1106 Modelle erforderlich.

Region gpt-35-turbo (0613) gpt-35-turbo (1106) gpt-4 (0613) gpt-4 (1106)
Australien (Osten)
USA (Ost) 2
Schweden, Mitte

Nächste Schritte