Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Azure OpenAI Service basiert auf einer Vielzahl von Modellen mit unterschiedlichen Funktionen und Preispunkten. Die Modellverfügbarkeit variiert je nach Region und Cloud. Die Verfügbarkeit des Azure Government-Modells finden Sie im Azure Government OpenAI-Dienst.
Modelle | Beschreibung |
---|---|
GPT-4.1-Serie | Neueste Modellversion von Azure OpenAI |
Computerverwendungsvorschau | Ein experimentelles Modell, das für die Verwendung mit dem Computerverwendungstool Antworten-API trainiert wurde. |
GPT-4.5 Preview | Das neueste GPT-Modell, das sich für verschiedene Text- und Bildaufgaben eignet. |
O-Serienmodelle | Reasoning-Modelle mit erweiterter Problemlösung und verbessertem Fokus und Funktionsumfang. |
GPT-4o und GPT-4o mini und GPT-4 Turbo | Die neuesten und leistungsstärksten Azure OpenAI-Modelle mit multimodalen Versionen, die sowohl Text als auch Bilder als Eingabe akzeptieren. |
GPT-4 | Eine Reihe von Modellen, die GPT-3.5 verbessern und natürliche Sprache sowie Code verstehen und generieren können. |
GPT-3.5 | Eine Reihe von Modellen, die GPT-3 verbessern und natürliche Sprache sowie Code verstehen und generieren können. |
Einbettungen | Eine Reihe von Modellen, die Text in numerische Vektorform konvertieren können, um die Textähnlichkeit zu erleichtern. |
Bildgenerierung | Eine Reihe von Modellen, die Originalbilder aus natürlicher Sprache generieren können. |
Audio | Eine Reihe von Modellen für Spracherkennung, Übersetzung und Text-zu-Sprache. GPT-4o-Audiomodelle unterstützen entweder Unterhaltungsinteraktionen mit niedriger Latenz, »Spracheingabe, Sprachausgabe« oder die Audiogenerierung. |
GPT 4.1-Serie
Regionale Verfügbarkeit
Modell | Region |
---|---|
gpt-4.1 (2025-04-14) |
Siehe die Tabelle "Modelle". |
gpt-4.1-nano (2025-04-14) |
Siehe die Tabelle "Modelle". |
gpt-4.1-mini (2025-04-14) |
Siehe die Tabelle "Modelle". |
Fähigkeiten
Modell-ID | Beschreibung | Kontextfenster | Max. Ausgabetoken | Trainingsdaten (bis) |
---|---|---|---|---|
gpt-4.1 (2025-04-14) |
- Text- und Bildeingabe - Textausgabe – API für Chatabschlusse – Antwort-API - Streaming - Aufrufen von Funktionen Strukturierte Ausgaben (Chatvervollständigung) |
- 1,047,576 - 128.000 (bereitgestellte verwaltete Bereitstellungen) |
32,768 | 31. Mai 2024 |
gpt-4.1-nano (2025-04-14) Schnellstes 4.1-Modell |
- Text- und Bildeingabe - Textausgabe – API für Chatabschlusse – Antwort-API - Streaming - Aufrufen von Funktionen Strukturierte Ausgaben (Chatvervollständigung) |
1,047,576 | 32,768 | 31. Mai 2024 |
gpt-4.1-mini (2025-04-14) |
- Text- und Bildeingabe - Textausgabe – API für Chatabschlusse – Antwort-API -Streaming - Aufrufen von Funktionen Strukturierte Ausgaben (Chatvervollständigung) |
1,047,576 | 32,768 | 31. Mai 2024 |
computer-use-preview
Ein experimentelles Modell, das für die Verwendung mit der Responses API als Computerwerkzeug trainiert wurde. Es kann in Verbindung mit Drittanbieterbibliotheken verwendet werden, um dem Modell die Steuerung von Maus- und Tastatureingaben zu ermöglichen, während Kontext aus Screenshots der aktuellen Umgebung abgerufen wird.
Achtung
Es wird nicht empfohlen, Vorschaumodelle in der Produktion zu verwenden. Wir werden alle Bereitstellungen von Vorschaumodellen entweder auf zukünftige Vorschauversionen oder auf die neueste stabile/GA-Version aktualisieren. Modelle, die als Vorschau bezeichnet wurden, entsprechen nicht dem standardmäßigen Azure OpenAI-Modelllebenszyklus.
Verfügbarkeit
Für den Zugriff auf die computer-use-preview
Registrierung ist erforderlich, und der Zugriff wird basierend auf den Berechtigungskriterien von Microsoft gewährt. Kunden, die Zugriff auf andere Modelle mit eingeschränktem Zugriff haben, müssen weiterhin Zugriff für dieses Modell anfordern.
Anfordern des Zugriffs: computer-use-preview
Anwendung mit eingeschränktem Zugriffsmodell
Nachdem der Zugriff gewährt wurde, müssen Sie eine Bereitstellung für das Modell erstellen.
Regionale Verfügbarkeit
Modell | Region |
---|---|
computer-use-preview |
Siehe die Tabelle "Modelle". |
Fähigkeiten
Modell-ID | Beschreibung | Kontextfenster | Max. Ausgabetoken | Trainingsdaten (bis) |
---|---|---|---|---|
computer-use-preview (2025-03-11) |
Spezialmodell zur Verwendung mit dem Computerverwendungstool Antworten-API -Werkzeuge – Streaming -Text(Eingabe/Ausgabe) - Bild(Eingabe) |
8.192 | 1,024 | Oktober 2023 |
GPT-4.5 Preview
Regionale Verfügbarkeit
Modell | Region |
---|---|
gpt-4.5-preview |
Siehe die Tabelle "Modelle". |
Fähigkeiten
Modell-ID | Beschreibung | Kontextfenster | Max. Ausgabetoken | Trainingsdaten (bis) |
---|---|---|---|---|
gpt-4.5-preview (2025-02-27) GPT-4.5 Preview |
GPT 4.1 ist der empfohlene Ersatz für dieses Modell. Hervorragende Leistung bei sehr unterschiedlichen Text- und Bildaufgaben -Strukturierte Ausgaben – Promptzwischenspeicherung -Werkzeuge – Streaming -Text(Eingabe/Ausgabe) - Bild(Eingabe) |
128.000 | 16.384 | Oktober 2023 |
Hinweis
Es wird erwartet, dass das Modell keine Fragen zu sich selbst beantworten kann. Wenn Sie den Wissensstichtag für die Trainingsdaten des Modells oder andere Details über das Modell erfahren möchten, sollten Sie die Modelldokumentation oben lesen.
Modelle der o-Serie
Die Azure OpenAI-Modelle der o*-Serie sind speziell für die Behandlung von Erläuterungen und Problemlösungsaufgaben mit erhöhtem Fokus und mehr Funktionalität konzipiert. Diese Modelle verbringen mehr Zeit damit, die Anforderung eines Benutzers zu verarbeiten und zu verstehen, sodass sie im Vergleich zu früheren Iterationen außergewöhnlich stark in Bereichen wie Wissenschaft, Codierung und Mathematik sind.
Modell-ID | Beschreibung | Maximale Anforderung (Token) | Trainingsdaten (bis) |
---|---|---|---|
o4-mini (2025-04-16) |
- NEUES Denkmodell, das erweiterte Denkfähigkeiten bietet. – API für Chatabschlusse - Antwort-API - Strukturierte Ausgaben – Text, Bildverarbeitung - Funktionen/Tools/Parallele Toolaufrufe Vollständige Zusammenfassung der Funktionen |
Eingabe: 200.000 Ausgabe: 100.000 |
31. Mai 2024 |
o3 (2025-04-16) |
- NEUES Denkmodell, das erweiterte Denkfähigkeiten bietet. – API für Chatabschlusse - Antwort-API - Strukturierte Ausgaben – Text, Bildverarbeitung - Funktionen/Tools/Parallele Toolaufrufe Vollständige Zusammenfassung der Funktionen |
Eingabe: 200.000 Ausgabe: 100.000 |
31. Mai 2024 |
o3-mini (2025-01-31) |
- Erweiterte Vernunftfähigkeiten. - Strukturierte Ausgaben - Nur-Text-Verarbeitung - Funktionen/Tools |
Eingabe: 200.000 Ausgabe: 100.000 |
Oktober 2023 |
o1 (2024-12-17) |
- Erweiterte Vernunftfähigkeiten. - Strukturierte Ausgaben – Text, Bildverarbeitung - Funktionen/Tools |
Eingabe: 200.000 Ausgabe: 100.000 |
Oktober 2023 |
o1-preview (2024-09-12) |
Ältere Vorschauversion | Eingang: 128.000 Ausgabe: 32.768 |
Oktober 2023 |
o1-mini (2024-09-12) |
Eine schnellere und kostengünstigere Option in der o1-Serie, ideal für das Programmieren von Vorgängen, die höhere Geschwindigkeit und geringeren Ressourcenverbrauch erfordern. Die globale Standardbereitstellung ist standardmäßig verfügbar. (Regionale) Standardbereitstellungen sind derzeit nur für ausgewählte Kunden verfügbar, die im Rahmen des Releases o1-preview eingeschränkten Zugriff erhalten haben. |
Eingang: 128.000 Ausgabe: 65.536 |
Oktober 2023 |
Verfügbarkeit
Weitere Informationen zu den erweiterten o-series
Modellen finden Sie in den ersten Schritten mit Denkmodellen.
Regionale Verfügbarkeit
Modell | Region |
---|---|
o4-mini |
Siehe die Tabelle "Modelle". |
o3 |
Siehe die Tabelle "Modelle". |
o3-mini |
Siehe die Tabelle "Modelle". |
o1 |
Siehe die Tabelle "Modelle". |
o1-preview |
Siehe die Tabelle "Modelle". Dieses Modell ist nur für Kunden verfügbar, denen der Zugriff im Rahmen des ursprünglichen eingeschränkten Zugriffs gewährt wurde. |
o1-mini |
Siehe die Tabelle "Modelle". |
GPT-4o und GPT-4 Turbo
GPT-4o integriert Text und Bilder in einem einzelnen Modell, sodass mehrere Datentypen gleichzeitig verarbeitet werden können. Dieser multimodale Ansatz verbessert die Genauigkeit und Reaktionsfähigkeit bei Interaktionen zwischen Mensch und Computer. GPT-4o entspricht GPT-4 Turbo bei Text- und Codierungsaufgaben in englischer Sprache und bietet eine überlegene Leistung in anderen Sprachen und Visionsaufgaben, wobei neue Benchmarks für KI-Funktionen erreicht werden.
Wie greife ich auf die Modelle „GPT-4o2“ und „GPT-4o mini“ zu?
GPT-4o und GPT-4o mini sind für die Bereitstellung von Standard und Global-Standardmodellen verfügbar.
Sie müssen eine vorhandene Ressource in einer unterstützten Standard- oder globalen Standardregionerstellen oder verwenden, in der das Modell verfügbar ist.
Wenn Ihre Ressource erstellt wird, können Sie die GPT-4o-Modelle bereitstellen . Wenn Sie eine programmgesteuerte Bereitstellung durchführen, sind die Modellnamen :
gpt-4o
Version2024-11-20
gpt-4o
Version2024-08-06
gpt-4o
Version2024-05-13
gpt-4o-mini
Version2024-07-18
GPT-4 Turbo
GPT-4 Turbo ist ein großes multimodales Modell, das Text- oder Bildeingaben akzeptiert und Text generiert sowie schwierige Probleme mit höherer Genauigkeit als alle früheren Modelle von OpenAI lösen kann. Wie GPT-3.5 Turbo und ältere GPT-4-Modelle ist GPT-4 Turbo für Chats optimiert und eignet sich gut für gängige Vervollständigungsaufgaben.
Das neueste GA-Release (Allgemeine Verfügbarkeit) von GPT-4 Turbo ist:
gpt-4
Version:turbo-2024-04-09
Es ersetzt die folgenden Vorschaumodelle:
gpt-4
Version:1106-Preview
gpt-4
Version:0125-Preview
gpt-4
Version:vision-preview
Unterschiede zwischen den allgemein verfügbaren Modellen OpenAI und Azure OpenAI GPT-4 Turbo
- Die Version des neuesten
0409
Turbo-Modells von OpenAI unterstützt den JSON-Modus und Funktionsaufrufe für alle Rückschlussanforderungen. - Die neueste
turbo-2024-04-09
Version von Azure OpenAI unterstützt derzeit nicht die Verwendung des JSON-Modus und keine Funktionsaufrufe beim Durchführen von Rückschlussanforderungen mit Bildeingaben (Vision). Textbasierte Eingabeanforderungen (Anforderungen ohneimage_url
und Inlinebilder) unterstützen den JSON-Modus und Funktionsaufrufe.
Unterschiede zu gpt-4 vision-preview
- Die Integration von Azure KI-spezifischen Vision-Erweiterungen mit GPT-4 Turbo mit Vision wird nicht unterstützt für
gpt-4
Version:turbo-2024-04-09
. Dazu gehören optische Zeichenerkennung (Optical Character Recognition, OCR), Objektgrounding, Videoprompts und eine verbesserte Verarbeitung Ihrer Daten mit Bildern.
Wichtig
Previewfunktionen für Vision-Verbesserungen, einschließlich optischer Zeichenerkennung (Optical Character Recognition, OCR), Objekterdung und Videovorgaben, werden eingestellt und nicht mehr verfügbar sein, sobald die gpt-4
-Version von vision-preview
auf turbo-2024-04-09
aktualisiert wird. Wenn Sie sich derzeit auf eine dieser Vorschaufunktionen verlassen, wird diese automatische Modellaktualisierung eine kompatibilitätsbrechende Änderung sein.
GPT-4 Turbo bereitgestellte verwaltete Verfügbarkeit
gpt-4
Version:turbo-2024-04-09
ist sowohl für Standardbereitstellungen als auch für spezialisierte Bereitstellungen verfügbar. Derzeit unterstützt die bereitgestellte Version dieses Modells keine Image-/Vision-Rückschlussanforderungen. Bereitgestellte Implementierungen dieses Modells akzeptieren nur Texteingaben. Standardmodellimplementierungen akzeptieren sowohl Text- als auch Bild-/Vision-Anforderungen für Rückschlüsse.
Bereitstellen von GPT-4 Turbo mit Vision GA
Um das GA-Modell über das Azure KI Foundry-Portal bereitzustellen, wählen Sie GPT-4
und dann die Version turbo-2024-04-09
im Dropdownmenü aus. Das Standardkontingent für das gpt-4-turbo-2024-04-09
-Modell entspricht dem aktuellen Kontingent für GPT-4-Turbo. Siehe die regionalen Kontingentbeschränkungen.
GPT-4
GPT-4 ist der Vorgänger von GPT-4 Turbo. Sowohl für GPT-4- als auch für GPT-4 Turbo-Modelle lautet der Basismodellname gpt-4
. Sie können zwischen den GPT-4- und Turbo-Modellen unterscheiden, indem Sie die Modellversion analysieren.
gpt-4
Version0314
gpt-4
Version0613
gpt-4-32k
Version0613
Sie können die Tokenkontextlänge sehen, die von jedem Modell in der Modellzusammenfassungstabelle unterstützt wird.
GPT-4- und GPT-4 Turbo-Modelle
- Diese Modelle können nur mit der Chatvervollständigungs-API verwendet werden.
Unter Modellversionen erfahren Sie, wie Azure OpenAI Service Modellversionsupgrades verarbeitet und mit Modellen arbeitet , um zu erfahren, wie Sie die Modellversionseinstellungen Ihrer GPT-4-Bereitstellungen anzeigen und konfigurieren.
Modell-ID | Beschreibung | Maximale Anforderung (Token) | Trainingsdaten (bis) |
---|---|---|---|
gpt-4o (2024-11-20) GPT-4o (Omni) |
Neuestes großes GA-Modell - Strukturierte Ausgaben – Text, Bildverarbeitung - JSON-Modus – Paralleler Funktionsaufruf – Höhere Genauigkeit und Reaktionsfähigkeit – Gleichheit mit englischen Text- und Programmieraufgaben im Vergleich zu GPT-4 Turbo mit Vision - Überlegene Leistung in nicht englischen Sprachen und in Vision-Aufgaben. - Verbesserte kreative Schreibfähigkeit |
Eingang: 128.000 Ausgabe: 16.384 |
Oktober 2023 |
gpt-4o (2024-08-06) GPT-4o (Omni) |
- Strukturierte Ausgaben – Text, Bildverarbeitung - JSON-Modus – Paralleler Funktionsaufruf – Höhere Genauigkeit und Reaktionsfähigkeit – Gleichheit mit englischen Text- und Programmieraufgaben im Vergleich zu GPT-4 Turbo mit Vision – Überlegene Leistung in nicht englischen Sprachen und in Visionsaufgaben |
Eingang: 128.000 Ausgabe: 16.384 |
Oktober 2023 |
gpt-4o-mini (2024-07-18) GPT-4o mini |
Neuestes kleines GA-Modell - Schnelles, kostengünstiges, leistungsfähiges Modell ideal zum Ersetzen von Modellen der GPT-3.5 Turbo-Serie – Text, Bildverarbeitung - JSON-Modus - Paralleler Aufruf von Funktionen |
Eingang: 128.000 Ausgabe: 16.384 |
Oktober 2023 |
gpt-4o (2024-05-13) GPT-4o (Omni) |
Text, Bildverarbeitung - JSON-Modus – Paralleler Funktionsaufruf – Höhere Genauigkeit und Reaktionsfähigkeit – Gleichheit mit englischen Text- und Programmieraufgaben im Vergleich zu GPT-4 Turbo mit Vision – Überlegene Leistung in nicht englischen Sprachen und in Visionsaufgaben |
Eingang: 128.000 Ausgabe: 4.096 |
Oktober 2023 |
gpt-4 (Turbo-2024-04-09) GPT-4 Turbo mit Vision |
Neues GA-Modell – Ersatz für alle vorherigen GPT-4-Vorschaumodelle ( vision-preview , 1106-Preview , 0125-Preview ) - Die Verfügbarkeit von Features unterscheidet sich derzeit je nach Eingabemethode und Bereitstellungstyp. |
Eingang: 128.000 Ausgabe: 4.096 |
Dez. 2023 |
gpt-4 (0125-Preview)*GPT-4 Turbo Preview |
Vorschaumodell -Ersetzt 1106-Preview - Bessere Leistung bei der Codegenerierung - Reduziert Fälle, in denen das Modell keine Aufgabe abgeschlossen hat - JSON-Modus – Paralleler Funktionsaufruf - reproduzierbares Ergebnis (Vorschau) |
Eingang: 128.000 Ausgabe: 4.096 |
Dez. 2023 |
gpt-4 (vision-preview)GPT-4 Turbo mit Vision-Vorschau |
Vorschaumodell - Akzeptiert Text- und Bildeingaben. - Unterstützt Verbesserungen - JSON-Modus – Paralleler Funktionsaufruf - reproduzierbares Ergebnis (Vorschau) |
Eingang: 128.000 Ausgabe: 4.096 |
Apr 2023 |
gpt-4 (1106-Vorschau)GPT-4 Turbo Preview |
Vorschaumodell - JSON-Modus – Paralleler Funktionsaufruf - reproduzierbares Ergebnis (Vorschau) |
Eingang: 128.000 Ausgabe: 4.096 |
Apr 2023 |
gpt-4-32k (0613) |
Älteres GA-Modell – Grundlegende Funktionsaufrufe mit Tools |
32,768 | September 2021 |
gpt-4 (0613) |
Älteres GA-Modell – Grundlegende Funktionsaufrufe mit Tools |
8.192 | September 2021 |
gpt-4-32k (0314) |
Älteres GA-Modell - Informationen zur Rente |
32,768 | September 2021 |
gpt-4 (0314) |
Älteres GA-Modell - Informationen zur Rente |
8.192 | September 2021 |
Achtung
Es wird nicht empfohlen, Vorschaumodelle in der Produktion zu verwenden. Wir werden alle Bereitstellungen von Vorschaumodellen entweder auf zukünftige Vorschauversionen oder auf die neueste stabile/GA-Version aktualisieren. Modelle, die als Vorschau bezeichnet wurden, entsprechen nicht dem standardmäßigen Azure OpenAI-Modelllebenszyklus.
- GPT-4 Version 0125-preview ist eine aktualisierte Version der GPT-4 Turbo Preview, die zuvor als Version 1106-preview veröffentlicht wurde.
- GPT-4 Version 0125-preview erledigt Aufgaben wie die Codegenerierung vollständiger als die Version gpt-4-1106-preview. Je nach Aufgabe stellen Kund*innen möglicherweise fest, dass GPT-4-0125-preview im Vergleich zur gpt-4-1106-preview mehr Ausgaben generiert. Wir empfehlen Kund*innen, die Ausgaben des neuen Modells zu vergleichen. GPT-4-0125-preview behebt auch Fehler von gpt-4-1106-preview mit UTF-8-Behandlung für nicht englische Sprachen.
- GPT-4 Version
turbo-2024-04-09
ist das neueste GA-Release und ersetzt0125-Preview
,1106-preview
undvision-preview
.
GPT-3.5
GPT-3.5-Modelle können natürliche Sprache oder Code verstehen und generieren. Das leistungsfähigste und kostengünstigste Modell in der GPT-3.5-Familie ist GPT-3.5 Turbo, das für den Chat optimiert wurde und auch für herkömmliche Vervollständigungsaufgaben gut geeignet ist. GPT-3.5 Turbo ist für die Verwendung mit der Chatvervollständigungs-API verfügbar. GPT-3.5 Turbo Instruct verfügt über ähnliche Funktionen wie text-davinci-003
und nutzt die Vervollständigungs-API anstelle der Chatvervollständigungs-API. Es wird empfohlen, GPT-3.5 Turbo und GPT-3.5 Turbo Instruct anstelle der älteren GPT-3.5- und GPT-3-Modelle zu verwenden.
Modell-ID | Beschreibung | Maximale Anforderung (Token) | Trainingsdaten (bis) |
---|---|---|---|
gpt-35-turbo (0125) NEU |
Neuestes GA-Modell - JSON-Modus – Paralleler Funktionsaufruf – reproduzierbare Ausgabe (Vorschau) - Höhere Genauigkeit bei der Reaktion in angeforderten Formaten. - Behebung eines Fehlers, der zu einem Textcodierungsproblem bei Nicht-Englisch-Funktionsaufrufen führte. |
Eingabe: 16.385 Ausgabe: 4.096 |
September 2021 |
gpt-35-turbo (1106) |
Älteres GA-Modell - JSON-Modus – Paralleler Funktionsaufruf - reproduzierbares Ergebnis (Vorschau) |
Eingabe: 16.385 Ausgabe: 4.096 |
September 2021 |
gpt-35-turbo-instruct (0914) |
Nur Endpunkt für Fertigstellungen - Ersatz für Legacy-Vervollständigungsmodelle |
4.097 | September 2021 |
gpt-35-turbo-16k (0613) |
Älteres GA-Modell – Grundlegende Funktionsaufrufe mit Tools |
16.384 | September 2021 |
gpt-35-turbo (0613) |
Älteres GA-Modell – Grundlegende Funktionsaufrufe mit Tools |
4\.096 | September 2021 |
gpt-35-turbo 1 (0301) |
Älteres GA-Modell - Informationen zur Rente |
4\.096 | September 2021 |
Weitere Informationen zur Interaktion mit GPT-3.5 Turbo und der Chat-Abschluss-API finden Sie in unseren ausführlichen Anleitungen.
1 Dieses Modell akzeptiert Anforderungen > von 4.096 Token. Es wird nicht empfohlen, den Grenzwert von 4.096 Eingabetoken zu überschreiten, da die neuere Version des Modells auf 4.096 Token begrenzt ist. Wenn bei diesem Modell 4.096 Eingabetoken überschritten werden und Probleme auftreten, ist zu beachten, dass diese Konfiguration nicht offiziell unterstützt wird.
Einbettungen
text-embedding-3-large
ist das neueste und leistungsfähigste Einbettungsmodell. Das Upgrade zwischen Einbettungsmodellen ist nicht möglich. Um von text-embedding-ada-002
zu text-embedding-3-large
zu wechseln, müssen Sie neue Einbettungen generieren.
text-embedding-3-large
text-embedding-3-small
text-embedding-ada-002
Bei Tests berichtet OpenAI, dass sowohl die großen als auch die kleinen Einbettungsmodelle der dritten Generation eine bessere durchschnittliche mehrsprachige Abrufleistung mit dem MIRACL-Benchmark bieten und gleichzeitig die Leistung für englische Aufgaben mit dem MTEB-Benchmark beibehalten.
Bewertungsmaßstab | text-embedding-ada-002 |
text-embedding-3-small |
text-embedding-3-large |
---|---|---|---|
MIRACL-Durchschnitt | 31,4 | 44,0 | 54.9 |
MTEB-Durchschnitt | 61.0 | 62,3 | 64,6 |
Die Einbettungsmodelle der dritten Generation unterstützen die Reduzierung der Einbettungsgröße über einen neuen dimensions
-Parameter. In der Regel sind größere Einbettungen aus Compute-, Arbeitsspeicher- und Speicherperspektive teurer. Die Möglichkeit, die Anzahl der Dimensionen anzupassen, ermöglicht eine bessere Kontrolle über die Gesamtkosten und die Leistung. Der Parameter dimensions
wird nicht in allen Versionen der OpenAI 1.x-Python-Bibliothek unterstützt. Um diesen Parameter zu nutzen, empfehlen wir ein Upgrade auf die neueste Version: pip install openai --upgrade
.
Bei den MTEB-Benchmarktests von OpenAI wurde festgestellt, dass die Leistung des Modells der dritten Generation auch dann noch geringfügig besser ist, wenn die Dimensionen auf weniger als 1.536 text-embeddings-ada-002
reduziert werden.
Bildgenerierungsmodelle
Die Bildgenerierungsmodelle generieren Bilder aus Textaufforderungen, die der Benutzer bereitstellt. GPT-image-1 befindet sich in der öffentlichen Vorschau mit eingeschränktem Zugriff. DALL-E 3 ist allgemein verfügbar für die Verwendung mit den REST-APIs. DALL-E 2 und DALL-E 3 mit Client-SDKs befinden sich in der Vorschau.
Verfügbarkeit
Für den Zugriff auf die gpt-image-1
Registrierung ist erforderlich, und der Zugriff wird basierend auf den Berechtigungskriterien von Microsoft gewährt. Kunden, die Zugriff auf andere Modelle mit eingeschränktem Zugriff haben, müssen weiterhin Zugriff für dieses Modell anfordern.
Anfordern des Zugriffs: gpt-image-1
Anwendung mit eingeschränktem Zugriffsmodell
Nachdem der Zugriff gewährt wurde, müssen Sie eine Bereitstellung für das Modell erstellen.
Regionale Verfügbarkeit
Modell | Region |
---|---|
dall-e-3 |
Ost-USA Australien (Osten) Schweden, Mitte |
gpt-image-1 |
USA, Westen 3 (globaler Standard) Vereinigte Arabische Emirate Nord (Global Standard) |
Audiomodelle
Audiomodelle in Azure OpenAI sind über die realtime
, completions
und audio
APIs verfügbar.
GPT-4o-Audiomodelle
Die GPT 4o-Audiomodelle sind Teil der GPT-4o-Modellfamilie und unterstützen Unterhaltungsinteraktionen mit latenzarmer Spracheingabe und Sprachausgabe oder Audiogenerierung.
Achtung
Es wird nicht empfohlen, Vorschaumodelle in der Produktion zu verwenden. Wir werden alle Bereitstellungen von Vorschaumodellen entweder auf zukünftige Vorschauversionen oder auf die neueste stabile/GA-Version aktualisieren. Modelle, die als Vorschau bezeichnet wurden, entsprechen nicht dem standardmäßigen Azure OpenAI-Modelllebenszyklus.
Details zu maximalen Anforderungstoken und Trainingsdaten sind in der folgenden Tabelle verfügbar.
Modell-ID | Beschreibung | Maximale Anforderung (Token) | Trainingsdaten (bis) |
---|---|---|---|
gpt-4o-mini-audio-preview (2024-12-17) GPT-4o-Audio |
Audiomodell für die Audio- und Textgenerierung. | Eingang: 128.000 Ausgabe: 4.096 |
Oktober 2023 |
gpt-4o-mini-realtime-preview (2024-12-17) GPT-4o-Audio |
Audiomodell für die Echtzeitaudioverarbeitung. | Eingang: 128.000 Ausgabe: 4.096 |
Oktober 2023 |
gpt-4o-audio-preview (2024-12-17) GPT-4o-Audio |
Audiomodell für die Audio- und Textgenerierung. | Eingang: 128.000 Ausgabe: 4.096 |
Oktober 2023 |
gpt-4o-realtime-preview (2024-12-17) GPT-4o-Audio |
Audiomodell für die Echtzeitaudioverarbeitung. | Eingang: 128.000 Ausgabe: 4.096 |
Oktober 2023 |
gpt-4o-mini-realtime-preview (2024-12-17) GPT-4o-Audio |
Audiomodell für die Echtzeitaudioverarbeitung. | Eingang: 128.000 Ausgabe: 4.096 |
Oktober 2023 |
Informationen zum Vergleichen der Verfügbarkeit von GPT-4o-Audiomodellen in allen Regionen finden Sie in der Modelltabelle.
Audio-API
Die Audiomodelle über die /audio
-API können für Spracherkennung, -übersetzung und -synthese verwendet werden.
Sprach-zu-Text-Modelle
Modell-ID | Beschreibung | Maximale Anforderung (Größe der Audiodatei) |
---|---|---|
whisper |
Allgemeines Spracherkennungsmodell. | 25 MB |
gpt-4o-transcribe |
Sprache-zu-Text, unterstützt von GPT-4o. | 25 MB |
gpt-4o-mini-transcribe |
Sprache-zu-Text, unterstützt von GPT-4o mini. | 25 MB |
Sprachübersetzungsmodelle
Modell-ID | Beschreibung | Maximale Anforderung (Größe der Audiodatei) |
---|---|---|
whisper |
Allgemeines Spracherkennungsmodell. | 25 MB |
Text-zu-Sprache-Modelle (Vorschau)
Modell-ID | Beschreibung |
---|---|
tts |
Die Sprachsynthese ist für Geschwindigkeit optimiert. |
tts-hd |
Text-zu-Sprache, optimiert für Qualität. |
gpt-4o-mini-tts |
Text-zu-Sprache-Modell unterstützt von GPT-4o mini. Sie können die Stimme leiten, um in einem bestimmten Stil oder Tonfall zu sprechen. |
Weitere Informationen finden Sie unter Regionale Verfügbarkeit von Audiomodellen in diesem Artikel.
Tabelle mit Modellzusammenfassung und Regionsverfügbarkeit
Modelle nach Bereitstellungstyp
Azure OpenAI bietet Kunden Auswahlmöglichkeiten bei der Hostingstruktur, die ihren Geschäfts- und Nutzungsmustern entspricht. Der Dienst bietet zwei Haupttypen der Bereitstellung:
- Standard wird mit einer globalen Bereitstellungsoption angeboten, um den Datenverkehr global zu routen und einen höheren Durchsatz zu gewährleisten.
- Bereitgestellt wird auch mit der Option für weltweite Bereitstellung angeboten, sodass Kunden bereitgestellte Durchsatzeinheiten in der globalen Azure-Infrastruktur kaufen und bereitstellen können.
Alle Bereitstellungen können dieselben Rückschlussvorgänge ausführen, Abrechnung, Skalierung und Leistung unterscheiden sich jedoch erheblich. Weitere Informationen zu Azure OpenAI-Bereitstellungstypen finden Sie in unserem Bereitstellungstypenhandbuch.
- Globaler Standard
- Global bereitgestellt-Verwaltet
- Globaler Batch
- Datenzonenstandard
- Bereitgestellte verwaltete Datenzone
- Datazone-Batch
- Norm
- Bereitgestellt-Verwaltet
Verfügbarkeit des globalen Standardmodells
Region | o3, 2025-04-16 | o4-mini, 2025-04-16 | gpt-image-1, 2025-04-15 | gpt-4.1, 2025-04-14 | gpt-4.1-nano, 2025-04-14 | gpt-4.1-mini, 2025-04-14 | Computerverwendungs-Vorschau, 2025-03-11 | gpt-4.5-preview, 2025-02-27 | o3-mini, 2025-01-31 | o1, 2024-12-17 | o1-preview, 2024-09-12 | o1-mini, 2024-09-12 | gpt-4o, 2024-05-13 | gpt-4o, 2024-08-06 | gpt-4o, 2024-11-20 | gpt-4o-mini, 2024-07-18 | gpt-4, Turbo-2024-04-09 | Texteinbettung-3-klein, 1 | text-embedding-3-large, 1 | text-embedding-ada-002, 2 | gpt-4o-realtime-preview, 2024-12-17 | gpt-4o-audio-preview, 2024-12-17 | gpt-4o-mini-realtime-preview, 2024-12-17 | gpt-4o-mini-audio-preview, 2024-12-17 | gpt-4o-transcribe, 2025-03-20 | gpt-4o-mini-tts, 2025-03-20 | gpt-4o-mini-transcribe, 2025-03-20 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
australiaeast | - | - | - | ✅ | - | - | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Südbrazilien | - | - | - | - | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Kanada-Ost | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
eastus | - | - | - | - | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | ✅ | - | - | - |
Eastus2 | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
francecentral | - | - | - | - | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Deutschland West-Zentral | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Norditalien | - | - | - | - | - | - | - | - | ✅ | ✅ | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Japan Ost | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
koreacentral | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Northcentralus | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Norwegen Ost | - | - | - | - | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Polenzentral | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Südafrika Nord | - | - | - | - | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
southcentralus | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Südindien | - | - | - | - | - | - | ✅ | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Spanienzentral | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
schwedencentral | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | ✅ |
SchweizNord | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
uaenorth | - | - | ✅ | - | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
uksouth | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Westeuropa | - | - | - | - | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
westus | - | - | - | - | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
westus3 | - | - | ✅ | - | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Hinweis
o1-mini
ist derzeit für alle Kunden für die standardmäßige globale Bereitstellung verfügbar.
Ausgewählten Kunden wurde Zugriff auf (regionale) Standardbereitstellungen für o1-mini
im Rahmen des Releases o1-preview
mit eingeschränktem Zugriff gewährt. Derzeit wird der Zugriff auf (regionale) o1-mini
-Standardbereitstellungen nicht erweitert.
Diese Tabelle enthält keine Feinabstimmung der regionalen Verfügbarkeitsinformationen. Weitere Informationen finden Sie im Abschnitt Optimierung.
Standardbereitstellungsmodelle (regional) nach Endpunkt
Chatvervollständigungen
Region | o1-preview, 2024-09-12 | o1-mini, 2024-09-12 | gpt-4o, 2024-05-13 | gpt-4o, 2024-11-20 | gpt-4o, 2024-08-06 | gpt-4o-mini, 2024-07-18 | gpt-4, 0613 | gpt-4, 1106-Preview | gpt-4, 0125-Preview | gpt-4, Vision-Preview | gpt-4, Turbo-2024-04-09 | gpt-4-32k, 0613 | gpt-35-Turbo, 1106 | gpt-35-Turbo, 0125 | gpt-35-turbo-16k, 0613 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
australiaeast | - | - | - | ✅ | - | - | ✅ | ✅ | - | ✅ | - | ✅ | ✅ | ✅ | ✅ |
Kanada-Ost | - | - | - | ✅ | - | - | ✅ | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ |
eastus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | - | - | ✅ | ✅ |
Eastus2 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | - | - | ✅ | ✅ |
francecentral | - | - | - | ✅ | - | - | ✅ | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ |
Japan Ost | - | - | - | ✅ | - | - | - | - | - | ✅ | - | - | - | ✅ | ✅ |
Northcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | - | - | ✅ | ✅ |
Norwegen Ost | - | - | - | ✅ | - | - | - | ✅ | - | - | - | - | - | - | - |
southcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | - | ✅ | - | - | ✅ | - |
Südindien | - | - | - | ✅ | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | - |
schwedencentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
SchweizNord | - | - | - | ✅ | - | - | ✅ | - | - | ✅ | - | ✅ | - | ✅ | ✅ |
uksouth | - | - | - | ✅ | - | - | - | ✅ | ✅ | - | - | - | ✅ | ✅ | ✅ |
Westeuropa | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - |
westus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | - |
westus3 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | - | - | ✅ | - |
Hinweis
o1-mini
ist derzeit für alle Kunden für die standardmäßige globale Bereitstellung verfügbar.
Ausgewählten Kunden wurde Zugriff auf (regionale) Standardbereitstellungen für o1-mini
im Rahmen des Releases o1-preview
mit eingeschränktem Zugriff gewährt. Derzeit wird der Zugriff auf (regionale) o1-mini
-Standardbereitstellungen nicht erweitert.
GPT-4- und GPT-4 Turbo-Modellverfügbarkeit
Kundenzugriff auswählen
Zusätzlich zu den oben genannten Regionen, die allen Azure OpenAI-Kunden zur Verfügung stehen, wurde einigen ausgewählten bereits bestehenden Kunden in zusätzlichen Regionen Zugriff auf Versionen von GPT-4 gewährt:
Modell | Region |
---|---|
gpt-4 (0314) gpt-4-32k (0314) |
Ost-USA Frankreich, Mitte USA Süd Mitte UK, Süden |
gpt-4 (0613) gpt-4-32k (0613) |
Ost-USA USA (Ost) 2 Japan, Osten UK, Süden |
GPT-3.5-Modelle
Unter Modellversionen erfahren Sie, wie Azure OpenAI Service Modellversionsupgrades verarbeitet und mit Modellen arbeitet , um zu erfahren, wie Sie die Modellversionseinstellungen Ihrer GPT-3.5 Turbo-Bereitstellungen anzeigen und konfigurieren.
Optimierung von Modellen
Hinweis
gpt-35-turbo
– Die Feinabstimmung dieses Modells ist auf eine Teilmenge von Regionen beschränkt und ist nicht in allen Regionen, in denen das Basismodell verfügbar ist, verfügbar.
Die unterstützten Regionen für die Feinabstimmung können variieren, je nachdem, ob Sie Azure OpenAI-Modelle in einem Azure KI Foundry-Projekt oder außerhalb eines Projekts verwenden.
Modell-ID | Regionen mit Feinabstimmung | Maximale Anforderung (Token) | Trainingsdaten (bis) | Modalität |
---|---|---|---|---|
gpt-35-turbo (1106) |
USA, Osten 2 USA Nord Mitte Schweden, Mitte Schweiz, Westen |
Eingabe: 16.385 Ausgabe: 4.096 |
September 2021 | Text-zu-Text |
gpt-35-turbo (0125) |
USA, Osten 2 USA Nord Mitte Schweden, Mitte Schweiz, Westen |
16.385 | September 2021 | Text-zu-Text |
gpt-4o-mini (2024-07-18) |
USA Nord Mitte Schweden, Mitte |
Eingang: 128.000 Ausgabe: 16.384 Kontextlänge des Trainingsbeispiels: 65,536 |
Oktober 2023 | Text-zu-Text |
gpt-4o (2024-08-06) |
USA, Osten 2 USA Nord Mitte Schweden, Mitte |
Eingang: 128.000 Ausgabe: 16.384 Kontextlänge des Trainingsbeispiels: 65,536 |
Oktober 2023 | Text und Vision zu Text |
gpt-4.1 (2025-04-14) |
USA Nord Mitte Schweden, Mitte |
Eingang: 128.000 Ausgabe: 16.384 Kontextlänge des Trainingsbeispiels: 65,536 |
Mai 2024 | Text und Vision zu Text |
gpt-4.1-mini (2025-04-14) |
USA Nord Mitte Schweden, Mitte |
Eingang: 128.000 Ausgabe: 16.384 Kontextlänge des Trainingsbeispiels: 65,536 |
Mai 2024 | Text-zu-Text |
gpt-4.1-nano (2025-04-14) |
USA Nord Mitte Schweden, Mitte |
Eingang: 128.000 Ausgabe: 16.384 Beispielkontextlänge für Schulungen: 32.768 |
Mai 2024 | Text-zu-Text |
Assistenten (Vorschau)
Für Assistants benötigen Sie eine Kombination aus einem unterstützten Modell und einer unterstützten Region. Für bestimmte Tools und Funktionen sind die neuesten Modelle erforderlich. Die folgenden Modelle sind in der Assistants-API, im SDK und in Azure KI Foundry verfügbar. Die folgende Tabelle ist für Pay-as-you-go. Informationen zur Verfügbarkeit der provisionierten Durchsatzeinheit (PTU) finden Sie unter provisionierter Durchsatz. Die aufgeführten Modelle und Regionen können sowohl mit Assistenten v1 als auch v2 verwendet werden. Sie können globale Standardmodelle verwenden, wenn sie in den unten aufgeführten Regionen unterstützt werden.
Region | gpt-4o, 2024-05-13 | gpt-4o, 2024-08-06 | gpt-4o-mini, 2024-07-18 | gpt-4, 0613 | gpt-4, 1106-Preview | gpt-4, 0125-Preview | gpt-4, Turbo-2024-04-09 | gpt-4-32k, 0613 | gpt-35-Turbo, 0613 | gpt-35-Turbo, 1106 | gpt-35-Turbo, 0125 | gpt-35-turbo-16k, 0613 |
---|---|---|---|---|---|---|---|---|---|---|---|---|
australiaeast | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ |
eastus | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | ✅ | - | ✅ | ✅ |
Eastus2 | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | - | ✅ | - | ✅ | ✅ |
francecentral | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | ✅ |
Japan Ost | - | - | - | - | - | - | - | - | ✅ | - | ✅ | ✅ |
Norwegen Ost | - | - | - | - | ✅ | - | - | - | - | - | - | - |
Südindien | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | - |
schwedencentral | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | - | ✅ |
uksouth | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ |
westus | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | - | - | ✅ | ✅ | - |
westus3 | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | - | - | - | ✅ | - |
Modelldeaktivierung
Die neuesten Informationen zu Modellrenten finden Sie im Modellrentierungsleitfaden.