Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Gilt nur für:Foundry Portal (Classic). Dieser Artikel ist für das neue Foundry-Portal nicht verfügbar.
Erfahren Sie mehr über das neue Portal.
Hinweis
Links in diesem Artikel können Inhalte in der neuen Microsoft Foundry-Dokumentation anstelle der jetzt angezeigten Foundry-Dokumentation (klassisch) öffnen.
Dieser Artikel enthält eine Zusammenfassung der neuesten Versionen und hauptdokumentationsupdates für Azure OpenAI.
Mai 2026
GPT Realtime 2.0 Konzeptartikel
Neue Konzeptartikel beschreiben die Funktionen und Schlüsselkonzepte für das neueste Echtzeitmodell:
- Übersicht über GPT Realtime 2.0 (Vorschau) – umfasst die Begründungsunterstützung, Antwortphasen (Präamble und endgültige Antwort) und strengere Anleitungen:
GPT Realtime Translate und GPT Realtime Whisper
Neue Konzeptartikel beschreiben die Funktionen und Anwendungsfälle für die neuesten Echtzeitübersetzungs- und Transkriptionsmodelle:
- GPT Realtime Translate – umfasst kontinuierliche streambasierte Audioübersetzung für mehrsprachige Liveereignisse, Kundensupport und Sprachassistenten.
- GPT Realtime Whisper – deckt die Transkription von Streaming mit geringer Latenz für Liveuntertitel, Überwachung und Archivierungsworkflows ab.
Februar 2026
GPT-Realtime-1.5- und GPT-Audio-1.5-Modelle veröffentlicht
Die gpt-realtime-1.5- und gpt-audio-1.5-Modelle sind jetzt verfügbar.
- Diese Modelle basieren auf den Modellen GPT-Realtime und GPT-Audio des letzten Jahres mit Verbesserungen beim Befolgen von Anleitungen, mehrsprachiger Unterstützung und Aufrufen von Tools, wobei gleichzeitig die Low-Latenz-Interaktionen beibehalten werden, die Entwickler für Echtzeitinteraktionen in voice-first-Anwendungen benötigen.
- Probieren Sie sie mit den vorhandenen Chatabschluss-APIs in Microsoft Foundry aus.
Dezember 2025
DAS GPT-image-1.5-Modell ist jetzt verfügbar.
GPT-image-1.5 ist das neueste spitzenaktuelle Imagegenerierungsmodell von OpenAI. Es bietet verbesserte Funktionen in Bezug auf Leistung, Qualität, Steuerung der Bearbeitung und Bewahrung von Gesichtern. Im Bearbeitungsmodus unterstützt das Modell hohe input_fidelity und das Hinzufügen oder Entfernen eines Aspekts des Eingabebilds, während andere beibehalten werden.
Anfordern des Zugriffs: Anwendung mit eingeschränktem Zugriffsmodell
Wichtige Modellfunktionen:
- Umfasst alle Funktionen von GPT-image-1:
- Text-zu-Bild-Generierung
- Bild-zu-Bild-Generierung (Bearbeitung)
- Inpainting
- Hochwertige Bildgenerationen bis zu 1024 x 1536 und 1536 x 1024 Pixel
- Gesichtserhaltung
Folgen Sie der Anleitung zur Bildgenerierung, um mit diesem Modell zu beginnen.
Automatische Spracherkennung (ASR)-Modellaktualisierung
gpt-4o-mini-transcribe-2025-12-15
- Verbesserte Transkriptionsgenauigkeit und Robustheit für Echtzeitszenarien mit etwa 50% niedrigerer Wortfehlerrate (WER) als das vorherige
gpt-4o-transcribe-miniModell in englischen Benchmarks. - Verbessert die mehrsprachige Leistung in japanisch, indischen und anderen Sprachen.
- Reduziert Halluzinationen auf Stille um bis zu 4× und macht es zu einer zuverlässigeren Wahl für laute Umgebungen und reale Audiostreams.
- Die Eingabe bleibt Audio, mit Text als Ausgabe, und die Bereitstellung erfolgt ausschließlich über API.
Update des Echtzeit-Minimodells (Sprach-zu-Sprache)
gpt-realtime-mini-2025-12-15
- Feature-Parität mit vollem gpt-Echtzeitmodell bei Befehlsverfolgung und Funktionsaufruf.
- Eingabe und Ausgabe sind beide Audio, und die Bereitstellung erfolgt ausschließlich über API.
Aktualisierung des Text-zu-Sprachmodells
gpt-4o-mini-tts-2025-12-15
- Legt einen neuen Benchmark für mehrsprachige Sprachsynthese fest.
- Produziert natürlichere, menschliche Sprache mit weniger Artefakten und verbesserter Sprecherähnlichkeit.
- Die Eingabe ist Text, die Ausgabe ist Audio, und erfolgt nur über API.
Oktober 2025
Echtzeit-API-Unterstützung für SIP
Die Realtime API unterstützt jetzt SIP, um Telefonverbindungen zur Realtime API zu ermöglichen. Weitere Informationen finden Sie in der Realtime SIP-Dokumentation.
GPT-4o-Audiomodell veröffentlicht
- Das
gpt-4o-transcribe-diarizeSprach-zu-Text-Modell wurde freigegeben. Dieses Modell ist ein ASR-Modell (Automatic Speech Recognition), das gesprochene Sprache in Text in Echtzeit konvertiert. Es ermöglicht Organisationen, Einblicke aus Gesprächen sofort mit ultra-niedriger Latenz und hoher Genauigkeit in mehr als 100 Sprachen zu gewinnen. Diese Funktion ist für Workflows unerlässlich, bei denen VoIP-Daten Entscheidungen fördern – z. B. Kundensupport, virtuelle Besprechungen und Liveereignisse.
Diarization ist der Prozess der Identifizierung, wer wann in einem Audiostream gesprochen hat. Es wandelt Unterhaltungen in sprechergeschriebene Transkripte um, sodass Unternehmen umsetzbare Erkenntnisse aus Besprechungen, Kundenanrufen und Liveereignissen extrahieren können. Mit fortgeschrittenen Modellen wie gpt-4o-transcribe-diarize, erhalten Organisationen Klarheit und Kontext in Echtzeit – verwandeln Sie Sprache in strukturierte Daten, die intelligentere Entscheidungen fördern und die Produktivität verbessern und die automatische Spracherkennung unterstützen.
Verwenden Sie dieses Modell über die /audio und /realtime APIs.
GPT-image-1-mini
Das gpt-image-1-mini Modell ist jetzt für globale Bereitstellungen verfügbar. Es ist eine kleinere Version des gpt-image-1 Modells, die eine gute Balance zwischen Leistung und Kosten bietet. Alle Anwendungsfälle werden derzeit unterstützt, mit Ausnahme von Bildbearbeitungen und Eingabetreue.
Zugriff anfordern: Anwendung mit eingeschränktem Zugriffsmodell
Folgen Sie der Anleitung zur Bildgenerierung, um mit diesem Modell zu beginnen.
Filter zur Erkennung von PII-Inhalten
Die Erkennung personenbezogener Informationen (Personally Identifiable Information, PII) ist jetzt als integrierter Inhaltsfilter verfügbar. Mit diesem Feature können Sie vertrauliche Informationen in LLM-Ausgaben identifizieren und blockieren, wodurch der Datenschutz verbessert wird. Weitere Informationen finden Sie in der Dokumentation zur PII-Erkennung .
September 2025
GPT-5-Codex ist jetzt verfügbar.
Erfahren Sie mehr über
gpt-5-codexauf der Seite Einstieg in Reasoning-Modelle.gpt-5-codexist für die Verwendung mit der CLI Codex und der Visual Studio Code Codex-Erweiterung konzipiert.Für den Zugriff auf das gpt-5-Codex-Modell ist eine Registrierung erforderlich. Wenn Sie sich zuvor registriert und Zugriff auf andere eingeschränkte Zugriffsmodelle wie
gpt-5erhalten haben, müssen Sie sich nicht erneut bewerben und erhalten automatisch Zugriff.
Sora-Video-zu-Video-Unterstützung
Das Sora-Modell von OpenAI unterstützt jetzt die Video-zu-Video-Generierung. Sie können ein kurzes Video als Eingabe bereitstellen, um ein neues, längeres Video zu generieren, das das Eingabevideo enthält. Sehen Sie sich die Schnellstartanleitung an, um zu beginnen.
August 2025
Sora-Bild-zu-Video-Unterstützung
Das Sora-Modell von OpenAI unterstützt jetzt die Bild-zu-Video-Generierung. Sie können ein Bild als Eingabe für das Modell bereitstellen, um ein Video zu generieren, das den Inhalt des Bilds enthält. Sie können auch den Frame des Videos angeben, in dem das Bild angezeigt werden soll: Es muss nicht der Anfang sein. Sehen Sie sich die Schnellstartanleitung an, um zu beginnen.
Dieses Sora-Modell ist jetzt in der Schwedischen Zentralregion und ost-US 2 verfügbar.
Echtzeit-API-Audiomodell GA
Die GPT RealTime- und Audiomodelle von OpenAI sind jetzt in Microsoft Foundry Models allgemein verfügbar.
Modellverbesserungen:
- Verbessertes Befolgen von Anweisungen: Verbesserte Fähigkeiten, Ton-, Tempo- und Eskalationsanweisungen genauer und zuverlässiger zu befolgen. Kann auch Sprachen wechseln.
- Neue Standardstimmen, Marin und Cedar, die verbesserte Natürlichkeit und Klarheit in der Sprachsynthese bieten.
- Verbesserte Audioqualität: Glitch-freie Ausgabe, verbesserte alphanumerische Wiedergabe und Modalitätskontrolle.
Verbesserungen des Echtzeit-API-Diensts:
- Bildeingabe: Hinzufügen und Besprechen von Bildern per Sprachausgabe ohne Videoanforderungen.
- Verbesserte Funktionsaufrufe: Verbesserte Möglichkeit zum Aufrufen von benutzerdefiniertem Code, der von Entwicklern definiert wird. Asynchrone Funktionsaufrufe werden unterstützt, sodass Sitzungen fortgesetzt werden können, während ein Funktionsaufruf aussteht.
- Unterhaltungsmodus: Reales Turn-Taking-Verhalten für natürliche Interaktionen. Der Gesprächsmodus verwendet die Spracherkennungstechnologie (VAD), um Benutzer aufzufordern, wenn keine Antwort erkannt wird, was die Benutzerfreundlichkeit im realen Einsatz für telefonähnliche Interaktionen verbessert.
Wir empfehlen dringend, dass alle Kunden auf die neu eingeführten GA-Modelle umsteigen, um die neuesten Features voll zu nutzen. Besuchen Sie die Azure OpenAI-Dokumentation und Microsoft Foundry Portal, um Funktionen zu erkunden und in Ihre Anwendungen zu integrieren.
Allgemeine Verfügbarkeit des bereitgestellten Überlaufs
Spillover ist jetzt allgemein verfügbar. Der Überlauf verwaltet Datenverkehrsschwankungen für bereitgestellte Bereitstellungen, indem Überschüsse an eine bestimmte Standardbereitstellung weitergeleitet werden. Weitere Informationen zum Maximieren der Nutzung ihrer bereitgestellten Bereitstellungen mit Überlauf finden Sie unter Verwalten von Datenverkehr mit Überlauf für bereitgestellte Bereitstellungen.
GPT-5-Modelle verfügbar
gpt-5,gpt-5-mini,gpt-5-nanoWeitere Informationen finden Sie auf der Seite „Erste Schritte mit Modellen zur Schlussfolgerung“.gpt-5-chatist jetzt verfügbar. Weitere Informationen finden Sie auf der Seite "Modelle"gpt-5ist jetzt für Provisionierte Durchsatzeinheiten (PTU) verfügbar.Für den Zugriff auf das gpt-5-Modell ist eine Registrierung erforderlich.
gpt-5-mini,gpt-5-nanoundgpt-5-chatbenötigen keine Registrierung.
Neue Version des Modellrouters
Modellrouter unterstützt jetzt Modelle der GPT-5-Serie.
Der Modellrouter für Microsoft Foundry ist ein bereitstellungsfähiges KI-Chatmodell, das automatisch das beste zugrunde liegende Chatmodell auswählt, um auf eine bestimmte Aufforderung zu antworten. Weitere Informationen zur Funktionsweise des Modellrouters und deren Vorteile und Einschränkungen finden Sie im Leitfaden zu Modellrouterkonzepten. Um den Modellrouter mit der Completions API zu verwenden, folgen Sie der Anleitung im Anleitungsleitfaden.
Juli 2025
GPT-image-1 Update (Vorschau)
Eingabetreueparameter: Mit dem
input_fidelity-Parameter in der Bildbearbeitungs-API können Sie steuern, wie genau das Modell den Stil und die Merkmale der Objekte des ursprünglichen (Eingabebild) vermittelt. Dies ist nützlich für:- Bearbeiten von Fotos bei gleichzeitiger Erhaltung von Gesichtsmerkmalen; Erstellen von Avataren, die wie die ursprüngliche Person in unterschiedlichen Stilen aussehen; Kombinieren von Gesichtern von mehreren Personen zu einem Bild.
- Erhaltung der Markenidentität in generierten Bildern für Marketingobjekte, Modelle, Produktfotografie.
- E-Commerce und Mode, wo Sie Bilder von Outfits oder Produktdetails bearbeiten müssen, ohne Realismus zu gefährden.
Partielles Bildstreaming: Die APIs für die Bildgenerierung und Bildbearbeitung unterstützen partielles Bildstreaming, bei dem sie Bilder mit teilweise gerenderten Inhalten während des gesamten Bildgenerierungsprozesses zurückgeben. Zeigen Sie diese Bilder dem Benutzer an, um ein früheres visuelles Feedback bereitzustellen und den Fortschritt des Bildgenerierungsvorgangs anzuzeigen.
Juni 2025
Neue Modelle codex-mini & o3-pro veröffentlicht
-
codex-miniundo3-prosind jetzt verfügbar. Weitere Informationen finden Sie auf der Seite "Erste Schritte mit Denkmodellen"
Mai 2025
Sora-Videogenerierung veröffentlicht (Vorschau)
Das Modell Sora (2025-05-02) ist ein Modell der Videogenerierung von OpenAI, das realistische und fantasievolle Videoszenen aus Textanweisungen erstellen kann.
Folgen Sie der Schnellstartanleitung zur Videogenerierung , um zu beginnen. Weitere Informationen finden Sie im Leitfaden zu Konzepten der Videogenerierung .
Spotlightfunktion für Prompt Shields (Vorschau)
Spotlighting ist eine Teilfunktion von Prompt Shields, die den Schutz vor indirekten Angriffen (eingebettete Dokumente) erhöht, indem Eingabedokumente mit einer speziellen Formatierung versehen werden, um dem Modell weniger Vertrauen entgegenzubringen. Weitere Informationen finden Sie in der Dokumentation zum Prompt-Shield-Filter.
Modellrouter (Vorschau)
Der Modellrouter für Microsoft Foundry ist ein bereitstellungsfähiges KI-Chatmodell, das automatisch das beste zugrunde liegende Chatmodell auswählt, um auf eine bestimmte Aufforderung zu antworten. Weitere Informationen zur Funktionsweise des Modellrouters und deren Vorteile und Einschränkungen finden Sie im Leitfaden zu Modellrouterkonzepten. Um den Modellrouter mit der Completions API zu verwenden, folgen Sie der Anleitung im Anleitungsleitfaden.
der April 2025
Unterstützung der Echtzeit-API (Vorschau) für WebRTC
Die Realtime-API (Vorschau) unterstützt jetzt WebRTC, wodurch Echtzeit-Audiostreaming und Interaktionen mit geringer Latenz aktiviert werden. Dieses Feature eignet sich ideal für Anwendungen, die sofortiges Feedback erfordern, z. B. Live-Kundensupport oder interaktive Sprachassistenten. Weitere Informationen finden Sie in der Dokumentation zur Realtime-API (Vorschau).
GPT-image-1 veröffentlicht (Vorschau, eingeschränkter Zugriff)
GPT-image-1 (2025-04-15) ist das neueste Imagegenerierungsmodell von Azure OpenAI. Es bietet wichtige Verbesserungen gegenüber DALL-E, darunter:
- Besser bei der Reaktion auf präzise Anweisungen.
- Der Text wird zuverlässig dargestellt.
- Akzeptiert Bilder als Eingabe, wodurch die neuen Funktionen der Bildbearbeitung und -inpaintierung ermöglicht werden.
Zugriff anfordern: Anwendung mit eingeschränktem Zugriffsmodell
Folgen Sie der Anleitung zur Bildgenerierung , um mit dem neuen Modell zu beginnen.
o4-mini- und o3-Modelle veröffentlicht
o4-mini und o3 Modelle sind jetzt verfügbar. Diese Modelle sind die neuesten Reasoning-Modelle von Azure OpenAI mit verbesserter Begründung, Qualität und Leistung. Weitere Informationen finden Sie auf der Seite "Einsteigerleitfaden für Denkmodelle".
GPT-4.1 veröffentlicht
GPT 4.1 und GPT 4.1-Nano sind jetzt verfügbar. Diese Modelle sind die neuesten Modelle von Azure OpenAI. GPT 4.1 hat ein Tokenkontextlimit von 1 Millionen. Weitere Informationen finden Sie auf der Modellseite.
gpt-4o-Audiomodelle veröffentlicht
Neue Audiomodelle mit GPT-4o sind jetzt verfügbar.
Die
gpt-4o-transcribeundgpt-4o-mini-transcribeSprach-zu-Text-Modelle werden freigegeben. Verwenden Sie diese Modelle über die/audiound/realtimeAPIs.Das
gpt-4o-mini-ttsText-zu-Sprache-Modell wird veröffentlicht. Verwenden Sie das Modell für diegpt-4o-mini-ttsText-zu-Sprache-Generierung über die/audioAPI.
Weitere Informationen zu verfügbaren Modellen finden Sie in der Dokumentation zu Modellen und Versionen.
März 2025
Antwort-API und Computerverwendungsvorschaumodell
Die Responses-API ist eine neue zustandsbehaftete API aus Azure OpenAI. Sie vereint die besten Funktionen aus den Chatabschluss- und Assistenten-APIs in einer einheitlichen Benutzeroberfläche. Die Antwort-API bietet außerdem Unterstützung für das neue computer-use-preview Modell, das die Computernutzungsfunktion unterstützt.
Für den Zugriff auf computer-use-preview ist eine Registrierung erforderlich und der Zugriff wird basierend auf den Zugangsberechtigungskriterien von Microsoft gewährt. Kunden, die Zugriff auf andere Modelle mit eingeschränktem Zugriff haben, müssen weiterhin Zugriff für dieses Modell anfordern.
Anfordern des Zugriffs: computer-use-preview Anwendung mit eingeschränktem Zugriffsmodell
Weitere Informationen zu Modellfunktionen und zur Verfügbarkeit von Regionen finden Sie in der Modelldokumentation.
Democode für die Playwright-Integration.
Bereitgestellter Überlauf (Vorschau)
Der Überlauf verwaltet Datenverkehrsschwankungen für bereitgestellte Bereitstellungen, indem Überschüsse an eine bestimmte Standardbereitstellung weitergeleitet werden. Weitere Informationen zum Maximieren der Nutzung ihrer bereitgestellten Bereitstellungen mit Überlauf finden Sie unter Verwalten von Datenverkehr mit Überlauf für bereitgestellte Bereitstellungen (Vorschau).
Angeben von Inhaltsfilterkonfigurationen
Zusätzlich zur Konfiguration der Inhaltsfilterung auf Bereitstellungsebene stellen wir nun auch einen Anforderungsheader bereit, mit dem Sie Ihre benutzerdefinierte Konfiguration zur Anforderungszeit für jeden API-Aufruf angeben können. Weitere Informationen finden Sie unter Verwenden von Inhaltsfiltern (Vorschau).
Februar 2025
GPT-4.5 Preview
Das neueste GPT-Modell, das sich für verschiedene Text- und Bildaufgaben eignet, ist jetzt auf Azure OpenAI verfügbar.
Weitere Informationen zu Modellfunktionen und zur Verfügbarkeit von Regionen finden Sie in der Modelldokumentation.
API für gespeicherte Fertigstellungen
Mit gespeicherten Abschlüssen können Sie den Unterhaltungsverlauf aus Chat-Abschlusssitzungen erfassen, die als Datensätze für Bewertungen und Feinabstimmung verwendet werden.
o3-mini Datenzonen-Standardbereitstellungen
o3-mini ist jetzt für globale Standard- und Datenzonenstandardbereitstellungen für registrierte Kunden mit eingeschränktem Zugriff verfügbar.
Weitere Informationen finden Sie in unserem Leitfaden für das Begründungsmodell.
gpt-4o Miniaudio freigegeben
Das gpt-4o-mini-audio-preview (2024-12-17) Modell ist das neueste Modell für Audiovervollständigungen. Weitere Informationen finden Sie in der Schnellstartanleitung zur Audiogenerierung.
Das gpt-4o-mini-realtime-preview (2024-12-17) Modell ist das neueste Echtzeitaudiomodell. Die Echtzeitmodelle verwenden dasselbe zugrunde liegende GPT-4o-Audiomodell wie die Fertigstellungs-API, ist jedoch für Interaktionen mit geringer Latenz und Echtzeitaudio optimiert. Weitere Informationen finden Sie in der Echtzeitaudio-Schnellstartanleitung.
Weitere Informationen zu verfügbaren Modellen finden Sie in der Dokumentation zu Modellen und Versionen.
Januar 2025
o3-mini veröffentlicht
o3-mini (2025-01-31) ist das neueste Reasoning-Modell, das erweiterte Begründungsfähigkeiten bietet. Weitere Informationen finden Sie in unserem Leitfaden für das Begründungsmodell.
GPT-4o-Audio-Vervollständigungen
Das gpt-4o-audio-preview Modell ist jetzt für globale Bereitstellungen in ost-US-2- und Schweden-Zentralregionen verfügbar. Verwenden Sie das Modell für die gpt-4o-audio-preview Audiogenerierung.
Das gpt-4o-audio-preview Modell führt die Audiomodalität in die vorhandene /chat/completions API ein. Das Audiomodell erweitert das Potenzial für KI-Anwendungen in Text- und sprachbasierten Interaktionen und Audioanalysen. Zu den im gpt-4o-audio-preview Modell unterstützten Modalitäten gehören: Text, Audio und Text + Audio. Weitere Informationen finden Sie in der Schnellstartanleitung zur Audiogenerierung.
Hinweis
Die Realtime-API verwendet das gleiche zugrunde liegende GPT-4o-Audiomodell wie die Fertigstellungs-API, ist jedoch für Interaktionen mit geringer Latenz und Echtzeitaudio optimiert.
GPT Realtime-API 2024-12-17
Die gpt-4o-realtime-preview Modellversion 2024-12-17 ist für globale Bereitstellungen in Ost-US-2- und Schweden-Zentralregionen verfügbar. Verwenden Sie das gpt-4o-realtime-preview Version 2024-12-17-Modell anstelle der gpt-4o-realtime-preview Version 2024-10-01-Preview-Modell für Echtzeitaudiointeraktionen.
- Unterstützung für Prompt-Caching mit dem
gpt-4o-realtime-previewModell hinzugefügt. - Unterstützung für neue Stimmen hinzugefügt. Die
gpt-4o-realtime-previewModelle unterstützen nun die folgenden Stimmen:alloy, ,ash,ballad,coral,echo,sage.shimmerverse. - Ratelimits basieren nicht mehr auf Verbindungen pro Minute. Die Geschwindigkeitsbegrenzung basiert jetzt auf RPM (Anforderungen pro Minute) und TPM (Token pro Minute) für das
gpt-4o-realtime-previewModell. Die Ratengrenzwerte für jedegpt-4o-realtime-preview-Modellimplementierung sind 100 K TPM und 1 K RPM. Während der Vorschau zeigen Azure AI Foundry Portal und APIs möglicherweise ungenau unterschiedliche Geschwindigkeitsbeschränkungen an. Auch wenn Sie versuchen, eine andere Ratengrenze festzulegen, beträgt die tatsächliche Ratengrenze 100 K TPM und 1 K RPM.
Weitere Informationen finden Sie in der Schnellstartanleitung zu GPT-Echtzeitaudio und der How-to-Anleitung.
Dezember 2024
o1-Begründungsmodell, das für eingeschränkten Zugriff freigegeben wurde
Das neueste o1 Modell ist jetzt für api-Zugriff und Modellbereitstellung verfügbar.
Registration ist erforderlich, und der Zugriff wird basierend auf den Berechtigungskriterien Microsoft gewährt. Kunden, die zuvor einen Antrag gestellt und Zugang zu o1-preview erhalten haben, müssen sich nicht erneut bewerben, da sie automatisch auf der Warteliste für das neueste Modell stehen.
Anfordern des Zugriffs: Anwendung mit eingeschränktem Zugriffsmodell
Weitere Informationen zu den erweiterten o1-Serienmodellen finden Sie in der Einführung in die Reasoning-Modelle der o1-Serie.
Verfügbarkeit der Region
| Modell | Region |
|---|---|
o1 (Version: 2024-12-17) |
USA, Osten 2 (globaler Standard) Schweden Central (Global Standard) |
Feinabstimmung der Einstellungen (Vorschau)
Die direkte Einstellungsoptimierung (Direct Preference Optimization, DPO) ist eine neue Ausrichtungsmethode für große Sprachmodelle, die für die Anpassung der Modellgewichte basierend auf den menschlichen Vorlieben entwickelt wurden. Im Gegensatz zum Verstärkungslernen aus menschlichem Feedback (RLHF) erfordert DPO keine Anpassung eines Belohnungsmodells und verwendet einfachere Daten (binäre Präferenzen) für das Training. Diese Methode ist rechenschwächer und schneller, wodurch sie genauso effektiv für die Ausrichtung ist, während sie effizienter ist. DPO ist besonders nützlich in Szenarien, in denen subjektive Elemente wie Ton, Stil oder bestimmte Inhaltseinstellungen wichtig sind. Wir freuen uns, die öffentliche Vorschau von DPO in Azure OpenAI bekanntzugeben, beginnend mit dem modell gpt-4o-2024-08-06.
Informationen zur Optimierung der Modellregionsverfügbarkeit finden Sie auf der Modellseite.
Gespeicherte Fertigstellungen & Destillation
Gespeicherte Vervollständigungen ermöglichen es, die Historie der Kommunikation von Chat-Vervollständigungen zu erfassen, um sie als Dataset für Evaluierungen und Feinabstimmung zu verwenden.
GPT-4o 2024-11-20
gpt-4o-2024-11-20 ist jetzt zur globalen Standard-Implementierung verfügbar in:
- Ost-USA
- Ost-USA 2
- Nord-Mittel-USA
- Süd-Mittel-USA
- USA, Westen
- USA, Westen 3
- Schweden Zentral
NEU – in Datenzonen bereitgestellter Bereitstellungstyp
Bereitstellungen der Datenzone sind in derselben Azure OpenAI-Ressource verfügbar wie alle anderen Azure OpenAI-Bereitstellungstypen. Sie können jedoch die globale Azure-Infrastruktur nutzen, um den Datenverkehr dynamisch an das Rechenzentrum innerhalb der von Microsoft definierten Datenzone mit der besten Verfügbarkeit für jede Anforderung weiterzuleiten. In Datenzonen bereitgestellte Bereitstellungen bieten reservierte Modellverarbeitungskapazität für einen hohen und vorhersagbaren Durchsatz unter Verwendung der Azure-Infrastruktur innerhalb der von Microsoft angegebenen Datenzonen. In Datenzonen bereitgestellte Bereitstellungen werden für die Modelle gpt-4o-2024-08-06, gpt-4o-2024-05-13 und gpt-4o-mini-2024-07-18 unterstützt.
Weitere Informationen finden Sie im Bereitstellungstypenhandbuch.
Nächste Schritte
Erfahren Sie mehr über die zugrunde liegenden Modelle, die Azure OpenAI antreiben.