Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
MAI Image-Modelle sind eine von Microsoft AI entwickelte Familie von Bildmodellen, die modernste Text-zu-Bild-Generierung und bei einigen Modellen Bild-zu-Bild-Bearbeitungen ermöglichen. Diese Modelle werden im Rahmen von Microsoft Foundry Models angeboten, die von Azure verkauft werden, und bieten einen sicheren Zugriff auf Unternehmensniveau über Microsoft Foundry.
In diesem Artikel erfahren Sie, wie Sie:
- Bereitstellen von MAI-Imagemodellen in Microsoft Foundry
- Authentifizieren mithilfe von Microsoft Entra ID oder API-Schlüsseln
- Generieren von Bildern mithilfe der MAI-Bildgenerierungs-API
- Ausführen einer Bildbearbeitung mithilfe der MAI-Bildbearbeitungs-API
MAI-Bildmodelle in Microsoft Foundry umfassen:
| Modellname | Modellversion | Typ |
|---|---|---|
MAI-Image-2.5-Flash (Vorschau) |
2026-06-02 |
Text-zu-Bild-Generierung Bild-zu-Bild-Bearbeitungen |
MAI-Image-2.5 (Vorschau) |
2026-06-02 |
Text-zu-Bild-Generierung Bild-zu-Bild-Bearbeitungen |
MAI-Image-2e (Vorschau) |
2026-04-09 |
Text-zu-Bild-Generierung |
MAI-Image-2 (Vorschau) |
2026-02-20 |
Text-zu-Bild-Generierung |
Weitere Informationen zu den einzelnen Modellen finden Sie unter Verfügbare MAI-Bildmodelle.
Voraussetzungen
- Ein Azure-Abonnement mit einer gültigen Zahlungsmethode. Wenn Sie kein Azure-Abonnement haben, erstellen Sie ein paid Azure Konto.
- Zugriff auf Microsoft Foundry mit entsprechenden Berechtigungen zum Erstellen und Verwalten von Ressourcen.
- Ein Microsoft Foundry-Projekt. MAI-Imagemodelle sind für die globale Standardbereitstellung (West Central US, Ost-USA, West-USA, Westeuropa, Schweden Mittel- und Südindien und VAE Nord) verfügbar.
- Rolle Cognitive Services Contributor in der Azure AI Foundry -Ressource zum Bereitstellen von Modellen. Weitere Informationen finden Sie unter Azure RBAC-Rollen.
Bereitstellen von MAI-Imagemodellen
Um ein MAI-Imagemodell bereitzustellen, befolgen Sie die Anweisungen in Deploy Microsoft Foundry Models im Foundry-Portal.
Alternativ können Sie das Modell mithilfe der Azure CLI bereitstellen. Der folgende Code zeigt die Bereitstellung von MAI-Image-2.5. Um ein anderes Modell bereitzustellen, ersetzen Sie den Modellnamen und die Version in den Zeilen --model-name MAI-Image-2.5 und --model-version 2026-06-02 durch die Werte für Ihr gewünschtes Modell.
Ersetzen Sie <ACCOUNT_NAME>, , <RESOURCE_GROUP><DEPLOYMENT_NAME> durch Ihre Werte.
az cognitiveservices account deployment create \
--name <ACCOUNT_NAME> \
--resource-group <RESOURCE_GROUP> \
--deployment-name <DEPLOYMENT_NAME> \
--model-name "MAI-Image-2.5" \
--model-format Microsoft \
--model-version 2026-06-02 \
--sku-name GlobalStandard \
--sku-capacity 1
Referenz:az cognitiveservices account deployment delete
So listen Sie alle verfügbaren Bereitstellungen für Ihre Ressource auf:
az cognitiveservices account deployment list \
--resource-group <RESOURCE_GROUP> \
--name <ACCOUNT_NAME> \
-o table
Referenz:az cognitiveservices account deployment list
Verwenden Sie nach der Bereitstellung den Foundry-Playground , um das Modell interaktiv zu testen.
Text-zu-Bild-Generierung ausführen
Das folgende Beispiel zeigt, wie Sie ein Bild aus einer Textaufforderung mithilfe eines MAI-Bildmodells mit der MAI-Bildgenerierungs-API generieren.
Verwenden der API-Schlüsselauthentifizierung
Installieren Sie die
requestsBibliothek:pip install requestsFestlegen von Umgebungsvariablen:
export AZURE_ENDPOINT="https://<resource-name>.services.ai.azure.com" export AZURE_API_KEY="<your-api-key>" export DEPLOYMENT_NAME="<your-deployment-name>"Führen Sie den folgenden Code aus:
import os import base64 import requests endpoint = os.environ["AZURE_ENDPOINT"] api_key = os.environ["AZURE_API_KEY"] deployment_name = os.environ["DEPLOYMENT_NAME"] width = 1024 height = 1024 url = f"{endpoint}/mai/v1/images/generations" payload = { "model": deployment_name, "prompt": "A photorealistic concept art poster of a university at sunset, cinematic lighting", "width": width, "height": height } response = requests.post( url, headers={ "Content-Type": "application/json", "api-key": api_key, }, json=payload, ) response.raise_for_status() result = response.json() print(result) image_data = [ output for output in result.get("data", []) if "b64_json" in output ] if image_data: image_base64 = image_data[0]["b64_json"] output_path = "output.png" with open(output_path, "wb") as f: f.write(base64.b64decode(image_base64)) print(f"Image saved to {output_path}") else: print("Unexpected response format:", result)Erwartete Ausgabe: Eine JSON-Antwort, die die generierten Bilddaten im Base64-Format enthält. Das Bild wird decodiert und als
output.pngim aktuellen Verzeichnis gespeichert.
Verwenden Sie die Microsoft Entra ID-Authentifizierung
Um Microsoft Entra ID anstelle eines API-Schlüssels zu verwenden, ersetzen Sie den header api-key durch ein Bearertoken, das mit dem DefaultAzureCredential abgerufen wird:
Installieren Sie die Azure Identity library:
pip install azure-identityAktualisieren Sie die Anforderungsheader im API-Schlüsselauthentifizierungscode:
from azure.identity import DefaultAzureCredential, get_bearer_token_provider token_provider = get_bearer_token_provider( DefaultAzureCredential(), "https://cognitiveservices.azure.com/.default" ) token = token_provider() headers = { "Content-Type": "application/json", "Authorization": f"Bearer {token}", }Reference:DefaultAzureCredential
Führe eine Bild-zu-Bild-Bearbeitung durch
Das folgende Beispiel zeigt, wie Sie eine Bild-zu-Bild-Bearbeitung mithilfe eines MAI-Bildmodells mit der MAI-Bildbearbeitungs-API ausführen.
MAI-Image-2.5-Flash (Vorschau) und MAI-Image-2.5 (Vorschau) unterstützen Bild-zu-Bild-Bearbeitungen mithilfe der Bildbearbeitungs-API.
Hinweis
Anforderungen für Bild-zu-Bild-Bearbeitungen verwenden mehrteilige Formulardaten.
Verwenden der API-Schlüsselauthentifizierung
Installieren Sie die
requestsBibliothek:pip install requestsFestlegen von Umgebungsvariablen:
export AZURE_ENDPOINT="https://<resource-name>.services.ai.azure.com" export AZURE_API_KEY="<your-api-key>" export DEPLOYMENT_NAME="<your-deployment-name>"Führen Sie den folgenden Code aus:
import os import base64 import requests endpoint = os.environ["AZURE_ENDPOINT"] api_key = os.environ["AZURE_API_KEY"] deployment_name = os.environ["DEPLOYMENT_NAME"] width = 1024 height = 1024 url = f"{endpoint}/mai/v1/images/edits" # Replace the file name and type. reference_image = <path_to_your_image.png> image_type = "image/png" # or "image/jpeg" based on format of your image. files = [ ("image", (reference_image, open(reference_image, "rb"), image_type)) ] payload={ "model": deployment_name, "prompt": "Turn this image into a clean futuristic product shot with studio lighting", } response = requests.post( url, headers={ "api-key": api_key, }, data=payload, files=files ) response.raise_for_status() result = response.json() print(result) image_data = [ output for output in result.get("data", []) if "b64_json" in output ] if image_data: image_base64 = image_data[0]["b64_json"] output_path = "output.png" with open(output_path, "wb") as f: f.write(base64.b64decode(image_base64)) print(f"Image saved to {output_path}") else: print("Unexpected response format:", result)Erwartete Ausgabe: Eine JSON-Antwort, die die bearbeiteten Bilddaten im Base64-Format enthält. Das Bild wird decodiert und als
output.pngim aktuellen Verzeichnis gespeichert.
Wenn Sie Microsoft Entra ID anstelle eines API-Schlüssels verwenden möchten, ändern Sie diesen Code wie im vorherigen Abschnitt beschrieben: Use Microsoft Entra ID authentication.
Verfügbare MAI-Bildmodelle
Foundry unterstützt die Verwendung von MAI-Image-2.5-Flash (Vorschau), MAI-Image-2.5 (Vorschau), MAI-Image-2 (Vorschau) und MAI-Image-2e (Vorschau). Jedes dieser Modelle eignet sich für die folgenden wichtigen Anwendungsfälle:
- Text-zu-Bild-Generierung: Generieren Sie qualitativ hochwertige Bilder aus Aufforderungen in natürlicher Sprache, sodass Benutzer Textbeschreibungen in visuell kohärente Ausgaben übersetzen können, die für eine breite Palette von Kreativen und Design-Anwendungsfällen geeignet sind.
- Photorealistische Bildsynthese: In der Lage, realistische Bilder mit konsistenter visueller Struktur zu generieren, sodass sie für Konzeptvisualisierungs- und Inhaltserstellungsszenarien geeignet ist.
- Produkt-, Branding- und kommerzielles Design: Gut geeignet für Produktbilder, Marketingvisuale, Markenobjekte und kommerzielle kreative Workflows.
MAI-Image-2.5-Flash (Vorschau) und MAI-Image-2.5 (Vorschau) zeichnen sich darüber hinaus in diesen zentralen Anwendungsfällen aus:
- Bild-zu-Bild-Bearbeitung: Unterstützen Sie präzise, steuerbare Bearbeitungen für vorhandene Bilder, einschließlich Objektentfernung, Ersetzung, Attributänderungen, Inpainting, Textaktualisierungen und Artefaktbereinigung, während Komposition und Layout beibehalten werden.
- High-Fidelity-Porträts: Generieren Sie ausdrucksstarke, natürlich aussehende Porträts mit präziser Gesichtsstruktur, Beleuchtung und Textur.
- Präzises Rendern von Text: Verbessertes Rendern von Text in generierten Bildern, einschließlich Etiketten, Postern, Verpackungen und Beschilderung.
- Visuelles Schlussfolgern: Schlussfolgern über Objekte, Szenenstruktur, Beleuchtung, Größenverhältnisse und räumliche Anordnung hinweg, um selbst bei mehrdeutigen Prompts konsistente Ausgaben zu erzeugen.
Weitere Informationen zu den Funktionen der Microsoft-Modelle finden Sie unter Foundry Models, die von Azure angeboten werden.
MAI-Image-2.5-Flash (Vorschau)
MAI-Image-2.5-Flash (Vorschau) ist ein Text-zu-Bild-Generierungs- und Bild-zu-Bild-Bearbeitungsmodell, das entwickelt wurde, um qualitativ hochwertige, visuell ansprechende Bilder aus Aufforderungen in natürlicher Sprache zu erstellen und präzise, steuerbare Bearbeitungen für vorhandene Bilder durchzuführen. Es verwendet einen diffusionsbasierten generativen Ansatz, um Bilder schrittweise zu verfeinern und eine starke Ausrichtung zwischen dem Eingabetext und der generierten Ausgabe zu ermöglichen. Das Modell ist optimiert, um vielfältige und kohärente Bilder in einer breiten Palette von kreativen und Designszenarien zu erzeugen, sodass es gut für Aufgaben wie Konzeptvisualisierung, kreative Inhaltsgenerierung, Bildbearbeitungsworkflows und Produktionsdesign geeignet ist.
MAI-Image-2.5 (Vorschau)
MAI-Image-2.5 (Vorschau) ist ein Text-zu-Bild-Generierungs- und Bild-zu-Bild-Bearbeitungsmodell, das entwickelt wurde, um qualitativ hochwertige, visuell ansprechende Bilder aus Aufforderungen in natürlicher Sprache zu erstellen und präzise, steuerbare Bearbeitungen für vorhandene Bilder durchzuführen. Es verwendet einen diffusionsbasierten generativen Ansatz, um Bilder schrittweise zu verfeinern und eine starke Ausrichtung zwischen dem Eingabetext und der generierten Ausgabe zu ermöglichen. Das Modell zeichnet sich in präzisen, chirurgischen Bearbeitungen mit Konsistenz aus – ermöglicht Es Benutzern und Entwicklern, gezielte Objektbearbeitungen vorzunehmen, Layouts anzupassen, Text zu aktualisieren, Artefakte wie Bewegungsunschärfe zu bereinigen und visuelle Konsistenz über Iterationen hinweg zu erhalten.
MAI-Image-2e (Vorschau)
MAI-Image-2e (Vorschau) bietet eine qualitativ hochwertige Bildgenerierung, genau wie MAI-Image-2, aber bis zu 22% schneller und viermal effizienter als MAI-Image-2, wodurch es eine intelligente Wahl für Entwickler ist, die im Maßstab erstellen. MAI-Image-2e eignet sich am besten für großvolumige, schnelle Bearbeitungsszenarien – z. B. Produktbilder im Maßstab, Marketingvariationen, Brandingobjekte oder workflows, bei denen Effizienz und Kosten pro Bild entscheidend sind.
MAI-Image-2 (Vorschau)
MAI-Image-2 (Vorschau) ist ein Text-zu-Bild-Generierungsmodell, das entwickelt wurde, um qualitativ hochwertige, visuell ansprechende Bilder aus Aufforderungen in natürlicher Sprache zu erstellen. Es verwendet einen diffusionsbasierten generativen Ansatz, um Bilder schrittweise zu verfeinern und eine starke Ausrichtung zwischen dem Eingabetext und der generierten Ausgabe zu ermöglichen. Das Modell ist optimiert, um vielfältige und kohärente Bilder in einer breiten Palette von kreativen und Designszenarien zu erzeugen, sodass es gut für Aufgaben wie Konzeptvisualisierung, kreative Inhaltsgenerierung und Bildentwurfsworkflows geeignet ist.
API-Endpunkte
Nachdem Sie ein MAI-Imagemodell bereitgestellt haben, verwenden Sie die MAI-Bildgenerierungs-API , um Bilder und die MAI-Bildbearbeitungs-API für Bild-zu-Bild-Bearbeitungen zu generieren.
API-Endpunkt für die Bildgenerierung: Ein von Microsoft verwalteter Endpunkt, der einen Textprompt akzeptiert und ein PNG-Bild zurückgibt. Der API-Endpunkt hat das folgende Formular:
https://<resource-name>.services.ai.azure.com/mai/v1/images/generationsImage bearbeitet API-Endpunkt: Ein Microsoft verwalteter Endpunkt, der ein JPEG- oder PNG-Bild akzeptiert und ein PNG-Bild zurückgibt. Der API-Endpunkt hat das folgende Formular:
https://<resource-name>.services.ai.azure.com/mai/v1/images/edits
Zum Authentifizieren benötigen Sie Ihren ressourcenendpunkt und entweder ein Microsoft Entra ID-Token oder einen API-Schlüssel. Sie finden diese Werte im Abschnitt Keys und Endpoint Ihrer Ressource im Azure-Portal oder auf der Seite mit den Bereitstellungsdetails im Foundry-Portal.
Anforderungsparameter
In der folgenden Tabelle sind die Anforderungsparameter für die Bild-APIs aufgeführt:
| Parameter | API | Typ | Beschreibung |
|---|---|---|---|
model |
Beides | Schnur | Der Bereitstellungsname, den Sie beim Bereitstellen des Modells zugewiesen haben. |
prompt |
Beides | Schnur | Der Textprompt, der das zu erzeugende Bild oder die vorzunehmenden Bearbeitungen beschreibt. Maximale Kontextlänge: 32.000 Token. |
image |
Bildbearbeitungen | Schnur | Der Pfad zum Bild, das Sie bearbeiten möchten. Das Bild wird als mehrteilige Formulardaten übergeben. Muss im JPEG- oder PNG-Format vorliegen. |
width |
Bildgenerationen | Ganzzahl | Breite des Ausgabebilds in Pixeln. Mindestwert: 768. Das Produkt von width × height darf 1.048.576 nicht überschreiten. |
height |
Bildgenerationen | Ganzzahl | Höhe des Ausgabebilds in Pixeln. Mindestwert: 768. Das Produkt von width × height darf 1.048.576 nicht überschreiten. |
Hinweis
Das Ausgabeformat ist immer PNG. Die maximale Gesamtpixelanzahl beträgt 1.048.576 (entspricht 1024×1024). Sowohl width als auch height müssen jeweils mindestens 768 Pixel groß sein. Beide Dimensionen können 1024 überschreiten, solange die Gesamtpixelanzahl innerhalb des Grenzwerts bleibt.
API-Kontingente und -Grenzwerte
MAI-Bildmodelle weisen die folgenden Geschwindigkeitsgrenzwerte auf, die in Anforderungen pro Minute (RPM) gemessen werden. Die für Sie verfügbare Stufe hängt von Ihrer Abonnement- und Bereitstellungskonfiguration ab.
| Bereitstellungstyp | Tarif | MAI-Image-2.5-Flash (RPM) |
MAI-Image-2.5 (RPM) |
MAI-Image-2e (RPM) |
MAI-Image-2 (RPM) |
|---|---|---|---|---|---|
| Globaler Standard | 0 (Kostenlos) |
0 | 0 | 0 | 0 |
| Globaler Standard | 1 | 2 | 2 | 18 | 9 |
| Globaler Standard | 2 | 4 | 4 | 30 | 15 |
| Globaler Standard | 3 | 6 | 6 | 60 | 30 |
| Globaler Standard | 4 | 8 | 8 | 90 | 45 |
| Globaler Standard | 5 | 10 | 10 | 120 | 60 |
| Globaler Standard | 6 | 12 | 12 | 180 | 90 |
Um eine Kontingenterhöhung anzufordern, übermitteln Sie das Anforderungsformular für die Kontingenterhöhung. Anforderungen werden in der Reihenfolge verarbeitet, in der sie empfangen werden, und Priorität geht an Kunden, die ihre vorhandene Kontingentzuweisung aktiv verwenden.
Fehlerbehebung
Verwenden Sie die folgende Tabelle, um häufige Fehler beim Arbeiten mit MAI-Bildmodellen zu beheben:
| Fehler | Ursache | Behebung |
|---|---|---|
401 Unauthorized |
Ungültiger API-Schlüssel oder abgelaufenes Token | Generieren Sie den Schlüssel im Azure Portal neu. Stellen Sie für Entra ID Authentifizierung sicher, dass der Tokenbereich https://cognitiveservices.azure.com/.default ist. |
404 Not Found |
Falsche Bereitstellungsname oder Endpunkt-URL | Überprüfen Sie den Bereitstellungsnamen und den Endpunkt im Foundry-Portal unter "Bereitstellungen". |
400 Bad Request |
width oder height unter dem Minimum, oder die Gesamtpixelanzahl überschreitet das Maximum |
Stellen Sie sicher, dass width und height jeweils mindestens 768 sind und dass width × height weniger als oder gleich 1.048.576 ist. |
429 Too Many Requests |
Ratelimit überschritten | Warten Und wiederholen Sie den Vorgang, oder fordern Sie eine Kontingenterhöhung an. |
Verantwortungsvolle KI-Überlegungen
Berücksichtigen Sie bei der Verwendung von MAI-Bildmodellen in Foundry die folgenden verantwortungsvollen KI-Praktiken:
- Beachten Sie bekannte Einschränkungen: Trotz technischer Maßnahmen wie Datenfilterung und Inhaltsklassifizierern, die auf Systemebene angewendet werden, können Bildgenerierungsmodelle basierend auf Benutzeranforderungen schädliche oder unerwartete Inhalte erzeugen. Häufige Risikobereiche sind gewaltsame oder blutrünstige Inhalte, sexuelle Inhalte oder Nacktheit, Darstellungen öffentlicher Personen und Replikation von Markenmaterialien oder anderen geschützten Materialien.
- Konfigurieren Sie die Sicherheit von Inhalten: Wenden Sie zusätzliche Gegenmaßnahmen an, die für Ihren Anwendungsfall geeignet sind, da kein generatives Modell gegen adversariale Eingabeaufforderungen immun ist.
- Einhaltung der geltenden Bedingungen: Stellen Sie sicher, dass Ihre Verwendung der generierten Bilder mit den Dienstleistungsbedingungen von Microsoft sowie den geltenden Urheberrechts- und geistigen Eigentumsgesetzen übereinstimmt.
- Seien Sie transparent: Geben Sie an, dass der Inhalt bei der Freigabe oder Veröffentlichung von Bildern KI-generiert ist.
- Vermeiden Sie schädliche Inhalte: Generieren Sie keine Inhalte, die schädlich, irreführend oder verletzung der Privatsphäre sein könnten.