Bereitstellen und Verwenden von MAI-Imagemodellen in Microsoft Foundry (Vorschau)

MAI Image-Modelle sind eine von Microsoft AI entwickelte Familie von Bildmodellen, die modernste Text-zu-Bild-Generierung und bei einigen Modellen Bild-zu-Bild-Bearbeitungen ermöglichen. Diese Modelle werden im Rahmen von Microsoft Foundry Models angeboten, die von Azure verkauft werden, und bieten einen sicheren Zugriff auf Unternehmensniveau über Microsoft Foundry.

In diesem Artikel erfahren Sie, wie Sie:

  • Bereitstellen von MAI-Imagemodellen in Microsoft Foundry
  • Authentifizieren mithilfe von Microsoft Entra ID oder API-Schlüsseln
  • Generieren von Bildern mithilfe der MAI-Bildgenerierungs-API
  • Ausführen einer Bildbearbeitung mithilfe der MAI-Bildbearbeitungs-API

MAI-Bildmodelle in Microsoft Foundry umfassen:

Modellname Modellversion Typ
MAI-Image-2.5-Flash (Vorschau) 2026-06-02 Text-zu-Bild-Generierung
Bild-zu-Bild-Bearbeitungen
MAI-Image-2.5 (Vorschau) 2026-06-02 Text-zu-Bild-Generierung
Bild-zu-Bild-Bearbeitungen
MAI-Image-2e (Vorschau) 2026-04-09 Text-zu-Bild-Generierung
MAI-Image-2 (Vorschau) 2026-02-20 Text-zu-Bild-Generierung

Weitere Informationen zu den einzelnen Modellen finden Sie unter Verfügbare MAI-Bildmodelle.

Voraussetzungen

  • Ein Azure-Abonnement mit einer gültigen Zahlungsmethode. Wenn Sie kein Azure-Abonnement haben, erstellen Sie ein paid Azure Konto.
  • Zugriff auf Microsoft Foundry mit entsprechenden Berechtigungen zum Erstellen und Verwalten von Ressourcen.
  • Ein Microsoft Foundry-Projekt. MAI-Imagemodelle sind für die globale Standardbereitstellung (West Central US, Ost-USA, West-USA, Westeuropa, Schweden Mittel- und Südindien und VAE Nord) verfügbar.
  • Rolle Cognitive Services Contributor in der Azure AI Foundry -Ressource zum Bereitstellen von Modellen. Weitere Informationen finden Sie unter Azure RBAC-Rollen.

Bereitstellen von MAI-Imagemodellen

Um ein MAI-Imagemodell bereitzustellen, befolgen Sie die Anweisungen in Deploy Microsoft Foundry Models im Foundry-Portal.

Alternativ können Sie das Modell mithilfe der Azure CLI bereitstellen. Der folgende Code zeigt die Bereitstellung von MAI-Image-2.5. Um ein anderes Modell bereitzustellen, ersetzen Sie den Modellnamen und die Version in den Zeilen --model-name MAI-Image-2.5 und --model-version 2026-06-02 durch die Werte für Ihr gewünschtes Modell.

Ersetzen Sie <ACCOUNT_NAME>, , <RESOURCE_GROUP><DEPLOYMENT_NAME> durch Ihre Werte.

az cognitiveservices account deployment create \
  --name <ACCOUNT_NAME> \
  --resource-group <RESOURCE_GROUP> \
  --deployment-name <DEPLOYMENT_NAME> \
  --model-name "MAI-Image-2.5" \
  --model-format Microsoft \
  --model-version 2026-06-02 \
  --sku-name GlobalStandard \
  --sku-capacity 1

Referenz:az cognitiveservices account deployment delete

So listen Sie alle verfügbaren Bereitstellungen für Ihre Ressource auf:

az cognitiveservices account deployment list \ 
  --resource-group <RESOURCE_GROUP> \ 
  --name <ACCOUNT_NAME> \ 
  -o table 

Referenz:az cognitiveservices account deployment list

Verwenden Sie nach der Bereitstellung den Foundry-Playground , um das Modell interaktiv zu testen.

Text-zu-Bild-Generierung ausführen

Das folgende Beispiel zeigt, wie Sie ein Bild aus einer Textaufforderung mithilfe eines MAI-Bildmodells mit der MAI-Bildgenerierungs-API generieren.

Verwenden der API-Schlüsselauthentifizierung

  1. Installieren Sie die requests Bibliothek:

    pip install requests
    
  2. Festlegen von Umgebungsvariablen:

    export AZURE_ENDPOINT="https://<resource-name>.services.ai.azure.com"
    export AZURE_API_KEY="<your-api-key>"
    export DEPLOYMENT_NAME="<your-deployment-name>"
    
  3. Führen Sie den folgenden Code aus:

    import os
    import base64
    import requests
    
    endpoint = os.environ["AZURE_ENDPOINT"]
    api_key = os.environ["AZURE_API_KEY"]
    deployment_name = os.environ["DEPLOYMENT_NAME"]
    
    width = 1024
    height = 1024
    
    url = f"{endpoint}/mai/v1/images/generations"
    
    payload = {
        "model": deployment_name,
        "prompt": "A photorealistic concept art poster of a university at sunset, cinematic lighting",
        "width": width,
        "height": height
    }
    
    response = requests.post(
        url,
        headers={
            "Content-Type": "application/json",
            "api-key": api_key,
        },
        json=payload,
    )
    response.raise_for_status()
    
    result = response.json()
    print(result)
    
    image_data = [
        output
        for output in result.get("data", [])
        if "b64_json" in output
    ]
    
    if image_data:
        image_base64 = image_data[0]["b64_json"]
        output_path = "output.png"
        with open(output_path, "wb") as f:
            f.write(base64.b64decode(image_base64))
        print(f"Image saved to {output_path}")
    else:
        print("Unexpected response format:", result)
    

    Erwartete Ausgabe: Eine JSON-Antwort, die die generierten Bilddaten im Base64-Format enthält. Das Bild wird decodiert und als output.png im aktuellen Verzeichnis gespeichert.

Verwenden Sie die Microsoft Entra ID-Authentifizierung

Um Microsoft Entra ID anstelle eines API-Schlüssels zu verwenden, ersetzen Sie den header api-key durch ein Bearertoken, das mit dem DefaultAzureCredential abgerufen wird:

  1. Installieren Sie die Azure Identity library:

    pip install azure-identity
    
  2. Aktualisieren Sie die Anforderungsheader im API-Schlüsselauthentifizierungscode:

    from azure.identity import DefaultAzureCredential, get_bearer_token_provider
    
    token_provider = get_bearer_token_provider(
        DefaultAzureCredential(), "https://cognitiveservices.azure.com/.default"
    )
    token = token_provider()
    
    headers = {
        "Content-Type": "application/json",
        "Authorization": f"Bearer {token}",
    }
    

    Reference:DefaultAzureCredential

Führe eine Bild-zu-Bild-Bearbeitung durch

Das folgende Beispiel zeigt, wie Sie eine Bild-zu-Bild-Bearbeitung mithilfe eines MAI-Bildmodells mit der MAI-Bildbearbeitungs-API ausführen.

MAI-Image-2.5-Flash (Vorschau) und MAI-Image-2.5 (Vorschau) unterstützen Bild-zu-Bild-Bearbeitungen mithilfe der Bildbearbeitungs-API.

Hinweis

Anforderungen für Bild-zu-Bild-Bearbeitungen verwenden mehrteilige Formulardaten.

Verwenden der API-Schlüsselauthentifizierung

  1. Installieren Sie die requests Bibliothek:

    pip install requests
    
  2. Festlegen von Umgebungsvariablen:

    export AZURE_ENDPOINT="https://<resource-name>.services.ai.azure.com"
    export AZURE_API_KEY="<your-api-key>"
    export DEPLOYMENT_NAME="<your-deployment-name>"
    
  3. Führen Sie den folgenden Code aus:

    import os
    import base64
    import requests
    
    endpoint = os.environ["AZURE_ENDPOINT"]
    api_key = os.environ["AZURE_API_KEY"]
    deployment_name = os.environ["DEPLOYMENT_NAME"]
    
    width = 1024
    height = 1024
    
    url = f"{endpoint}/mai/v1/images/edits"
    
    # Replace the file name and type.
    reference_image = <path_to_your_image.png>
    image_type = "image/png" # or "image/jpeg" based on format of your image. 
    
    files = [
        ("image", (reference_image, open(reference_image, "rb"), image_type))
    ]
    
    payload={
        "model": deployment_name,
        "prompt": "Turn this image into a clean futuristic product shot with studio lighting",
    }
    
    response = requests.post(
        url,
        headers={
            "api-key": api_key,
        },
        data=payload,
        files=files
    )
    
    response.raise_for_status()
    
    result = response.json()
    print(result)
    
    
    image_data = [
        output
        for output in result.get("data", [])
        if "b64_json" in output
    ]
    
    if image_data:
        image_base64 = image_data[0]["b64_json"]
        output_path = "output.png"
        with open(output_path, "wb") as f:
            f.write(base64.b64decode(image_base64))
        print(f"Image saved to {output_path}")
    else:
        print("Unexpected response format:", result)
    

    Erwartete Ausgabe: Eine JSON-Antwort, die die bearbeiteten Bilddaten im Base64-Format enthält. Das Bild wird decodiert und als output.png im aktuellen Verzeichnis gespeichert.

Wenn Sie Microsoft Entra ID anstelle eines API-Schlüssels verwenden möchten, ändern Sie diesen Code wie im vorherigen Abschnitt beschrieben: Use Microsoft Entra ID authentication.

Verfügbare MAI-Bildmodelle

Foundry unterstützt die Verwendung von MAI-Image-2.5-Flash (Vorschau), MAI-Image-2.5 (Vorschau), MAI-Image-2 (Vorschau) und MAI-Image-2e (Vorschau). Jedes dieser Modelle eignet sich für die folgenden wichtigen Anwendungsfälle:

  • Text-zu-Bild-Generierung: Generieren Sie qualitativ hochwertige Bilder aus Aufforderungen in natürlicher Sprache, sodass Benutzer Textbeschreibungen in visuell kohärente Ausgaben übersetzen können, die für eine breite Palette von Kreativen und Design-Anwendungsfällen geeignet sind.
  • Photorealistische Bildsynthese: In der Lage, realistische Bilder mit konsistenter visueller Struktur zu generieren, sodass sie für Konzeptvisualisierungs- und Inhaltserstellungsszenarien geeignet ist.
  • Produkt-, Branding- und kommerzielles Design: Gut geeignet für Produktbilder, Marketingvisuale, Markenobjekte und kommerzielle kreative Workflows.

MAI-Image-2.5-Flash (Vorschau) und MAI-Image-2.5 (Vorschau) zeichnen sich darüber hinaus in diesen zentralen Anwendungsfällen aus:

  • Bild-zu-Bild-Bearbeitung: Unterstützen Sie präzise, steuerbare Bearbeitungen für vorhandene Bilder, einschließlich Objektentfernung, Ersetzung, Attributänderungen, Inpainting, Textaktualisierungen und Artefaktbereinigung, während Komposition und Layout beibehalten werden.
  • High-Fidelity-Porträts: Generieren Sie ausdrucksstarke, natürlich aussehende Porträts mit präziser Gesichtsstruktur, Beleuchtung und Textur.
  • Präzises Rendern von Text: Verbessertes Rendern von Text in generierten Bildern, einschließlich Etiketten, Postern, Verpackungen und Beschilderung.
  • Visuelles Schlussfolgern: Schlussfolgern über Objekte, Szenenstruktur, Beleuchtung, Größenverhältnisse und räumliche Anordnung hinweg, um selbst bei mehrdeutigen Prompts konsistente Ausgaben zu erzeugen.

Weitere Informationen zu den Funktionen der Microsoft-Modelle finden Sie unter Foundry Models, die von Azure angeboten werden.

MAI-Image-2.5-Flash (Vorschau)

MAI-Image-2.5-Flash (Vorschau) ist ein Text-zu-Bild-Generierungs- und Bild-zu-Bild-Bearbeitungsmodell, das entwickelt wurde, um qualitativ hochwertige, visuell ansprechende Bilder aus Aufforderungen in natürlicher Sprache zu erstellen und präzise, steuerbare Bearbeitungen für vorhandene Bilder durchzuführen. Es verwendet einen diffusionsbasierten generativen Ansatz, um Bilder schrittweise zu verfeinern und eine starke Ausrichtung zwischen dem Eingabetext und der generierten Ausgabe zu ermöglichen. Das Modell ist optimiert, um vielfältige und kohärente Bilder in einer breiten Palette von kreativen und Designszenarien zu erzeugen, sodass es gut für Aufgaben wie Konzeptvisualisierung, kreative Inhaltsgenerierung, Bildbearbeitungsworkflows und Produktionsdesign geeignet ist.

MAI-Image-2.5 (Vorschau)

MAI-Image-2.5 (Vorschau) ist ein Text-zu-Bild-Generierungs- und Bild-zu-Bild-Bearbeitungsmodell, das entwickelt wurde, um qualitativ hochwertige, visuell ansprechende Bilder aus Aufforderungen in natürlicher Sprache zu erstellen und präzise, steuerbare Bearbeitungen für vorhandene Bilder durchzuführen. Es verwendet einen diffusionsbasierten generativen Ansatz, um Bilder schrittweise zu verfeinern und eine starke Ausrichtung zwischen dem Eingabetext und der generierten Ausgabe zu ermöglichen. Das Modell zeichnet sich in präzisen, chirurgischen Bearbeitungen mit Konsistenz aus – ermöglicht Es Benutzern und Entwicklern, gezielte Objektbearbeitungen vorzunehmen, Layouts anzupassen, Text zu aktualisieren, Artefakte wie Bewegungsunschärfe zu bereinigen und visuelle Konsistenz über Iterationen hinweg zu erhalten.

MAI-Image-2e (Vorschau)

MAI-Image-2e (Vorschau) bietet eine qualitativ hochwertige Bildgenerierung, genau wie MAI-Image-2, aber bis zu 22% schneller und viermal effizienter als MAI-Image-2, wodurch es eine intelligente Wahl für Entwickler ist, die im Maßstab erstellen. MAI-Image-2e eignet sich am besten für großvolumige, schnelle Bearbeitungsszenarien – z. B. Produktbilder im Maßstab, Marketingvariationen, Brandingobjekte oder workflows, bei denen Effizienz und Kosten pro Bild entscheidend sind.

MAI-Image-2 (Vorschau)

MAI-Image-2 (Vorschau) ist ein Text-zu-Bild-Generierungsmodell, das entwickelt wurde, um qualitativ hochwertige, visuell ansprechende Bilder aus Aufforderungen in natürlicher Sprache zu erstellen. Es verwendet einen diffusionsbasierten generativen Ansatz, um Bilder schrittweise zu verfeinern und eine starke Ausrichtung zwischen dem Eingabetext und der generierten Ausgabe zu ermöglichen. Das Modell ist optimiert, um vielfältige und kohärente Bilder in einer breiten Palette von kreativen und Designszenarien zu erzeugen, sodass es gut für Aufgaben wie Konzeptvisualisierung, kreative Inhaltsgenerierung und Bildentwurfsworkflows geeignet ist.

API-Endpunkte

Nachdem Sie ein MAI-Imagemodell bereitgestellt haben, verwenden Sie die MAI-Bildgenerierungs-API , um Bilder und die MAI-Bildbearbeitungs-API für Bild-zu-Bild-Bearbeitungen zu generieren.

  • API-Endpunkt für die Bildgenerierung: Ein von Microsoft verwalteter Endpunkt, der einen Textprompt akzeptiert und ein PNG-Bild zurückgibt. Der API-Endpunkt hat das folgende Formular:

    https://<resource-name>.services.ai.azure.com/mai/v1/images/generations
    
  • Image bearbeitet API-Endpunkt: Ein Microsoft verwalteter Endpunkt, der ein JPEG- oder PNG-Bild akzeptiert und ein PNG-Bild zurückgibt. Der API-Endpunkt hat das folgende Formular:

    https://<resource-name>.services.ai.azure.com/mai/v1/images/edits
    

Zum Authentifizieren benötigen Sie Ihren ressourcenendpunkt und entweder ein Microsoft Entra ID-Token oder einen API-Schlüssel. Sie finden diese Werte im Abschnitt Keys und Endpoint Ihrer Ressource im Azure-Portal oder auf der Seite mit den Bereitstellungsdetails im Foundry-Portal.

Anforderungsparameter

In der folgenden Tabelle sind die Anforderungsparameter für die Bild-APIs aufgeführt:

Parameter API Typ Beschreibung
model Beides Schnur Der Bereitstellungsname, den Sie beim Bereitstellen des Modells zugewiesen haben.
prompt Beides Schnur Der Textprompt, der das zu erzeugende Bild oder die vorzunehmenden Bearbeitungen beschreibt.
Maximale Kontextlänge: 32.000 Token.
image Bildbearbeitungen Schnur Der Pfad zum Bild, das Sie bearbeiten möchten. Das Bild wird als mehrteilige Formulardaten übergeben. Muss im JPEG- oder PNG-Format vorliegen.
width Bildgenerationen Ganzzahl Breite des Ausgabebilds in Pixeln.
Mindestwert: 768. Das Produkt von width × height darf 1.048.576 nicht überschreiten.
height Bildgenerationen Ganzzahl Höhe des Ausgabebilds in Pixeln.
Mindestwert: 768. Das Produkt von width × height darf 1.048.576 nicht überschreiten.

Hinweis

Das Ausgabeformat ist immer PNG. Die maximale Gesamtpixelanzahl beträgt 1.048.576 (entspricht 1024×1024). Sowohl width als auch height müssen jeweils mindestens 768 Pixel groß sein. Beide Dimensionen können 1024 überschreiten, solange die Gesamtpixelanzahl innerhalb des Grenzwerts bleibt.

API-Kontingente und -Grenzwerte

MAI-Bildmodelle weisen die folgenden Geschwindigkeitsgrenzwerte auf, die in Anforderungen pro Minute (RPM) gemessen werden. Die für Sie verfügbare Stufe hängt von Ihrer Abonnement- und Bereitstellungskonfiguration ab.

Bereitstellungstyp Tarif MAI-Image-2.5-Flash
(RPM)
MAI-Image-2.5
(RPM)
MAI-Image-2e
(RPM)
MAI-Image-2
(RPM)
Globaler Standard 0
(Kostenlos)
0 0 0 0
Globaler Standard 1 2 2 18 9
Globaler Standard 2 4 4 30 15
Globaler Standard 3 6 6 60 30
Globaler Standard 4 8 8 90 45
Globaler Standard 5 10 10 120 60
Globaler Standard 6 12 12 180 90

Um eine Kontingenterhöhung anzufordern, übermitteln Sie das Anforderungsformular für die Kontingenterhöhung. Anforderungen werden in der Reihenfolge verarbeitet, in der sie empfangen werden, und Priorität geht an Kunden, die ihre vorhandene Kontingentzuweisung aktiv verwenden.

Fehlerbehebung

Verwenden Sie die folgende Tabelle, um häufige Fehler beim Arbeiten mit MAI-Bildmodellen zu beheben:

Fehler Ursache Behebung
401 Unauthorized Ungültiger API-Schlüssel oder abgelaufenes Token Generieren Sie den Schlüssel im Azure Portal neu. Stellen Sie für Entra ID Authentifizierung sicher, dass der Tokenbereich https://cognitiveservices.azure.com/.default ist.
404 Not Found Falsche Bereitstellungsname oder Endpunkt-URL Überprüfen Sie den Bereitstellungsnamen und den Endpunkt im Foundry-Portal unter "Bereitstellungen".
400 Bad Request width oder height unter dem Minimum, oder die Gesamtpixelanzahl überschreitet das Maximum Stellen Sie sicher, dass width und height jeweils mindestens 768 sind und dass width × height weniger als oder gleich 1.048.576 ist.
429 Too Many Requests Ratelimit überschritten Warten Und wiederholen Sie den Vorgang, oder fordern Sie eine Kontingenterhöhung an.

Verantwortungsvolle KI-Überlegungen

Berücksichtigen Sie bei der Verwendung von MAI-Bildmodellen in Foundry die folgenden verantwortungsvollen KI-Praktiken:

  • Beachten Sie bekannte Einschränkungen: Trotz technischer Maßnahmen wie Datenfilterung und Inhaltsklassifizierern, die auf Systemebene angewendet werden, können Bildgenerierungsmodelle basierend auf Benutzeranforderungen schädliche oder unerwartete Inhalte erzeugen. Häufige Risikobereiche sind gewaltsame oder blutrünstige Inhalte, sexuelle Inhalte oder Nacktheit, Darstellungen öffentlicher Personen und Replikation von Markenmaterialien oder anderen geschützten Materialien.
  • Konfigurieren Sie die Sicherheit von Inhalten: Wenden Sie zusätzliche Gegenmaßnahmen an, die für Ihren Anwendungsfall geeignet sind, da kein generatives Modell gegen adversariale Eingabeaufforderungen immun ist.
  • Einhaltung der geltenden Bedingungen: Stellen Sie sicher, dass Ihre Verwendung der generierten Bilder mit den Dienstleistungsbedingungen von Microsoft sowie den geltenden Urheberrechts- und geistigen Eigentumsgesetzen übereinstimmt.
  • Seien Sie transparent: Geben Sie an, dass der Inhalt bei der Freigabe oder Veröffentlichung von Bildern KI-generiert ist.
  • Vermeiden Sie schädliche Inhalte: Generieren Sie keine Inhalte, die schädlich, irreführend oder verletzung der Privatsphäre sein könnten.