Déployer et utiliser des modèles d’images MAI dans Microsoft Foundry (préversion)

Les modèles d’image MAI sont une famille de modèles d’images développés par Microsoft IA qui fournissent une génération de texte à image de pointe et pour certains modèles, des modifications d’image à image. Ces modèles sont proposés dans le cadre de Microsoft Modèles Foundry vendus par Azure, fournissant un accès sécurisé et de qualité entreprise via Microsoft Foundry.

Dans cet article, vous allez apprendre à :

  • Déployer des modèles d’images MAI dans Microsoft Foundry
  • S’authentifier à l’aide de Microsoft Entra ID ou de clés API
  • Générer des images à l’aide de l’API générations d’images MAI
  • Exécuter une modification d’image à l’aide de l’API de modification d’image MAI

Les modèles d’images MAI dans Microsoft Foundry sont les suivants :

Nom du modèle Version du modèle Type
MAI-Image-2.5-Flash (Préversion) 2026-06-02 Génération de texte à image
Modifications d’image à image
MAI-Image-2.5 (Préversion) 2026-06-02 Génération de texte à image
Modifications d’image à image
MAI-Image-2e (Préversion) 2026-04-09 Génération de texte à image
MAI-Image-2 (Préversion) 2026-02-20 Génération de texte à image

Pour en savoir plus sur les modèles individuels, consultez Modèles d’image MAI disponibles.

Conditions préalables

  • Un abonnement Azure avec un mode de paiement valide. Si vous n'avez pas d'abonnement Azure, créez un compte de Azure payé.
  • Accès à Microsoft Foundry avec les autorisations appropriées pour créer et gérer des ressources.
  • Un projet Microsoft Foundry. Les modèles d’images MAI sont disponibles pour le déploiement standard global (USA Centre Ouest, USA Est, USA Ouest, Europe Ouest, Suède Centre, Inde Sud et ÉMIRATS Arabes Unis Nord).
  • Rôle de contributeur Cognitive Services sur la ressource Azure AI Foundry pour déployer des modèles. Pour plus d’informations, consultez rôles RBAC Azure.

Déployer des modèles d’image MAI

Pour déployer un modèle d’image MAI, suivez les instructions de Deploy Microsoft Foundry Models dans le portail Foundry.

Vous pouvez également déployer le modèle à l’aide de la Azure CLI. Le code suivant illustre le déploiement de MAI-Image-2.5. Pour déployer un autre modèle, remplacez le nom et la version du modèle dans les lignes --model-name MAI-Image-2.5 et --model-version 2026-06-02 par ceux du modèle souhaité.

Remplacez <ACCOUNT_NAME>, <RESOURCE_GROUP>, <DEPLOYMENT_NAME> par vos valeurs.

az cognitiveservices account deployment create \
  --name <ACCOUNT_NAME> \
  --resource-group <RESOURCE_GROUP> \
  --deployment-name <DEPLOYMENT_NAME> \
  --model-name "MAI-Image-2.5" \
  --model-format Microsoft \
  --model-version 2026-06-02 \
  --sku-name GlobalStandard \
  --sku-capacity 1

Référence :az cognitiveservices account deployment create

Pour répertorier tous les déploiements disponibles sur votre ressource :

az cognitiveservices account deployment list \ 
  --resource-group <RESOURCE_GROUP> \ 
  --name <ACCOUNT_NAME> \ 
  -o table 

Référence :az cognitiveservices account deployment list

Après le déploiement, utilisez le terrain de jeu Foundry pour tester de manière interactive le modèle.

Exécuter la génération de texte à image

L’exemple suivant montre comment générer une image à partir d’une invite de texte à l’aide d’un modèle d’image MAI avec l’API de génération d’images MAI.

Utiliser l’authentification par clé API

  1. Installez la requests bibliothèque :

    pip install requests
    
  2. Définissez des variables d’environnement :

    export AZURE_ENDPOINT="https://<resource-name>.services.ai.azure.com"
    export AZURE_API_KEY="<your-api-key>"
    export DEPLOYMENT_NAME="<your-deployment-name>"
    
  3. Exécutez le code suivant :

    import os
    import base64
    import requests
    
    endpoint = os.environ["AZURE_ENDPOINT"]
    api_key = os.environ["AZURE_API_KEY"]
    deployment_name = os.environ["DEPLOYMENT_NAME"]
    
    width = 1024
    height = 1024
    
    url = f"{endpoint}/mai/v1/images/generations"
    
    payload = {
        "model": deployment_name,
        "prompt": "A photorealistic concept art poster of a university at sunset, cinematic lighting",
        "width": width,
        "height": height
    }
    
    response = requests.post(
        url,
        headers={
            "Content-Type": "application/json",
            "api-key": api_key,
        },
        json=payload,
    )
    response.raise_for_status()
    
    result = response.json()
    print(result)
    
    image_data = [
        output
        for output in result.get("data", [])
        if "b64_json" in output
    ]
    
    if image_data:
        image_base64 = image_data[0]["b64_json"]
        output_path = "output.png"
        with open(output_path, "wb") as f:
            f.write(base64.b64decode(image_base64))
        print(f"Image saved to {output_path}")
    else:
        print("Unexpected response format:", result)
    

    Sortie attendue : Réponse JSON contenant les données d’image générées au format base64. L’image est décodée et enregistrée comme output.png dans le répertoire actif.

Utiliser l’authentification Microsoft Entra ID

Pour utiliser Microsoft Entra ID au lieu d’une clé API, remplacez l’en-tête api-key par un jeton du porteur obtenu à l’aide du DefaultAzureCredential :

  1. Installer la bibliothèque d’identités Azure :

    pip install azure-identity
    
  2. Mettez à jour les en-têtes de requête dans le code d’authentification de clé API :

    from azure.identity import DefaultAzureCredential, get_bearer_token_provider
    
    token_provider = get_bearer_token_provider(
        DefaultAzureCredential(), "https://cognitiveservices.azure.com/.default"
    )
    token = token_provider()
    
    headers = {
        "Content-Type": "application/json",
        "Authorization": f"Bearer {token}",
    }
    

    Reference :DefaultAzureCredential

Exécuter une modification d’image à image

L’exemple suivant montre comment effectuer une modification d’image à image à l’aide d’un modèle d’image MAI avec l’API de modification de l’image MAI.

MAI-Image-2.5-Flash (Aperçu) et MAI-Image-2.5 (Aperçu) prennent en charge les modifications d’image à partir d’une image à l’aide de l’API de modification d’image.

Note

Les demandes de modification d’image à image utilisent des données de formulaire à plusieurs parties.

Utiliser l’authentification par clé API

  1. Installez la requests bibliothèque :

    pip install requests
    
  2. Définissez des variables d’environnement :

    export AZURE_ENDPOINT="https://<resource-name>.services.ai.azure.com"
    export AZURE_API_KEY="<your-api-key>"
    export DEPLOYMENT_NAME="<your-deployment-name>"
    
  3. Exécutez le code suivant :

    import os
    import base64
    import requests
    
    endpoint = os.environ["AZURE_ENDPOINT"]
    api_key = os.environ["AZURE_API_KEY"]
    deployment_name = os.environ["DEPLOYMENT_NAME"]
    
    width = 1024
    height = 1024
    
    url = f"{endpoint}/mai/v1/images/edits"
    
    # Replace the file name and type.
    reference_image = <path_to_your_image.png>
    image_type = "image/png" # or "image/jpeg" based on format of your image. 
    
    files = [
        ("image", (reference_image, open(reference_image, "rb"), image_type))
    ]
    
    payload={
        "model": deployment_name,
        "prompt": "Turn this image into a clean futuristic product shot with studio lighting",
    }
    
    response = requests.post(
        url,
        headers={
            "api-key": api_key,
        },
        data=payload,
        files=files
    )
    
    response.raise_for_status()
    
    result = response.json()
    print(result)
    
    
    image_data = [
        output
        for output in result.get("data", [])
        if "b64_json" in output
    ]
    
    if image_data:
        image_base64 = image_data[0]["b64_json"]
        output_path = "output.png"
        with open(output_path, "wb") as f:
            f.write(base64.b64decode(image_base64))
        print(f"Image saved to {output_path}")
    else:
        print("Unexpected response format:", result)
    

    Sortie attendue : Réponse JSON contenant les données d’image modifiées au format base64. L’image est décodée et enregistrée comme output.png dans le répertoire actif.

Pour utiliser Microsoft Entra ID au lieu d’une clé API, modifiez ce code comme décrit dans la section précédente : Utiliser l’authentification Microsoft Entra ID.

Modèles d’image MAI disponibles

Foundry prend en charge l’utilisation de MAI-Image-2.5-Flash (préversion), MAI-Image-2.5 (préversion), MAI-Image-2 (préversion) et MAI-Image-2e (préversion). Chacun de ces modèles convient aux cas d’usage clés suivants :

  • Génération de texte à image : Générez des images de haute qualité à partir d’invites en langage naturel, ce qui permet aux utilisateurs de traduire des descriptions textuelles en sorties visuellement cohérentes adaptées à un large éventail de cas d’usage créatifs et de conception.
  • Synthèse d’images photoréalistes : Capable de générer des images réalistes avec une structure visuelle cohérente, ce qui le rend adapté aux scénarios de visualisation de concept et de création de contenu.
  • Produit, personnalisation et conception commerciale : Adapté aux images de produits, aux visuels marketing, aux ressources de marque et aux flux de travail créatifs commerciaux.

MAI-Image-2.5-Flash (Aperçu) et MAI-Image-2.5 (Aperçu) se distinguent encore davantage dans ces principaux cas d’usage :

  • Modification d’image à image : Prendre en charge des modifications précises et contrôlables sur des images existantes, notamment la suppression d’objets, le remplacement, les modifications d’attributs, l’inpainting, les mises à jour de texte et le nettoyage des artefacts tout en préservant la composition et la disposition.
  • Portraits haute fidélité : Générez des portraits expressifs et naturels avec une structure faciale précise, un éclairage et une texture précises.
  • Rendu de texte précis : Amélioration du rendu du texte dans les images générées, notamment les étiquettes, les affiches, l’empaquetage et la signalisation.
  • Raisonnement visuel : Raison entre les objets, la structure de scène, l’éclairage, l’échelle et le positionnement spatial pour produire des sorties cohérentes, même à partir d’invites ambiguës.

Pour plus d’informations sur les capacités des modèles, consultez les capacités des modèles Microsoft dans Modèles Foundry vendus par Azure.

MAI-Image-2.5-Flash (préversion)

MAI-Image-2.5-Flash (préversion) est un modèle de génération de texte à image et d’édition d’image à image conçu pour créer des images de haute qualité et visuellement riches à partir d’invites en langage naturel et pour effectuer des modifications précises et contrôlables sur des images existantes. Il utilise une approche générative basée sur la diffusion pour affiner progressivement les images, ce qui permet un alignement fort entre le texte d’entrée et la sortie générée. Le modèle est optimisé pour produire des images variées et cohérentes dans un large éventail de scénarios créatifs et de conception, ce qui le rend bien adapté aux tâches telles que la visualisation de concept, la génération de contenu créatif, les flux de travail d’édition d’images et la conception de production.

MAI-Image-2.5 (préversion)

MAI-Image-2.5 (préversion) est un modèle de génération de texte à image et de modification d’image à image conçu pour créer des images de haute qualité et visuellement riches à partir d’invites en langage naturel et pour effectuer des modifications précises et contrôlables sur des images existantes. Il utilise une approche générative basée sur la diffusion pour affiner progressivement les images, ce qui permet un alignement fort entre le texte d’entrée et la sortie générée. Le modèle excelle à des modifications chirurgicales précises et cohérentes, ce qui permet aux utilisateurs et aux développeurs de modifier des objets ciblés, d’adapter des dispositions, de mettre à jour du texte, de nettoyer des artefacts tels que le flou de mouvement et de préserver la cohérence visuelle entre les itérations.

MAI-Image-2e (préversion)

MAI-Image-2e (préversion) offre une génération d’images de haute qualité, tout comme MAI-Image-2, mais jusqu’à 22% plus rapide et quatre fois plus efficace que MAI-Image-2, ce qui en fait un choix intelligent pour les développeurs qui créent à grande échelle. MAI-Image-2e est mieux adapté aux scénarios à haut volume et à exécution rapide , par exemple, l’imagerie produit à grande échelle, les variantes marketing, les ressources de marque ou tout flux de travail où l’efficacité et le coût par image sont clés.

MAI-Image-2 (préversion)

MAI-Image-2 (aperçu) est un modèle de génération de texte à image conçu pour créer des images de haute qualité et visuellement riches à partir d’instructions en langage naturel. Il utilise une approche générative basée sur la diffusion pour affiner progressivement les images, ce qui permet un alignement fort entre le texte d’entrée et la sortie générée. Le modèle est optimisé pour produire des images variées et cohérentes dans un large éventail de scénarios créatifs et de conception, ce qui le rend bien adapté aux tâches telles que la visualisation de concept, la génération de contenu créatif et les flux de travail de conception d’images.

Points de terminaison d’API

Après avoir déployé un modèle d’image MAI, utilisez l’API générations d’images MAI pour générer des images et l’API de modification de l’image MAI pour les modifications d’image à image.

  • Point de terminaison de l’API de génération d’images : point de terminaison géré par Microsoft qui accepte une invite textuelle et renvoie une image PNG. Le point de terminaison d’API a la forme suivante :

    https://<resource-name>.services.ai.azure.com/mai/v1/images/generations
    
  • Image modifie le point de terminaison de l’API : point de terminaison géré par Microsoft qui accepte une image JPEG ou PNG et retourne une image PNG. Le point de terminaison d’API a la forme suivante :

    https://<resource-name>.services.ai.azure.com/mai/v1/images/edits
    

Pour vous authentifier, vous avez besoin de votre point de terminaison resource et d’un jeton Microsoft Entra ID ou d’une clé API. Vous trouverez ces valeurs dans la section Keys et Endpoint de votre ressource dans le portail Azure, ou dans la page des détails du déploiement dans le portail Foundry.

Paramètres de la demande

Le tableau suivant répertorie les paramètres de requête pour les API d’image :

Paramètre API Type Description
model Les deux string Nom de déploiement que vous avez affecté lorsque vous avez déployé le modèle.
prompt Les deux string Instruction textuelle qui décrit l’image à générer ou les modifications à apporter.
Longueur maximale du contexte : 32 000 jetons.
image Modifications d’image string Chemin d’accès à l’image à modifier. L’image est transmise sous forme de données de formulaire multipartites. Doit être au format JPEG ou PNG.
width Générations d’images Entier Largeur de l’image de sortie en pixels.
Minimum : 768. Le produit de width × height ne doit pas dépasser 1 048 576.
height Générations d’images Entier Hauteur de l’image de sortie en pixels.
Minimum : 768. Le produit de width × height ne doit pas dépasser 1 048 576.

Note

Le format de sortie est toujours PNG. Le nombre maximal de pixels est de 1 048 576 (équivalent à 1024×1024). Les deux width et height doivent être au moins 768 pixels chacun. L’une ou l’autre dimension peut dépasser 1024 tant que le nombre total de pixels reste dans la limite.

Quotas et limites d’API

Les modèles image MAI ont les limites de débit suivantes mesurées en demandes par minute (RPM). Le niveau disponible dépend de votre abonnement et de votre configuration de déploiement.

Type de déploiement Niveau MAI-Image-2.5-Flash
(RPM)
MAI-Image-2.5
(RPM)
MAI-Image-2e
(RPM)
MAI-Image-2
(RPM)
Standard global 0
(Gratuit)
0 0 0 0
Standard global 1 2 2 18 9
Standard global 2 4 4 30 15
Standard global 3 6 6 60 30
Standard global 4 8 8 90 45
Standard global 5 10 10 120 60
Standard global 6 12 12 180 90

Pour demander une augmentation de quota, envoyez le formulaire de demande d’augmentation de quota. Les demandes sont traitées dans l’ordre dans lequel elles sont reçues et la priorité est accordée aux clients qui utilisent activement leur allocation de quota existante.

Dépanner

Utilisez le tableau suivant pour résoudre les erreurs courantes lors de l’utilisation des modèles d’image MAI :

Erreur Cause Correction
401 Unauthorized Clé API non valide ou jeton expiré Régénérez la clé dans le portail Azure. Pour l’authentification Entra ID, vérifiez que l’étendue du jeton est https://cognitiveservices.azure.com/.default.
404 Not Found Nom de déploiement ou URL de point de terminaison incorrects Vérifiez le nom et le point de terminaison du déploiement dans le portail Foundry sous Déploiements.
400 Bad Request width ou height au-dessous du nombre de pixels minimal ou total dépasse le nombre maximal Assurez-vous que width et height soient chacun d’au moins 768, et que width × height ≤ 1 048 576.
429 Too Many Requests Limite de débit dépassée Attendez et réessayez ou demandez une augmentation du quota.

Considérations relatives à l’IA responsable

Lorsque vous utilisez des modèles d’images MAI dans Foundry, tenez compte des pratiques d’IA responsables suivantes :

  • Tenez compte des limitations connues : malgré les atténuations techniques telles que le filtrage des données et les classifieurs de contenu appliqués au niveau du système, les modèles de génération d’images peuvent produire du contenu dangereux ou inattendu en fonction des demandes des utilisateurs. Les zones à risque courantes incluent le contenu violent ou gory, le contenu sexuel ou la nudité, les représentations des personnalités publiques et la réplication de marques déposées ou d’autres documents protégés.
  • Configurez la sécurité du contenu : appliquez des atténuations supplémentaires appropriées à votre cas d’usage, car aucun modèle dégénératif n’est immunitaire aux invites contradictoires.
  • Conformez-vous aux conditions applicables : Assurez-vous que votre utilisation d'images générées est conforme aux conditions d'utilisation de Microsoft et aux lois applicables en matière de droits d'auteur et de propriété intellectuelle.
  • Soyez transparent : divulguer que le contenu est généré par l’IA lors du partage ou de la publication d’images.
  • Évitez le contenu dangereux : ne générez pas de contenu susceptible d’être dangereux, trompeur ou en violation de la vie privée.