Découvrez comment utiliser les modèles DALL-E

Article
04/12/2024

Les modèles DALL-E d’OpenAI génèrent des images basées sur des invites de texte fournies par l’utilisateur. Ce guide explique comment utiliser les modèles DALL-E et configurer leurs options via des appels d’API REST.

Prérequis

DALL-E 3
DALL-E 2 (préversion)

Un abonnement Azure. Créez-en un gratuitement.
Accès accordé à DALL-E dans l’abonnement Azure souhaité.
Une ressource Azure OpenAI créée dans la région SwedenCentral.
Ensuite, vous devez déployer un modèle dalle3 avec votre ressource Azure. Pour plus d’informations, consultez l’article Créer une ressource et déployer un modèle à l’aide d’Azure OpenAI.

Appeler les API de génération d’images

La commande suivante montre la façon la plus simple d’utiliser DALL-E avec du code. Si c’est la première fois que vous utilisez ces modèles par programmation, nous vous recommandons de commencer par notre Démarrage rapide DALL-E.

DALL-E 3
DALL-E 2 (préversion)

Envoyez une requête POST à :

https://<your_resource_name>.openai.azure.com/openai/deployments/<your_deployment_name>/images/generations?api-version=<api_version>

où :

<your_resource_name> est le nom de votre ressource Azure OpenAI.
<your_deployment_name> est le nom de votre déploiement de modèle DALL-E 3.
<api_version> est la version de l’API que vous voulez utiliser. Par exemple : 2024-02-01.

En-têtes obligatoires :

Content-Type: application/json
api-key: <your_API_key>

Corps :

Voici un exemple de corps de la requête. Vous spécifiez un certain nombre d’options, définies dans les sections ultérieures.

{
    "prompt": "A multi-colored umbrella on the beach, disposable camera",
    "size": "1024x1024", 
    "n": 1,
    "quality": "hd", 
    "style": "vivid"
}

La génération d’images avec DALL-E 2 est asynchrone et nécessite deux appels d’API.

Envoyez d’abord une requête POST à :

https://<your_resource_name>.openai.azure.com/openai/images/generations:submit?api-version=<api_version>

où :

<your_resource_name> est le nom de votre ressource Azure OpenAI.
<api_version> est la version de l’API que vous voulez utiliser. Par exemple : 2023-06-01-preview.

En-têtes obligatoires :

Content-Type: application/json
api-key: <your_API_key>

Corps :

Voici un exemple de corps de la requête. Vous spécifiez un certain nombre d’options, définies dans les sections ultérieures.

{
    "prompt": "a multi-colored umbrella on the beach, disposable camera",  
    "size": "1024x1024",
    "n": 1
}

L’opération retourne un code d’état 202 et un objet JSON contenant l’ID et l’état de l’opération.

{
  "id": "f508bcf2-e651-4b4b-85a7-58ad77981ffa",
  "status": "notRunning"
}

Pour récupérer les résultats de la génération d’images, envoyez une requête GET à :

GET https://<your_resource_name>.openai.azure.com/openai/operations/images/<operation_id>?api-version=<api_version>

où :

<your_resource_name> est le nom de votre ressource Azure OpenAI.
<operation_id> est l’ID de l’opération retournée à l’étape précédente.
<api_version> est la version de l’API que vous voulez utiliser. Par exemple : 2023-06-01-preview.

En-têtes obligatoires :

Content-Type: application/json
api-key: <your_API_key>

La réponse de cet appel d’API contient votre image générée.

Sortie

La sortie d’un appel d’API de génération d’images réussi ressemble à l’exemple ci-dessous. Le champ url contient une URL dans laquelle vous pouvez télécharger l’image générée. L’URL reste active pendant 24 heures.

DALL-E 3
DALL-E 2 (préversion)

{ 
    "created": 1698116662, 
    "data": [ 
        { 
            "url": "<URL_to_generated_image>",
            "revised_prompt": "<prompt_that_was_used>" 
        }
    ]
}

{
    "created": 1685130482,
    "expires": 1685216887,
    "id": "<operation_id>",
    "result":
    {
        "data":
        [
            {
                "url": "<URL_to_generated_image>"
            }
        ]
    },
    "status": "succeeded"
}

Refus d’appel API

Les invites et les images sont filtrées en fonction de notre stratégie de contenu, en retournant une erreur lorsqu’une invite ou une image est marquée.

Si votre invite est marquée, la valeur error.code du message est définie sur contentFilter. Voici un exemple :

DALL-E 3
DALL-E 2 (préversion)

{
    "created": 1698435368,
    "error":
    {
        "code": "contentFilter",
        "message": "Your task failed as a result of our safety system."
    }
}

{
   "created": 1589478378,
   "error": {
       "code": "contentFilter",
       "message": "Your task failed as a result of our safety system."
   },
   "id": "9484f239-9a05-41ba-997b-78252fec4b34",
   "status": "failed"
}

Il est également possible que l’image générée elle-même soit filtrée. Dans ce cas, le message d’erreur est défini sur Generated image was filtered as a result of our safety system.. Voici un exemple :

DALL-E 3
DALL-E 2 (préversion)

{
    "created": 1698435368,
    "error":
    {
        "code": "contentFilter",
        "message": "Generated image was filtered as a result of our safety system."
    }
}

{
   "created": 1589478378,
   "expires": 1589478399,
   "id": "9484f239-9a05-41ba-997b-78252fec4b34",
   "lastActionDateTime": 1589478378,
   "data": [
       {
           "url": "<URL_TO_IMAGE>"
       },
       {
           "error": {
               "code": "contentFilter",
               "message": "Generated image was filtered as a result of our safety system."
           }
       }
   ],
   "status": "succeeded"
}

Écriture d’invites d’images

Vos invites d’images doivent décrire le contenu que vous souhaitez voir dans l’image, ainsi que le style visuel de l’image.

Conseil

Pour un examen approfondi de la façon dont vous pouvez ajuster vos invites de texte pour générer différents types d’images, consultez le Livre d’invites Dallery DALL-E 2.

DALL-E 3
DALL-E 2 (préversion)

Lorsque vous écrivez des invites, considérez que les API de génération d’images sont fournies avec un filtre de modération de contenu. Si le service reconnaît votre invite comme étant du contenu nuisible, il ne génère pas d’image. Pour plus d’informations, consultez l’article Filtrage du contenu.

Transformation d’invites

DALL-E 3 inclut la réécriture d’invites intégrée pour améliorer les images, réduire les biais et augmenter la variation naturelle.

Exemple d’invite de texte	Exemple d’image générée sans transformation d’invites	Exemple d’image générée avec transformation d’invites
« Peinture en filigrane de la silhouette de Seattle »

L’invite mise à jour est visible dans le champ revised_prompt de l’objet de réponse de données.

Bien qu’il n’est actuellement pas possible de désactiver cette fonctionnalité, vous pouvez utiliser des invites spéciales pour rapprocher les sorties de votre invite d’origine en y ajoutant ce qui suit : I NEED to test how the tool works with extremely simple prompts. DO NOT add any detail, just use it AS-IS:.

Spécifier les options d’API

Les paramètres de corps d’API suivants sont disponibles pour la génération d’images DALL-E.

DALL-E 3
DALL-E 2 (préversion)

Taille

Spécifiez la taille des images générées. Doit être 1024x1024, 1792x1024 ou 1024x1792 pour les modèles DALL-E 3. Les images carrées sont plus rapides à générer.

Style

DALL-E 3 introduit deux options de style : natural et vivid. Le style natural ressemble davantage au style par défaut DALL-E 2, tandis que le style vivid génère plus d’images hyper-réelles et cinématographiques.

Le style natural est utile dans les cas où DALL-E 3 sur-exagère ou confond un sujet qui est destiné à être plus simple, sobre ou réaliste.

La valeur par défaut est vivid.

Contrôle

Il existe deux options pour la qualité de l’image : hd et standard. hd crée des images avec des détails plus fins et une plus grande cohérence dans l’image. Les images standard peuvent être générées plus rapidement.

La valeur par défaut est standard.

Number

Avec DALL-E 3, vous ne pouvez pas générer plusieurs images dans un seul appel d’API : le paramètre n doit être défini sur 1. Si vous devez générer plusieurs images à la fois, effectuez des demandes parallèles.

Format de la réponse

Format dans lequel les images générées sont retournées. Doit être url (URL pointant vers l’image) ou b64_json (code de base 64 octets au format JSON). Par défaut, il s’agit de url.

Partager via

Découvrez comment utiliser les modèles DALL-E

Prérequis

Appeler les API de génération d’images

Sortie

Refus d’appel API

Écriture d’invites d’images

Transformation d’invites

Spécifier les options d’API

Taille

Style

Contrôle

Number

Format de la réponse

Taille

Number

Étapes suivantes

Commentaires

Commentaires

Ressources supplémentaires