Découvrez comment utiliser les modèles DALL-E
Les modèles DALL-E d’OpenAI génèrent des images basées sur des invites de texte fournies par l’utilisateur. Ce guide explique comment utiliser les modèles DALL-E et configurer leurs options via des appels d’API REST.
Prérequis
- Un abonnement Azure. Créez-en un gratuitement.
- Accès accordé à DALL-E dans l’abonnement Azure souhaité.
- Une ressource Azure OpenAI créée dans la région
SwedenCentral
. - Ensuite, vous devez déployer un modèle
dalle3
avec votre ressource Azure. Pour plus d’informations, consultez l’article Créer une ressource et déployer un modèle à l’aide d’Azure OpenAI.
Appeler les API de génération d’images
La commande suivante montre la façon la plus simple d’utiliser DALL-E avec du code. Si c’est la première fois que vous utilisez ces modèles par programmation, nous vous recommandons de commencer par notre Démarrage rapide DALL-E.
Envoyez une requête POST à :
https://<your_resource_name>.openai.azure.com/openai/deployments/<your_deployment_name>/images/generations?api-version=<api_version>
où :
<your_resource_name>
est le nom de votre ressource Azure OpenAI.<your_deployment_name>
est le nom de votre déploiement de modèle DALL-E 3.<api_version>
est la version de l’API que vous voulez utiliser. Par exemple :2024-02-01
.
En-têtes obligatoires :
Content-Type
:application/json
api-key
:<your_API_key>
Corps :
Voici un exemple de corps de la requête. Vous spécifiez un certain nombre d’options, définies dans les sections ultérieures.
{
"prompt": "A multi-colored umbrella on the beach, disposable camera",
"size": "1024x1024",
"n": 1,
"quality": "hd",
"style": "vivid"
}
Sortie
La sortie d’un appel d’API de génération d’images réussi ressemble à l’exemple ci-dessous. Le champ url
contient une URL dans laquelle vous pouvez télécharger l’image générée. L’URL reste active pendant 24 heures.
{
"created": 1698116662,
"data": [
{
"url": "<URL_to_generated_image>",
"revised_prompt": "<prompt_that_was_used>"
}
]
}
Refus d’appel API
Les invites et les images sont filtrées en fonction de notre stratégie de contenu, en retournant une erreur lorsqu’une invite ou une image est marquée.
Si votre invite est marquée, la valeur error.code
du message est définie sur contentFilter
. Voici un exemple :
{
"created": 1698435368,
"error":
{
"code": "contentFilter",
"message": "Your task failed as a result of our safety system."
}
}
Il est également possible que l’image générée elle-même soit filtrée. Dans ce cas, le message d’erreur est défini sur Generated image was filtered as a result of our safety system.
. Voici un exemple :
{
"created": 1698435368,
"error":
{
"code": "contentFilter",
"message": "Generated image was filtered as a result of our safety system."
}
}
Écriture d’invites d’images
Vos invites d’images doivent décrire le contenu que vous souhaitez voir dans l’image, ainsi que le style visuel de l’image.
Conseil
Pour un examen approfondi de la façon dont vous pouvez ajuster vos invites de texte pour générer différents types d’images, consultez le Livre d’invites Dallery DALL-E 2.
Lorsque vous écrivez des invites, considérez que les API de génération d’images sont fournies avec un filtre de modération de contenu. Si le service reconnaît votre invite comme étant du contenu nuisible, il ne génère pas d’image. Pour plus d’informations, consultez l’article Filtrage du contenu.
Transformation d’invites
DALL-E 3 inclut la réécriture d’invites intégrée pour améliorer les images, réduire les biais et augmenter la variation naturelle.
Exemple d’invite de texte | Exemple d’image générée sans transformation d’invites | Exemple d’image générée avec transformation d’invites |
---|---|---|
« Peinture en filigrane de la silhouette de Seattle » | ![]() |
![]() |
L’invite mise à jour est visible dans le champ revised_prompt
de l’objet de réponse de données.
Bien qu’il n’est actuellement pas possible de désactiver cette fonctionnalité, vous pouvez utiliser des invites spéciales pour rapprocher les sorties de votre invite d’origine en y ajoutant ce qui suit : I NEED to test how the tool works with extremely simple prompts. DO NOT add any detail, just use it AS-IS:
.
Spécifier les options d’API
Les paramètres de corps d’API suivants sont disponibles pour la génération d’images DALL-E.
Taille
Spécifiez la taille des images générées. Doit être 1024x1024
, 1792x1024
ou 1024x1792
pour les modèles DALL-E 3. Les images carrées sont plus rapides à générer.
Style
DALL-E 3 introduit deux options de style : natural
et vivid
. Le style natural
ressemble davantage au style par défaut DALL-E 2, tandis que le style vivid
génère plus d’images hyper-réelles et cinématographiques.
Le style natural
est utile dans les cas où DALL-E 3 sur-exagère ou confond un sujet qui est destiné à être plus simple, sobre ou réaliste.
La valeur par défaut est vivid
.
Contrôle
Il existe deux options pour la qualité de l’image : hd
et standard
. hd
crée des images avec des détails plus fins et une plus grande cohérence dans l’image. Les images standard
peuvent être générées plus rapidement.
La valeur par défaut est standard
.
Number
Avec DALL-E 3, vous ne pouvez pas générer plusieurs images dans un seul appel d’API : le paramètre n doit être défini sur 1
. Si vous devez générer plusieurs images à la fois, effectuez des demandes parallèles.
Format de la réponse
Format dans lequel les images générées sont retournées. Doit être url
(URL pointant vers l’image) ou b64_json
(code de base 64 octets au format JSON). Par défaut, il s’agit de url
.
Étapes suivantes
Commentaires
https://aka.ms/ContentUserFeedback.
Bientôt disponible : pendant toute l’année 2024, nous allons éliminer progressivement Problèmes GitHub comme mécanisme de commentaires pour le contenu et le remplacer par un nouveau système de commentaires. Pour plus d’informations, voir :Soumettre et afficher des commentaires pour