Aprenda a trabajar con los modelos DALL-E
Los modelos DALL-E de OpenAI generan imágenes basadas en mensajes de texto proporcionados por el usuario. En esta guía se muestra cómo usar los modelos DALL-E y configurar sus opciones a través de llamadas a la API de REST.
Requisitos previos
- Suscripción a Azure. cree una de forma gratuita.
- Un recurso de Azure OpenAI creado en la región
SwedenCentral
. - Después, debe implementar un modelo de
dalle3
con el recurso de Azure. Para obtener más información, consulte Creación de un recurso e implementación de un modelo con Azure OpenAI.
Llamada a las API de generación de imágenes
El siguiente comando muestra la forma más básica de usar DALL-E con código. Si es la primera vez que usa estos modelos de forma programada, le recomendamos que empiece con Inicio rápido de DALL-E.
Envíe una solicitud POST a:
https://<your_resource_name>.openai.azure.com/openai/deployments/<your_deployment_name>/images/generations?api-version=<api_version>
donde:
<your_resource_name>
es el nombre del recurso de Azure OpenAI.<your_deployment_name>
es el nombre de la implementación del modelo DALL-E 3.<api_version>
es la versión de la API que desea usar. Por ejemplo,2024-02-01
.
Encabezados obligatorios:
Content-Type
:application/json
api-key
:<your_API_key>
Cuerpo:
A continuación se muestra un cuerpo de solicitud de ejemplo. Especifique una serie de opciones, definidas en secciones posteriores.
{
"prompt": "A multi-colored umbrella on the beach, disposable camera",
"size": "1024x1024",
"n": 1,
"quality": "hd",
"style": "vivid"
}
Output
La salida de una llamada API de generación de imágenes correcta tiene un aspecto similar al siguiente ejemplo. El campo url
contiene una dirección URL donde puede descargar la imagen generada. La dirección URL permanece activa durante 24 horas.
{
"created": 1698116662,
"data": [
{
"url": "<URL_to_generated_image>",
"revised_prompt": "<prompt_that_was_used>"
}
]
}
Rechazo de llamadas API
Las solicitudes e imágenes se filtran en función de nuestra directiva de contenido, devolviendo un error cuando se marca una solicitud o una imagen.
Si la solicitud está marcada elerror.code
valor del mensaje se establece en contentFilter
. Este es un ejemplo:
{
"created": 1698435368,
"error":
{
"code": "contentFilter",
"message": "Your task failed as a result of our safety system."
}
}
También es posible que se filtre la propia imagen generada. En este caso, el mensaje de error se establece en Generated image was filtered as a result of our safety system.
. Este es un ejemplo:
{
"created": 1698435368,
"error":
{
"code": "contentFilter",
"message": "Generated image was filtered as a result of our safety system."
}
}
Escribir solicitudes de imágenes
Las solicitudes de imágenes deben describir el contenido que desea ver en la imagen, así como el estilo visual de la misma.
Cuando escriba solicitudes, tenga en cuenta que las API de generación de imágenes vienen con un filtro de moderación de contenidos. Si el servicio reconoce la solicitud como contenido dañino, no genera una imagen. Para obtener más información, consulte Filtrado de contenido.
Sugerencia
Para obtener una visión exhaustiva de cómo puede ajustar los mensajes de texto para generar diferentes tipos de imágenes, consulte la guía de ingeniería de mensajes de imagen.
Especificar opciones de API
Los siguientes parámetros del cuerpo de la API están disponibles para la generación de imágenes DALL-E.
Size
Especifique el tamaño de las imágenes generadas. Debe ser uno de los modelos ,1024x1024
1792x1024
o 1024x1792
para DALL-E 3. Las imágenes cuadradas son más rápidas de generar.
Estilo
DALL-E 3 presenta dos opciones de estilo: natural
y vivid
. El estilo natural
es más similar al estilo predeterminado de DALL-E 2, mientras que el estilo vivid
genera imágenes más hiperrealistas y cinematográficas.
El estilo natural
resulta útil en los casos en los que DALL-E 3 exagera o confunde un tema que debería ser más sencillo, tenue o realista.
El valor predeterminado es vivid
.
Control de
Hay dos opciones para la calidad de la imagen: hd
y standard
. hd
crea imágenes con detalles más finos y mayor coherencia en la imagen. standard
Las imágenes se pueden generar más rápido.
El valor predeterminado es standard
.
Número
Con DALL-E 3, no se puede generar más de una imagen en una sola llamada API: el parámetro n debe establecerse en 1
. Si necesita generar varias imágenes a la vez, realice solicitudes paralelas.
Formato de respuesta
Formato en el que se devuelven las imágenes generadas. Debe ser una de url
(una dirección URL que apunte a la imagen) o b64_json
(el código base de 64 bytes en formato JSON). El valor predeterminado es url
.