Compartir vía


Aprenda a trabajar con los modelos DALL-E

Los modelos DALL-E de OpenAI generan imágenes basadas en mensajes de texto proporcionados por el usuario. En esta guía se muestra cómo usar los modelos DALL-E y configurar sus opciones a través de llamadas a la API de REST.

Requisitos previos

Llamada a las API de generación de imágenes

El siguiente comando muestra la forma más básica de usar DALL-E con código. Si es la primera vez que usa estos modelos de forma programada, le recomendamos que empiece con Inicio rápido de DALL-E.

Envíe una solicitud POST a:

https://<your_resource_name>.openai.azure.com/openai/deployments/<your_deployment_name>/images/generations?api-version=<api_version>

donde:

  • <your_resource_name> es el nombre del recurso de Azure OpenAI.
  • <your_deployment_name> es el nombre de la implementación del modelo DALL-E 3.
  • <api_version> es la versión de la API que desea usar. Por ejemplo, 2024-02-01.

Encabezados obligatorios:

  • Content-Type: application/json
  • api-key: <your_API_key>

Cuerpo:

A continuación se muestra un cuerpo de solicitud de ejemplo. Especifique una serie de opciones, definidas en secciones posteriores.

{
    "prompt": "A multi-colored umbrella on the beach, disposable camera",
    "size": "1024x1024", 
    "n": 1,
    "quality": "hd", 
    "style": "vivid"
}

Output

La salida de una llamada API de generación de imágenes correcta tiene un aspecto similar al siguiente ejemplo. El campo url contiene una dirección URL donde puede descargar la imagen generada. La dirección URL permanece activa durante 24 horas.

{ 
    "created": 1698116662, 
    "data": [ 
        { 
            "url": "<URL_to_generated_image>",
            "revised_prompt": "<prompt_that_was_used>" 
        }
    ]
} 

Rechazo de llamadas API

Las solicitudes e imágenes se filtran en función de nuestra directiva de contenido, devolviendo un error cuando se marca una solicitud o una imagen.

Si la solicitud está marcada elerror.code valor del mensaje se establece en contentFilter. Este es un ejemplo:

{
    "created": 1698435368,
    "error":
    {
        "code": "contentFilter",
        "message": "Your task failed as a result of our safety system."
    }
}

También es posible que se filtre la propia imagen generada. En este caso, el mensaje de error se establece en Generated image was filtered as a result of our safety system.. Este es un ejemplo:

{
    "created": 1698435368,
    "error":
    {
        "code": "contentFilter",
        "message": "Generated image was filtered as a result of our safety system."
    }
}

Escribir solicitudes de imágenes

Las solicitudes de imágenes deben describir el contenido que desea ver en la imagen, así como el estilo visual de la misma.

Cuando escriba solicitudes, tenga en cuenta que las API de generación de imágenes vienen con un filtro de moderación de contenidos. Si el servicio reconoce la solicitud como contenido dañino, no genera una imagen. Para obtener más información, consulte Filtrado de contenido.

Sugerencia

Para obtener una visión exhaustiva de cómo puede ajustar los mensajes de texto para generar diferentes tipos de imágenes, consulte la guía de ingeniería de mensajes de imagen.

Especificar opciones de API

Los siguientes parámetros del cuerpo de la API están disponibles para la generación de imágenes DALL-E.

Size

Especifique el tamaño de las imágenes generadas. Debe ser uno de los modelos ,1024x1024 1792x1024o 1024x1792 para DALL-E 3. Las imágenes cuadradas son más rápidas de generar.

Estilo

DALL-E 3 presenta dos opciones de estilo: natural y vivid. El estilo naturales más similar al estilo predeterminado de DALL-E 2, mientras que el estilo vividgenera imágenes más hiperrealistas y cinematográficas.

El estilo naturalresulta útil en los casos en los que DALL-E 3 exagera o confunde un tema que debería ser más sencillo, tenue o realista.

El valor predeterminado es vivid.

Control de

Hay dos opciones para la calidad de la imagen: hd y standard. hd crea imágenes con detalles más finos y mayor coherencia en la imagen. standard Las imágenes se pueden generar más rápido.

El valor predeterminado es standard.

Número

Con DALL-E 3, no se puede generar más de una imagen en una sola llamada API: el parámetro n debe establecerse en 1. Si necesita generar varias imágenes a la vez, realice solicitudes paralelas.

Formato de respuesta

Formato en el que se devuelven las imágenes generadas. Debe ser una de url (una dirección URL que apunte a la imagen) o b64_json (el código base de 64 bytes en formato JSON). El valor predeterminado es url.

Pasos siguientes