Creación de una aplicación cliente que usa un modelo de generación de imágenes

Completado

Puede usar una API REST para consumir modelos DALL-E de aplicaciones. Como alternativa, puede usar un SDK específico del lenguaje (por ejemplo, el SDK de Python de OpenAI o el SDK de .NET de Azure OpenAI) para abstraer los métodos REST.

Para iniciar el proceso de generación de imágenes, envíe una solicitud al punto de acceso del servicio con clave de autorización en el encabezado. La solicitud contiene parámetros que describen los requisitos de generación de imágenes. Por ejemplo, los parámetros de un modelo de DALL-E incluyen:

  • prompt: descripción de la imagen que se va a generar.
  • n: número de imágenes que se van a generar. DALL-E 3 solo admite n=1.
  • size: la resolución de las imágenes que se van a generar (1024x1024, 1792x1024 o 1024x1792 para DALL-E 3)
  • calidadOpcional: la calidad de la imagen (estándar o hd). El valor predeterminado es estándar.
  • styleOpcional: el estilo visual de la imagen (natural o vívido). El valor predeterminado es vívido.

Por ejemplo, el siguiente JSON podría enviarse a través de la API REST a un modelo de DALL-E, que le solicita generar una imagen de 1024 x 1024 de un tejón con un esmoquin.

{
    "prompt": "A badger wearing a tuxedo",
    "n": 1,
    "size": "1024x1024",
    "quality": "hd", 
    "style": "vivid"
}

Con DALL-E 3, el resultado de la solicitud se procesa sincrónicamente con la respuesta que contiene la dirección URL de la imagen generada. La respuesta es similar a la siguiente JSON:

{
    "created": 1686780744,
    "data": [
        {
            "url": "<URL of generated image>",
            "revised_prompt": "<prompt that was used>"
        }
    ]
}

El elemento de datos incluye el valor url, que hace referencia a un archivo de imagen PNG generado a partir de la solicitud que puede ver o descargar. La respuesta también contiene un aviso revisado que se usó para generar la imagen, que el sistema actualizó para lograr los resultados más deseables. En este ejemplo, la imagen podría ser similar a la siguiente:

Una foto de un tejón que lleva un esmoquin.