Condividi tramite


Come usare i modelli DALL-E

I modelli DALL-E di OpenAI generano immagini in base alle richieste di testo fornite dall'utente. Questa guida illustra come usare i modelli DALL-E e configurare le relative opzioni tramite chiamate API REST.

Prerequisiti

Chiamare le API di generazione di immagini

Il comando seguente illustra il modo più semplice per usare DALL-E con il codice. Se è la prima volta che si usano questi modelli a livello di codice, è consigliabile iniziare con la guida introduttiva per DALL-E.

Inviare una richiesta POST a:

https://<your_resource_name>.openai.azure.com/openai/deployments/<your_deployment_name>/images/generations?api-version=<api_version>

Sostituire i segnaposto seguenti:

  • <your_resource_name> è il nome della risorsa OpenAI di Azure.
  • <your_deployment_name> è il nome della distribuzione del modello DALL-E 3.
  • <api_version> è la versione dell'API che si vuole usare. Ad esempio: 2024-02-01.

Intestazioni obbligatorie:

  • Content-Type: application/json
  • api-key: <your_API_key>

Corpo:

Di seguito è riportato il corpo di una richiesta di esempio. È possibile specificare una serie di opzioni, definite nelle sezioni successive.

{
    "prompt": "A multi-colored umbrella on the beach, disposable camera",
    "size": "1024x1024", 
    "n": 1,
    "quality": "hd", 
    "style": "vivid"
}

Output

L'output di una chiamata API di generazione di immagini ha un aspetto simile all'esempio seguente. Il campo url contiene un URL in cui è possibile scaricare l'immagine generata. L'URL rimane attivo per 24 ore.

{ 
    "created": 1698116662, 
    "data": [ 
        { 
            "url": "<URL_to_generated_image>",
            "revised_prompt": "<prompt_that_was_used>" 
        }
    ]
} 

Rifiuto delle chiamate API

Le richieste e le immagini vengono filtrate in base ai criteri di contenuto, restituendo un errore quando viene contrassegnata una richiesta o un'immagine.

Se la richiesta viene contrassegnata, il valore error.code nel messaggio viene impostato su contentFilter. Ecco un esempio:

{
    "created": 1698435368,
    "error":
    {
        "code": "contentFilter",
        "message": "Your task failed as a result of our safety system."
    }
}

È anche possibile che l'immagine generata sia filtrata. In questo caso, il messaggio di errore è impostato su Immagine generata filtrata in seguito al sistema di sicurezza. Ecco un esempio:

{
    "created": 1698435368,
    "error":
    {
        "code": "contentFilter",
        "message": "Generated image was filtered as a result of our safety system."
    }
}

Scrittura di richieste di immagini

Le richieste di immagine devono descrivere il contenuto che si vuole visualizzare nell'immagine e lo stile di visualizzazione dell'immagine.

Quando si scrivono richieste, tenere in considerazione il fatto che le API di generazione di immagini sono dotate di un filtro di moderazione del contenuto. Se il servizio riconosce la richiesta come contenuto dannoso, non genera un'immagine. Per altre informazioni, vedere Filtro del contenuto.

Suggerimento

Per un'analisi approfondita del modo in cui è possibile modificare le richieste di testo per generare diversi tipi di immagini, vedere la guida di progettazione dei prompt delle immagini.

Specificare le opzioni dell'API

I parametri del corpo dell'API seguenti sono disponibili per la generazione di immagini DALL-E.

Dimensione

Specificare le dimensioni delle immagini generate. Deve essere una delle opzioni 1024x1024, 1792x1024 o 1024x1792 per i modelli DALL-E 3. Le immagini quadrate sono più veloci da generare.

Style

DALL-E 3 introduce due opzioni di stile: natural e vivid. Lo stile naturale è più simile allo stile predefinito DALL-E 2, mentre lo stile vivido genera immagini iper-reali e cinematografiche.

Lo stile naturale è utile nei casi in cui DALL-E 3 esagera o confonde un soggetto che deve essere più semplice, sottomesso o realistico.

Il valore predefinito è vivid.

Qualità

Sono disponibili due opzioni per la qualità dell'immagine: hd e standard. L'opzione hd crea immagini con dettagli più sottili e maggiore coerenza nell'immagine. Le immagini standard possono essere generate più velocemente.

Il valore predefinito è standard.

Numero

Con DALL-E 3 non è possibile generare più di un'immagine in una singola chiamata API: il n parametro deve essere impostato su 1. Se è necessario generare più immagini contemporaneamente, effettuare richieste parallele.

Formato della risposta

Formato in cui vengono restituite le immagini generate. Deve essere uno dei url (un URL che punta all'immagine) o b64_json (il codice in base 64 byte in formato JSON). Il valore predefinito è url.