Condividi tramite


Informazioni su come usare i modelli DALL-E

I modelli DALL-E di OpenAI generano immagini in base alle richieste di testo fornite dall'utente. Questa guida illustra come usare i modelli DALL-E e configurare le relative opzioni tramite chiamate API REST.

Prerequisiti

Chiamare le API di generazione di immagini

Il comando seguente illustra il modo più semplice per usare DALL-E con il codice. Se è la prima volta che si usano questi modelli a livello di codice, è consigliabile iniziare con la guida introduttiva per DALL-E.

Inviare una richiesta POST a:

https://<your_resource_name>.openai.azure.com/openai/deployments/<your_deployment_name>/images/generations?api-version=<api_version>

dove:

  • <your_resource_name> è il nome della risorsa OpenAI di Azure.
  • <your_deployment_name> è il nome della distribuzione del modello DALL-E 3.
  • <api_version> è la versione dell'API che si vuole usare. Ad esempio: 2024-02-01.

Intestazioni obbligatorie:

  • Content-Type: application/json
  • api-key: <your_API_key>

Corpo:

Di seguito è riportato il corpo di una richiesta di esempio. È possibile specificare una serie di opzioni, definite nelle sezioni successive.

{
    "prompt": "A multi-colored umbrella on the beach, disposable camera",
    "size": "1024x1024", 
    "n": 1,
    "quality": "hd", 
    "style": "vivid"
}

Output

L'output di una chiamata API di generazione di immagini ha un aspetto simile all'esempio seguente. Il campo url contiene un URL in cui è possibile scaricare l'immagine generata. L'URL rimane attivo per 24 ore.

{ 
    "created": 1698116662, 
    "data": [ 
        { 
            "url": "<URL_to_generated_image>",
            "revised_prompt": "<prompt_that_was_used>" 
        }
    ]
} 

Rifiuto delle chiamate API

Le richieste e le immagini vengono filtrate in base ai criteri di contenuto, restituendo un errore quando viene contrassegnata una richiesta o un'immagine.

Se la richiesta viene contrassegnata, il valore error.code nel messaggio viene impostato su contentFilter. Ecco un esempio:

{
    "created": 1698435368,
    "error":
    {
        "code": "contentFilter",
        "message": "Your task failed as a result of our safety system."
    }
}

È anche possibile che l'immagine generata sia filtrata. In questo caso, il messaggio di errore è impostato su Generated image was filtered as a result of our safety system.. Ecco un esempio:

{
    "created": 1698435368,
    "error":
    {
        "code": "contentFilter",
        "message": "Generated image was filtered as a result of our safety system."
    }
}

Scrittura di richieste di immagini

Le richieste di immagini devono descrivere il contenuto che si vuole visualizzare nell'immagine, nonché lo stile visivo dell'immagine.

Suggerimento

Per un'analisi approfondita del modo in cui è possibile modificare le richieste di testo per generare diversi tipi di immagini, vedere la sequenza di prompt di Dallery DALL-E 2.

Quando si scrivono richieste, tenere in considerazione il fatto che le API di generazione di immagini sono dotate di un filtro di moderazione del contenuto. Se il servizio riconosce la richiesta come contenuto dannoso, non genera un'immagine. Per altre informazioni, vedere Filtro del contenuto.

Trasformazione delle richieste

DALL-E 3 include la riscrittura predefinita delle richieste per migliorare le immagini, ridurre la distorsione e aumentare la variazione naturale delle immagini.

Richiesta di testo di esempio Esempio di immagine generata senza trasformazione delle richieste Esempio di immagine generata con trasformazione delle richieste
"Dipinto acquerello dei grattacieli di Seattle" Dipinto acquerello dei grattacieli di Seattle (semplice). Dipinto acquerello dei grattacieli di Seattle, con più dettagli e struttura.

La richiesta aggiornata è visibile nel campo revised_prompt dell'oggetto risposta dati.

Anche se non è attualmente possibile disabilitare questa funzionalità, è possibile usare una richiesta speciale per avvicinare gli output alla richiesta originale aggiungendo quanto segue: I NEED to test how the tool works with extremely simple prompts. DO NOT add any detail, just use it AS-IS:.

Specificare le opzioni dell'API

I parametri del corpo dell'API seguenti sono disponibili per la generazione di immagini DALL-E.

Dimensione

Specificare le dimensioni delle immagini generate. Deve essere una delle opzioni 1024x1024, 1792x1024 o 1024x1792 per i modelli DALL-E 3. Le immagini quadrate sono più veloci da generare.

Style

DALL-E 3 introduce due opzioni di stile: natural e vivid. Lo stile natural è più simile allo stile predefinito di DALL-E 2, mentre lo stile vivid genera immagini più iperrealistiche e cinematografiche.

Lo stile natural è utile nei casi in cui DALL-E 3 complica eccessivamente o confonde un soggetto che deve essere più semplice, tenue o realistico.

Il valore predefinito è vivid.

Qualità

Sono disponibili due opzioni per la qualità dell'immagine: hd e standard. hd crea immagini con dettagli più definiti e maggiore coerenza nell'immagine. Le immagini standard possono essere generate più velocemente.

Il valore predefinito è standard.

Numero

Con DALL-E 3 non è possibile generare più immagini in una singola chiamata API: il parametro n deve essere impostato su 1. Se è necessario generare più immagini contemporaneamente, effettuare richieste parallele.

Formato della risposta

Formato in cui vengono restituite le immagini generate. Deve essere uno dei url (un URL che punta all'immagine) o b64_json (il codice in base 64 byte in formato JSON). Il valore predefinito è url.

Passaggi successivi