Condividi tramite


Che cosa è la trasformazione di prompt?

La trasformazione di prompt è un processo di generazione delle immagini di DALL-E 3 che applica un messaggio di sistema di sicurezza e qualità al prompt originale usando una chiamata a un modello linguistico di grandi dimensioni (LLM) prima che sia inviato al modello per la generazione di immagini. Questo messaggio di sistema arricchisce il prompt originale con l'obiettivo di generare immagini più diversificate e di qualità superiore, mantenendo al contempo la finalità.

Dopo l'applicazione della trasformazione di prompt al prompt originale, il filtro dei contenuti viene applicato come passaggio secondario prima della generazione dell'immagine. Per altre informazioni, vedere Filtro contenuti.

Suggerimento

Altre informazioni sulla creazione di prompt per la generazione di immagini nella documentazione DALL·E di OpenAI.

Esempio di trasformazione di prompt

Richiesta di testo di esempio Esempio di immagine generata senza trasformazione delle richieste Esempio di immagine generata con trasformazione delle richieste
"Dipinto acquerello dei grattacieli di Seattle" Dipinto acquerello dei grattacieli di Seattle (semplice). Dipinto acquerello dei grattacieli di Seattle, con più dettagli e struttura.

Perché è necessaria la trasformazione di prompt?

La trasformazione di prompt è essenziale per le generazioni responsabili e di alta qualità. Non solo la trasformazione di prompt migliora la sicurezza dell'immagine generata, ma arricchisce anche il prompt in modo più descrittivo, offrendo una migliore qualità e immagini descrittive.

La trasformazione di prompt predefinita in DALL-E 3 di Azure OpenAI contiene miglioramenti per la sicurezza che impediscono al modello di generare immagini di personaggi e opere d'arte soggetti a copyright, figure pubbliche e altri contenuti dannosi, ad esempio sesso, odio e ingiustizia, violenza e autolesionismo.

Come si usa la trasformazione di prompt?

La trasformazione di prompt viene applicata per impostazione predefinita a tutte le richieste di DALL-E 3 di Azure OpenAI. Non è necessaria alcuna configurazione aggiuntiva per sfruttare i miglioramenti della trasformazione di prompt.

Analogamente alla generazione di immagini, la trasformazione di prompt non è deterministica a causa della natura dei modelli linguistici di grandi dimensioni. Un singolo prompt originale può causare molte varianti di immagine.

Visualizzare le trasformazioni dei prompt

Il prompt modificato o trasformato è visibile nell'oggetto di risposta dell'API, come illustrato di seguito, nel campo revised_prompt.

Input Content:
{
    "prompt": "Watercolor painting of the Seattle skyline",
    "n": 1,
    "size": "1024x1024"
}
 
Output Content:
{
  "created": 1720557218,
  "data": [
    {
      "content_filter_results": {
        ...
      },
      "prompt_filter_results": {
        ...
      },
      "revised_prompt": "A soft and vivid watercolor painting capturing the scenic beauty of the Seattle skyline. The painting illustrates a setting sun casting warm hues over the sprawling cityscape, with the Space Needle prominently standing tall against the sky. Imagine the scattered high-rise buildings, a soothing blend of the lush green of the parks with the winding blue water of the Puget Sound, and the snow-covered peak of Mount Rainier in the distance. A play of light and shadow adds depth and dynamism to this multihued urban panorama."
    }
}

Passaggi successivi