Megosztás a következőn keresztül:


Útmutató a DALL-E modellek használatához

Az OpenAI DALL-E modelljei a felhasználó által megadott szöveges kérések alapján hoznak létre képeket. Ez az útmutató bemutatja, hogyan használhatja a DALL-E modelleket, és hogyan konfigurálhatja a beállításokat REST API-hívásokon keresztül.

Előfeltételek

A képgenerálási API-k meghívása

Az alábbi parancs a DALL-E kóddal való használatának legalapvetőbb módját mutatja be. Ha ez az első alkalom, hogy programozott módon használja ezeket a modelleket, javasoljuk, hogy kezdje a DALL-E rövid útmutatóval.

POST-kérés küldése a következő címre:

https://<your_resource_name>.deployments/<your_deployment_name>/images/generations?api-version=<api_version>

ahol:

  • <your_resource_name> Az Azure OpenAI-erőforrás neve.
  • <your_deployment_name> A DALL-E 3 modell üzembe helyezésének neve.
  • <api_version> A használni kívánt API-verzió. Például: 2024-02-01.

Szükséges fejlécek:

  • Content-Type: application/json
  • api-key: <your_API_key>

Törzs:

Az alábbiakban egy mintakérés törzse található. A későbbi szakaszokban definiált beállítások közül választhat.

{
    "prompt": "A multi-colored umbrella on the beach, disposable camera",
    "size": "1024x1024", 
    "n": 1,
    "quality": "hd", 
    "style": "vivid"
}

Hozam

A sikeres képgenerálási API-hívás kimenete az alábbi példához hasonlóan néz ki. A url mező egy URL-címet tartalmaz, ahová letöltheti a létrehozott lemezképet. Az URL-cím 24 órán át aktív marad.

{ 
    "created": 1698116662, 
    "data": [ 
        { 
            "url": "<URL_to_generated_image>",
            "revised_prompt": "<prompt_that_was_used>" 
        }
    ]
} 

API-hívás elutasítása

A rendszer a kéréseket és képeket a tartalomszabályzatunk alapján szűri, és hibaüzenetet ad vissza, ha egy üzenet vagy kép meg van jelölve.

Ha a rendszer megjelöli a kérést, az error.code üzenet értéke a következőre contentFiltervan állítva: . Példa:

{
    "created": 1698435368,
    "error":
    {
        "code": "contentFilter",
        "message": "Your task failed as a result of our safety system."
    }
}

Előfordulhat, hogy maga a létrehozott rendszerkép is szűrve van. Ebben az esetben a hibaüzenet a következőre Generated image was filtered as a result of our safety system.van állítva: . Példa:

{
    "created": 1698435368,
    "error":
    {
        "code": "contentFilter",
        "message": "Generated image was filtered as a result of our safety system."
    }
}

Képüzenetek írása

A képkéréseknek le kell írniuk a képben megjeleníteni kívánt tartalmat, valamint a kép vizuális stílusát.

Tipp.

A dallery DALL-E 2 parancssori könyvében alaposabban áttekintheti, hogyan finomhangolhatja a szöveges utasításokat különböző típusú képek létrehozásához.

Amikor kéréseket ír, vegye figyelembe, hogy a képgenerálási API-k con sátormód ration szűrővel érkeznek. Ha a szolgáltatás a kérést káros tartalomként ismeri fel, nem hoz létre képet. További információ: Tartalomszűrés.

Átalakítás kérése

A DALL-E 3 beépített gyors újraírást tartalmaz a képek javítására, az elfogultság csökkentésére és a képek természetes változatának növelésére.

Példa szövegre Példaként létrehozott rendszerkép gyors átalakítás nélkül Példa a létrehozott képre a parancssori átalakítással
"A Seattle-i látkép akvarellfestése" A Seattle-i látkép akvarell festése (egyszerű). A Seattle-i égbolt vízfestménye részletesebb és strukturáltabb.

A frissített üzenet az revised_prompt adatválasz-objektum mezőjében látható.

Bár jelenleg nem lehet letiltani ezt a funkciót, speciális kéréssel közelebb hozhatja a kimeneteket az eredeti kéréshez, ha hozzáadja a következőt: I NEED to test how the tool works with extremely simple prompts. DO NOT add any detail, just use it AS-IS:.

API-beállítások megadása

A DALL-E képgeneráláshoz az alábbi API-törzsparaméterek érhetők el.

Méret

Adja meg a létrehozott képek méretét. A DALL-E 3 modellek egyikének 1024x10241792x1024kell 1024x1792 lennie. A négyzetes képek gyorsabban generálódnak.

Stílus

DALL-E 3 két stílust kínál: natural és vivid. A natural stílus jobban hasonlít a DALL-E 2 alapértelmezett stílusához, míg a vivid stílus több hiper-valós és filmszerű képet hoz létre.

A natural stílus akkor hasznos, ha a DALL-E 3 túltúlozza vagy összezavar egy olyan témát, amelynek egyszerűbbnek, visszafogottabbnak vagy reálisabbnak kell lennie.

Az alapértelmezett érték vivid.

Minőség

A képminőségnek két lehetősége van: hd és standard. hd finomabb részletekkel és nagyobb konzisztenciával rendelkező képeket hoz létre a rendszerképen. standard a rendszerképek gyorsabban hozhatók létre.

Az alapértelmezett érték standard.

Szám

A DALL-E 3 használatával egyetlen API-hívásban nem hozhat létre több képet: az n paramétert a következőre kell állítani 1: . Ha egyszerre több képet kell létrehoznia, párhuzamos kéréseket kell végeznie.

Válaszformátum

A létrehozott képek visszaadott formátuma. Az egyiknek url (a képre mutató URL-címnek) vagy b64_json (az alap 64 bájtos kódnak JSON formátumban) kell lennie. Az alapértelmezett érték url.

Következő lépések