Útmutató a DALL-E modellek használatához
Az OpenAI DALL-E modelljei a felhasználó által megadott szöveges kérések alapján hoznak létre képeket. Ez az útmutató bemutatja, hogyan használhatja a DALL-E modelleket, és hogyan konfigurálhatja a beállításokat REST API-hívásokon keresztül.
Előfeltételek
- Azure-előfizetés. Hozzon létre egyet ingyen.
- Hozzáférés a DALL-E-hez a kívánt Azure-előfizetésben.
- A régióban
SwedenCentral
létrehozott Azure OpenAI-erőforrás. - Ezután üzembe kell helyeznie egy
dalle3
modellt az Azure-erőforrással. További információ: Erőforrás létrehozása és modell üzembe helyezése az Azure OpenAI használatával.
A képgenerálási API-k meghívása
Az alábbi parancs a DALL-E kóddal való használatának legalapvetőbb módját mutatja be. Ha ez az első alkalom, hogy programozott módon használja ezeket a modelleket, javasoljuk, hogy kezdje a DALL-E rövid útmutatóval.
POST-kérés küldése a következő címre:
https://<your_resource_name>.deployments/<your_deployment_name>/images/generations?api-version=<api_version>
ahol:
<your_resource_name>
Az Azure OpenAI-erőforrás neve.<your_deployment_name>
A DALL-E 3 modell üzembe helyezésének neve.<api_version>
A használni kívánt API-verzió. Például:2024-02-01
.
Szükséges fejlécek:
Content-Type
:application/json
api-key
:<your_API_key>
Törzs:
Az alábbiakban egy mintakérés törzse található. A későbbi szakaszokban definiált beállítások közül választhat.
{
"prompt": "A multi-colored umbrella on the beach, disposable camera",
"size": "1024x1024",
"n": 1,
"quality": "hd",
"style": "vivid"
}
Hozam
A sikeres képgenerálási API-hívás kimenete az alábbi példához hasonlóan néz ki. A url
mező egy URL-címet tartalmaz, ahová letöltheti a létrehozott lemezképet. Az URL-cím 24 órán át aktív marad.
{
"created": 1698116662,
"data": [
{
"url": "<URL_to_generated_image>",
"revised_prompt": "<prompt_that_was_used>"
}
]
}
API-hívás elutasítása
A rendszer a kéréseket és képeket a tartalomszabályzatunk alapján szűri, és hibaüzenetet ad vissza, ha egy üzenet vagy kép meg van jelölve.
Ha a rendszer megjelöli a kérést, az error.code
üzenet értéke a következőre contentFilter
van állítva: . Példa:
{
"created": 1698435368,
"error":
{
"code": "contentFilter",
"message": "Your task failed as a result of our safety system."
}
}
Előfordulhat, hogy maga a létrehozott rendszerkép is szűrve van. Ebben az esetben a hibaüzenet a következőre Generated image was filtered as a result of our safety system.
van állítva: . Példa:
{
"created": 1698435368,
"error":
{
"code": "contentFilter",
"message": "Generated image was filtered as a result of our safety system."
}
}
Képüzenetek írása
A képkéréseknek le kell írniuk a képben megjeleníteni kívánt tartalmat, valamint a kép vizuális stílusát.
Tipp.
A dallery DALL-E 2 parancssori könyvében alaposabban áttekintheti, hogyan finomhangolhatja a szöveges utasításokat különböző típusú képek létrehozásához.
Amikor kéréseket ír, vegye figyelembe, hogy a képgenerálási API-k con sátormód ration szűrővel érkeznek. Ha a szolgáltatás a kérést káros tartalomként ismeri fel, nem hoz létre képet. További információ: Tartalomszűrés.
Átalakítás kérése
A DALL-E 3 beépített gyors újraírást tartalmaz a képek javítására, az elfogultság csökkentésére és a képek természetes változatának növelésére.
Példa szövegre | Példaként létrehozott rendszerkép gyors átalakítás nélkül | Példa a létrehozott képre a parancssori átalakítással |
---|---|---|
"A Seattle-i látkép akvarellfestése" | ![]() |
![]() |
A frissített üzenet az revised_prompt
adatválasz-objektum mezőjében látható.
Bár jelenleg nem lehet letiltani ezt a funkciót, speciális kéréssel közelebb hozhatja a kimeneteket az eredeti kéréshez, ha hozzáadja a következőt: I NEED to test how the tool works with extremely simple prompts. DO NOT add any detail, just use it AS-IS:
.
API-beállítások megadása
A DALL-E képgeneráláshoz az alábbi API-törzsparaméterek érhetők el.
Méret
Adja meg a létrehozott képek méretét. A DALL-E 3 modellek egyikének 1024x1024
1792x1024
kell 1024x1792
lennie. A négyzetes képek gyorsabban generálódnak.
Stílus
DALL-E 3 két stílust kínál: natural
és vivid
. A natural
stílus jobban hasonlít a DALL-E 2 alapértelmezett stílusához, míg a vivid
stílus több hiper-valós és filmszerű képet hoz létre.
A natural
stílus akkor hasznos, ha a DALL-E 3 túltúlozza vagy összezavar egy olyan témát, amelynek egyszerűbbnek, visszafogottabbnak vagy reálisabbnak kell lennie.
Az alapértelmezett érték vivid
.
Minőség
A képminőségnek két lehetősége van: hd
és standard
. hd
finomabb részletekkel és nagyobb konzisztenciával rendelkező képeket hoz létre a rendszerképen. standard
a rendszerképek gyorsabban hozhatók létre.
Az alapértelmezett érték standard
.
Szám
A DALL-E 3 használatával egyetlen API-hívásban nem hozhat létre több képet: az n paramétert a következőre kell állítani 1
: . Ha egyszerre több képet kell létrehoznia, párhuzamos kéréseket kell végeznie.
Válaszformátum
A létrehozott képek visszaadott formátuma. Az egyiknek url
(a képre mutató URL-címnek) vagy b64_json
(az alap 64 bájtos kódnak JSON formátumban) kell lennie. Az alapértelmezett érték url
.
Következő lépések
Visszajelzés
https://aka.ms/ContentUserFeedback.
Hamarosan elérhető: 2024-ben fokozatosan kivezetjük a GitHub-problémákat a tartalom visszajelzési mechanizmusaként, és lecseréljük egy új visszajelzési rendszerre. További információ:Visszajelzés küldése és megtekintése a következőhöz: