Megjegyzés
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhat bejelentkezni vagy módosítani a címtárat.
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhatja módosítani a címtárat.
Az OpenAI képgenerálási modelljei a felhasználó által megadott szöveges kérések és opcionálisan megadott képek alapján renderelik a képeket. Ez az útmutató bemutatja, hogyan használhatja a képgenerálási modelleket, és hogyan konfigurálhatja a beállításait REST API-hívásokon keresztül.
Előfeltételek
- Egy Azure-előfizetés. Ingyenesen létrehozhat egyet.
- Egy támogatott régióban létrehozott Azure OpenAI-erőforrás. Lásd a régió rendelkezésre állását.
- Üzemeltesse a
dall-e-3
vagygpt-image-1
modellt az Azure OpenAI-erőforrással. Az üzembe helyezésekkel kapcsolatos további információkért lásd: Erőforrás létrehozása és modell üzembe helyezése az Azure OpenAI-val.- A GPT-image-1 az újabb modell, és számos fejlesztést tartalmaz a DALL-E 3-hoz. Korlátozott hozzáféréssel érhető el: ezzel az űrlappal igényelheti a hozzáférést.
Az Image Generation API meghívása
Az alábbi parancs a képmodell kóddal való használatának legalapvetőbb módját mutatja be. Ha ez az első alkalom, hogy programozott módon használja ezeket a modelleket, javasoljuk, hogy kezdje a rövid útmutatóval.
POST-kérés küldése a következő címre:
https://<your_resource_name>.openai.azure.com/openai/deployments/<your_deployment_name>/images/generations?api-version=<api_version>
URL-cím:
Cserélje le a következő értékeket:
-
<your_resource_name>
Az Azure OpenAI-erőforrás neve. -
<your_deployment_name>
a DALL-E 3- vagy GPT-image-1 modell üzembe helyezésének neve. -
<api_version>
A használni kívánt API-verzió. Például:2025-04-01-preview
.
Szükséges fejlécek:
-
Content-Type
:application/json
-
api-key
:<your_API_key>
törzs:
Az alábbiakban egy mintakérés törzse található. A későbbi szakaszokban definiált beállítások közül választhat.
{
"prompt": "A multi-colored umbrella on the beach, disposable camera",
"model": "gpt-image-1",
"size": "1024x1024",
"n": 1,
"quality": "high"
}
Jótanács
A képgenerálási jogkivonatok költségeiről a Kép jogkivonatok című témakörben olvashat.
Kimenet
A sikeres képgenerálási API-hívás válasza az alábbi példához hasonlóan néz ki. A url
mező egy URL-címet tartalmaz, ahová letöltheti a létrehozott lemezképet. Az URL-cím 24 órán át aktív marad.
{
"created": 1698116662,
"data": [
{
"url": "<URL_to_generated_image>",
"revised_prompt": "<prompt_that_was_used>"
}
]
}
API-hívás elutasítása
A rendszer a kéréseket és képeket a tartalomszabályzatunk alapján szűri, és hibaüzenetet ad vissza, ha egy üzenet vagy kép meg van jelölve.
Ha a rendszer megjelöli a kérést, az error.code
üzenet értéke a következőre contentFilter
van állítva: . Íme egy példa:
{
"created": 1698435368,
"error":
{
"code": "contentFilter",
"message": "Your task failed as a result of our safety system."
}
}
Előfordulhat, hogy maga a létrehozott rendszerkép is szűrve van. Ebben az esetben a hibaüzenet A generált képet a biztonsági rendszerünk szűrte le. Íme egy példa:
{
"created": 1698435368,
"error":
{
"code": "contentFilter",
"message": "Generated image was filtered as a result of our safety system."
}
}
Szövegből képre generálási utasítások írása
A kéréseknek le kell írniuk a képen megjeleníteni kívánt tartalmat és a kép vizuális stílusát.
Amikor rákérdez, vegye figyelembe, hogy a Kép API-k tartalommoderálási szűrőt tartalmaznak. Ha a szolgáltatás a kérést káros tartalomként ismeri fel, nem hoz létre képet. További információ: Tartalomszűrés.
Jótanács
A szövegkérések különböző típusú képek létrehozására való finomhangolásának részletes megismeréséhez tekintse meg az Image prompt mérnöki útmutatóját.
API-beállítások megadása
A képgenerálási modellekhez az alábbi API-törzsparaméterek érhetők el.
Méret
Adja meg a létrehozott képek méretét. A GPT-image-1 modellek esetében az egyiknek 1024x1024
, 1024x1536
vagy 1536x1024
formátumúnak kell lennie. A négyzetes képek gyorsabban generálódnak.
Minőség
A képminőségnek három lehetősége van: low
, medium
és high
. Az alacsonyabb minőségű képek gyorsabban hozhatók létre.
Az alapértelmezett érték a high
.
Szám
Egyetlen API-hívással egy és tíz kép között hozhat létre. Az alapértelmezett érték a 1
.
Felhasználói azonosító
A felhasználói paraméterrel egyedi azonosítót adhat meg a kérést küldő felhasználó számára. Ez hasznos a használati minták nyomon követéséhez és monitorozásához. Az érték bármilyen sztring lehet, például felhasználói azonosító vagy e-mail-cím.
Kimeneti formátum
A létrehozott kép formátumának megadásához használja a output_format paramétert. A támogatott formátumok a következők PNG
: és JPEG
. Az alapértelmezett érték a PNG
.
Megjegyzés:
A WEBP-rendszerképek nem támogatottak az Azure OpenAI-ban az Azure AI Foundry-modellekben.
Tömörítés
A létrehozott kép tömörítési szintjének megadásához használja a output_compression paramétert. Adjon meg egy egész számot 0
és 100
között, ahol a 0
nem tartalmaz tömörítést, a 100
pedig maximális tömörítést jelent. Az alapértelmezett érték a 100
.
A Kép szerkesztése API meghívása
Az Image Edit API lehetővé teszi a meglévő képek módosítását az Ön által megadott szöveges kérések alapján. Az API-hívás hasonló a képgenerálási API-híváshoz, de be kell adnia egy bemeneti képet is.
Fontos
A bemeneti képnek 20 MB-nál kisebb méretűnek kell lennie, és PNG- vagy JPG-fájlnak kell lennie.
POST-kérés küldése a következő címre:
https://<your_resource_name>.openai.azure.com/openai/deployments/<your_deployment_name>/images/edits?api-version=<api_version>
URL-cím:
Cserélje le a következő értékeket:
-
<your_resource_name>
Az Azure OpenAI-erőforrás neve. -
<your_deployment_name>
a DALL-E 3- vagy GPT-image-1 modell üzembe helyezésének neve. -
<api_version>
A használni kívánt API-verzió. Például:2025-04-01-preview
.
Szükséges fejlécek:
-
Content-Type
:multipart/form-data
-
api-key
:<your_API_key>
törzs:
Az alábbiakban egy mintakérés törzse található. A későbbi szakaszokban definiált beállítások közül választhat.
Fontos
A Képszerkesztési API többrészes/űrlapadatokat vesz fel, nem JSON-adatokat. Az alábbi példa egy cURL-kérelemhez csatolandó mintaűrlapadatokat mutatja be.
-F "image[]=@beach.png" \
-F 'prompt=Add a beach ball in the center' \
-F "model=gpt-image-1" \
-F "size=1024x1024" \
-F "n=1" \
-F "quality=high"
Kimenet
A sikeres képszerkesztő API-hívás válasza az alábbi példához hasonlóan néz ki. A b64_json
mező a kimeneti kép adatait tartalmazza.
{
"created": 1698116662,
"data": [
{
"b64_json": "<base64 image data>",
"revised_prompt": "<prompt_that_was_used>"
}
]
}
API-beállítások megadása
A képszerkesztő modellekhez az alábbi API-törzsparaméterek érhetők el a képgenerálási modelleken kívül.
Image
A kép értéke a szerkeszteni kívánt képfájlt jelzi.
Maszk
A maszk paraméter típusa megegyezik a fő képbeviteli paraméter típusával. A kép adott területét határozza meg, amelyet a modell segítségével szeretne szerkeszteni, ezeken a területeken teljesen átlátszó képpontokkal (nulla alfával). A maszknak PNG-fájlnak kell lennie, és ugyanolyan dimenziókkal kell rendelkeznie, mint a bemeneti képnek.