Az Azure OpenAI rendszerkép-létrehozási modelljeinek használata

2025-07-02

Az OpenAI képgenerálási modelljei a felhasználó által megadott szöveges kérések és opcionálisan megadott képek alapján renderelik a képeket. Ez az útmutató bemutatja, hogyan használhatja a képgenerálási modelleket, és hogyan konfigurálhatja a beállításait REST API-hívásokon keresztül.

Előfeltételek

Egy Azure-előfizetés. Ingyenesen létrehozhat egyet.
Egy támogatott régióban létrehozott Azure OpenAI-erőforrás. Lásd a régió rendelkezésre állását.
Üzemeltesse a dall-e-3 vagy gpt-image-1 modellt az Azure OpenAI-erőforrással. Az üzembe helyezésekkel kapcsolatos további információkért lásd: Erőforrás létrehozása és modell üzembe helyezése az Azure OpenAI-val.
- A GPT-image-1 az újabb modell, és számos fejlesztést tartalmaz a DALL-E 3-hoz. Korlátozott hozzáféréssel érhető el: ezzel az űrlappal igényelheti a hozzáférést.

Az Image Generation API meghívása

Az alábbi parancs a képmodell kóddal való használatának legalapvetőbb módját mutatja be. Ha ez az első alkalom, hogy programozott módon használja ezeket a modelleket, javasoljuk, hogy kezdje a rövid útmutatóval.

GPT-image-1
DALL-E 3

POST-kérés küldése a következő címre:

https://<your_resource_name>.openai.azure.com/openai/deployments/<your_deployment_name>/images/generations?api-version=<api_version>

URL-cím:

Cserélje le a következő értékeket:

<your_resource_name> Az Azure OpenAI-erőforrás neve.
<your_deployment_name> a DALL-E 3- vagy GPT-image-1 modell üzembe helyezésének neve.
<api_version> A használni kívánt API-verzió. Például: 2025-04-01-preview.

Szükséges fejlécek:

Content-Type: application/json
api-key: <your_API_key>

törzs:

Az alábbiakban egy mintakérés törzse található. A későbbi szakaszokban definiált beállítások közül választhat.

{
    "prompt": "A multi-colored umbrella on the beach, disposable camera",
    "model": "gpt-image-1",
    "size": "1024x1024", 
    "n": 1,
    "quality": "high"
}

POST-kérés küldése a következő címre:

https://<your_resource_name>.openai.azure.com/openai/deployments/<your_deployment_name>/images/generations?api-version=<api_version>

URL-cím:

Cserélje le a következő értékeket:

<your_resource_name> Az Azure OpenAI-erőforrás neve.
<your_deployment_name> a DALL-E 3- vagy GPT-image-1 modell üzembe helyezésének neve.
<api_version> A használni kívánt API-verzió. Például: 2024-02-01.

Szükséges fejlécek:

Content-Type: application/json
api-key: <your_API_key>

törzs:

Az alábbiakban egy mintakérés törzse található. A későbbi szakaszokban definiált beállítások közül választhat.

{
    "prompt": "A multi-colored umbrella on the beach, disposable camera",
    "size": "1024x1024", 
    "n": 1,
    "quality": "hd", 
    "style": "vivid"
}

Jótanács

A képgenerálási jogkivonatok költségeiről a Kép jogkivonatok című témakörben olvashat.

Kimenet

A sikeres képgenerálási API-hívás válasza az alábbi példához hasonlóan néz ki. A url mező egy URL-címet tartalmaz, ahová letöltheti a létrehozott lemezképet. Az URL-cím 24 órán át aktív marad.

{ 
    "created": 1698116662, 
    "data": [ 
        { 
            "url": "<URL_to_generated_image>",
            "revised_prompt": "<prompt_that_was_used>" 
        }
    ]
}

API-hívás elutasítása

A rendszer a kéréseket és képeket a tartalomszabályzatunk alapján szűri, és hibaüzenetet ad vissza, ha egy üzenet vagy kép meg van jelölve.

Ha a rendszer megjelöli a kérést, az error.code üzenet értéke a következőre contentFiltervan állítva: . Íme egy példa:

{
    "created": 1698435368,
    "error":
    {
        "code": "contentFilter",
        "message": "Your task failed as a result of our safety system."
    }
}

Előfordulhat, hogy maga a létrehozott rendszerkép is szűrve van. Ebben az esetben a hibaüzenet A generált képet a biztonsági rendszerünk szűrte le. Íme egy példa:

{
    "created": 1698435368,
    "error":
    {
        "code": "contentFilter",
        "message": "Generated image was filtered as a result of our safety system."
    }
}

Szövegből képre generálási utasítások írása

A kéréseknek le kell írniuk a képen megjeleníteni kívánt tartalmat és a kép vizuális stílusát.

Amikor rákérdez, vegye figyelembe, hogy a Kép API-k tartalommoderálási szűrőt tartalmaznak. Ha a szolgáltatás a kérést káros tartalomként ismeri fel, nem hoz létre képet. További információ: Tartalomszűrés.

Jótanács

A szövegkérések különböző típusú képek létrehozására való finomhangolásának részletes megismeréséhez tekintse meg az Image prompt mérnöki útmutatóját.

API-beállítások megadása

A képgenerálási modellekhez az alábbi API-törzsparaméterek érhetők el.

GPT-image-1
DALL-E 3

Méret

Adja meg a létrehozott képek méretét. A GPT-image-1 modellek esetében az egyiknek 1024x1024, 1024x1536 vagy 1536x1024 formátumúnak kell lennie. A négyzetes képek gyorsabban generálódnak.

Minőség

A képminőségnek három lehetősége van: low, mediumés high. Az alacsonyabb minőségű képek gyorsabban hozhatók létre.

Az alapértelmezett érték a high.

Szám

Egyetlen API-hívással egy és tíz kép között hozhat létre. Az alapértelmezett érték a 1.

Felhasználói azonosító

A felhasználói paraméterrel egyedi azonosítót adhat meg a kérést küldő felhasználó számára. Ez hasznos a használati minták nyomon követéséhez és monitorozásához. Az érték bármilyen sztring lehet, például felhasználói azonosító vagy e-mail-cím.

Kimeneti formátum

A létrehozott kép formátumának megadásához használja a output_format paramétert. A támogatott formátumok a következők PNG : és JPEG. Az alapértelmezett érték a PNG.

Megjegyzés:

A WEBP-rendszerképek nem támogatottak az Azure OpenAI-ban az Azure AI Foundry-modellekben.

Tömörítés

A létrehozott kép tömörítési szintjének megadásához használja a output_compression paramétert. Adjon meg egy egész számot 0 és 100 között, ahol a 0 nem tartalmaz tömörítést, a 100 pedig maximális tömörítést jelent. Az alapértelmezett érték a 100.

Méret

Adja meg a létrehozott képek méretét. A DALL-E 3 modellek egyikének 1024x10241792x1024kell 1024x1792 lennie. A négyzetes képek gyorsabban generálódnak.

Stílus

A DALL-E 3 két stíluslehetőséget kínál: natural és vivid. A természetes stílus jobban hasonlít a régebbi modellek alapértelmezett stílusához, míg az élénk stílus több hiper-valós és filmszerű képet hoz létre.

A természetes stílus akkor hasznos, ha a DALL-E 3 túltúlozza vagy összezavar egy témát, amelynek egyszerűbbnek, visszafogottabbnak vagy reálisabbnak kell lennie.

Az alapértelmezett érték a vivid.

Minőség

A képminőségnek két lehetősége van: hd és standard. A hd beállítás finomabb részletekkel és nagyobb konzisztenciával hozza létre a képeket. A standard rendszerképek gyorsabban hozhatók létre.

Az alapértelmezett érték a standard.

Szám

A 3. DALL-E egyetlen API-hívásban nem hozhat létre több képet: a n paramétert 1 értékre kell állítani. Ha egyszerre több képet kell létrehoznia, párhuzamos kéréseket kell végeznie.

Válaszformátum

Az a formátum, amelyben a DALL-E 3 generált képek visszaküldve lesznek. A url vagy b64_jsonegyikének kell lennie. Ez a paraméter nem támogatott a GPT-image-1 esetében, amely mindig base64 kódolású képeket ad vissza.

A Kép szerkesztése API meghívása

Az Image Edit API lehetővé teszi a meglévő képek módosítását az Ön által megadott szöveges kérések alapján. Az API-hívás hasonló a képgenerálási API-híváshoz, de be kell adnia egy bemeneti képet is.

Fontos

A bemeneti képnek 20 MB-nál kisebb méretűnek kell lennie, és PNG- vagy JPG-fájlnak kell lennie.

GPT-image-1
DALL-E 3

POST-kérés küldése a következő címre:

https://<your_resource_name>.openai.azure.com/openai/deployments/<your_deployment_name>/images/edits?api-version=<api_version>

URL-cím:

Cserélje le a következő értékeket:

<your_resource_name> Az Azure OpenAI-erőforrás neve.
<your_deployment_name> a DALL-E 3- vagy GPT-image-1 modell üzembe helyezésének neve.
<api_version> A használni kívánt API-verzió. Például: 2025-04-01-preview.

Szükséges fejlécek:

Content-Type: multipart/form-data
api-key: <your_API_key>

törzs:

Az alábbiakban egy mintakérés törzse található. A későbbi szakaszokban definiált beállítások közül választhat.

Fontos

A Képszerkesztési API többrészes/űrlapadatokat vesz fel, nem JSON-adatokat. Az alábbi példa egy cURL-kérelemhez csatolandó mintaűrlapadatokat mutatja be.

-F "image[]=@beach.png" \
-F 'prompt=Add a beach ball in the center' \
-F "model=gpt-image-1" \
-F "size=1024x1024" \
-F "n=1" \
-F "quality=high"

Kimenet

A sikeres képszerkesztő API-hívás válasza az alábbi példához hasonlóan néz ki. A b64_json mező a kimeneti kép adatait tartalmazza.

{ 
    "created": 1698116662, 
    "data": [ 
        { 
            "b64_json": "<base64 image data>",
            "revised_prompt": "<prompt_that_was_used>" 
        }
    ]
}

API-beállítások megadása

A képszerkesztő modellekhez az alábbi API-törzsparaméterek érhetők el a képgenerálási modelleken kívül.

Image

A kép értéke a szerkeszteni kívánt képfájlt jelzi.

Maszk

A maszk paraméter típusa megegyezik a fő képbeviteli paraméter típusával. A kép adott területét határozza meg, amelyet a modell segítségével szeretne szerkeszteni, ezeken a területeken teljesen átlátszó képpontokkal (nulla alfával). A maszknak PNG-fájlnak kell lennie, és ugyanolyan dimenziókkal kell rendelkeznie, mint a bemeneti képnek.

Megosztás a következőn keresztül:

Az Azure OpenAI rendszerkép-létrehozási modelljeinek használata

Előfeltételek

Az Image Generation API meghívása

Kimenet

API-hívás elutasítása

Szövegből képre generálási utasítások írása

API-beállítások megadása

Méret

Minőség

Szám

Felhasználói azonosító

Kimeneti formátum

Tömörítés

A Kép szerkesztése API meghívása

Kimenet

API-beállítások megadása

Image

Maszk

Kapcsolódó tartalom

Visszajelzés

További források