Megosztás a következőn keresztül:


Az Azure OpenAI rendszerkép-létrehozási modelljeinek használata

Az OpenAI képgenerálási modelljei a felhasználó által megadott szöveges kérések és opcionálisan megadott képek alapján renderelik a képeket. Ez az útmutató bemutatja, hogyan használhatja a képgenerálási modelleket, és hogyan konfigurálhatja a beállításait REST API-hívásokon keresztül.

Előfeltételek

Az Image Generation API meghívása

Az alábbi parancs a képmodell kóddal való használatának legalapvetőbb módját mutatja be. Ha ez az első alkalom, hogy programozott módon használja ezeket a modelleket, javasoljuk, hogy kezdje a rövid útmutatóval.

POST-kérés küldése a következő címre:

https://<your_resource_name>.openai.azure.com/openai/deployments/<your_deployment_name>/images/generations?api-version=<api_version>

URL-cím:

Cserélje le a következő értékeket:

  • <your_resource_name> Az Azure OpenAI-erőforrás neve.
  • <your_deployment_name> a DALL-E 3- vagy GPT-image-1 modell üzembe helyezésének neve.
  • <api_version> A használni kívánt API-verzió. Például: 2025-04-01-preview.

Szükséges fejlécek:

  • Content-Type: application/json
  • api-key: <your_API_key>

törzs:

Az alábbiakban egy mintakérés törzse található. A későbbi szakaszokban definiált beállítások közül választhat.

{
    "prompt": "A multi-colored umbrella on the beach, disposable camera",
    "model": "gpt-image-1",
    "size": "1024x1024", 
    "n": 1,
    "quality": "high"
}

Jótanács

A képgenerálási jogkivonatok költségeiről a Kép jogkivonatok című témakörben olvashat.

Kimenet

A sikeres képgenerálási API-hívás válasza az alábbi példához hasonlóan néz ki. A url mező egy URL-címet tartalmaz, ahová letöltheti a létrehozott lemezképet. Az URL-cím 24 órán át aktív marad.

{ 
    "created": 1698116662, 
    "data": [ 
        { 
            "url": "<URL_to_generated_image>",
            "revised_prompt": "<prompt_that_was_used>" 
        }
    ]
} 

API-hívás elutasítása

A rendszer a kéréseket és képeket a tartalomszabályzatunk alapján szűri, és hibaüzenetet ad vissza, ha egy üzenet vagy kép meg van jelölve.

Ha a rendszer megjelöli a kérést, az error.code üzenet értéke a következőre contentFiltervan állítva: . Íme egy példa:

{
    "created": 1698435368,
    "error":
    {
        "code": "contentFilter",
        "message": "Your task failed as a result of our safety system."
    }
}

Előfordulhat, hogy maga a létrehozott rendszerkép is szűrve van. Ebben az esetben a hibaüzenet A generált képet a biztonsági rendszerünk szűrte le. Íme egy példa:

{
    "created": 1698435368,
    "error":
    {
        "code": "contentFilter",
        "message": "Generated image was filtered as a result of our safety system."
    }
}

Szövegből képre generálási utasítások írása

A kéréseknek le kell írniuk a képen megjeleníteni kívánt tartalmat és a kép vizuális stílusát.

Amikor rákérdez, vegye figyelembe, hogy a Kép API-k tartalommoderálási szűrőt tartalmaznak. Ha a szolgáltatás a kérést káros tartalomként ismeri fel, nem hoz létre képet. További információ: Tartalomszűrés.

Jótanács

A szövegkérések különböző típusú képek létrehozására való finomhangolásának részletes megismeréséhez tekintse meg az Image prompt mérnöki útmutatóját.

API-beállítások megadása

A képgenerálási modellekhez az alábbi API-törzsparaméterek érhetők el.

Méret

Adja meg a létrehozott képek méretét. A GPT-image-1 modellek esetében az egyiknek 1024x1024, 1024x1536 vagy 1536x1024 formátumúnak kell lennie. A négyzetes képek gyorsabban generálódnak.

Minőség

A képminőségnek három lehetősége van: low, mediumés high. Az alacsonyabb minőségű képek gyorsabban hozhatók létre.

Az alapértelmezett érték a high.

Szám

Egyetlen API-hívással egy és tíz kép között hozhat létre. Az alapértelmezett érték a 1.

Felhasználói azonosító

A felhasználói paraméterrel egyedi azonosítót adhat meg a kérést küldő felhasználó számára. Ez hasznos a használati minták nyomon követéséhez és monitorozásához. Az érték bármilyen sztring lehet, például felhasználói azonosító vagy e-mail-cím.

Kimeneti formátum

A létrehozott kép formátumának megadásához használja a output_format paramétert. A támogatott formátumok a következők PNG : és JPEG. Az alapértelmezett érték a PNG.

Megjegyzés:

A WEBP-rendszerképek nem támogatottak az Azure OpenAI-ban az Azure AI Foundry-modellekben.

Tömörítés

A létrehozott kép tömörítési szintjének megadásához használja a output_compression paramétert. Adjon meg egy egész számot 0 és 100 között, ahol a 0 nem tartalmaz tömörítést, a 100 pedig maximális tömörítést jelent. Az alapértelmezett érték a 100.

A Kép szerkesztése API meghívása

Az Image Edit API lehetővé teszi a meglévő képek módosítását az Ön által megadott szöveges kérések alapján. Az API-hívás hasonló a képgenerálási API-híváshoz, de be kell adnia egy bemeneti képet is.

Fontos

A bemeneti képnek 20 MB-nál kisebb méretűnek kell lennie, és PNG- vagy JPG-fájlnak kell lennie.

POST-kérés küldése a következő címre:

https://<your_resource_name>.openai.azure.com/openai/deployments/<your_deployment_name>/images/edits?api-version=<api_version>

URL-cím:

Cserélje le a következő értékeket:

  • <your_resource_name> Az Azure OpenAI-erőforrás neve.
  • <your_deployment_name> a DALL-E 3- vagy GPT-image-1 modell üzembe helyezésének neve.
  • <api_version> A használni kívánt API-verzió. Például: 2025-04-01-preview.

Szükséges fejlécek:

  • Content-Type: multipart/form-data
  • api-key: <your_API_key>

törzs:

Az alábbiakban egy mintakérés törzse található. A későbbi szakaszokban definiált beállítások közül választhat.

Fontos

A Képszerkesztési API többrészes/űrlapadatokat vesz fel, nem JSON-adatokat. Az alábbi példa egy cURL-kérelemhez csatolandó mintaűrlapadatokat mutatja be.

-F "image[]=@beach.png" \
-F 'prompt=Add a beach ball in the center' \
-F "model=gpt-image-1" \
-F "size=1024x1024" \
-F "n=1" \
-F "quality=high"

Kimenet

A sikeres képszerkesztő API-hívás válasza az alábbi példához hasonlóan néz ki. A b64_json mező a kimeneti kép adatait tartalmazza.

{ 
    "created": 1698116662, 
    "data": [ 
        { 
            "b64_json": "<base64 image data>",
            "revised_prompt": "<prompt_that_was_used>" 
        }
    ]
} 

API-beállítások megadása

A képszerkesztő modellekhez az alábbi API-törzsparaméterek érhetők el a képgenerálási modelleken kívül.

Image

A kép értéke a szerkeszteni kívánt képfájlt jelzi.

Maszk

A maszk paraméter típusa megegyezik a fő képbeviteli paraméter típusával. A kép adott területét határozza meg, amelyet a modell segítségével szeretne szerkeszteni, ezeken a területeken teljesen átlátszó képpontokkal (nulla alfával). A maszknak PNG-fájlnak kell lennie, és ugyanolyan dimenziókkal kell rendelkeznie, mint a bemeneti képnek.