Sdílet prostřednictvím


Jak pracovat s modely DALL-E

Modely DALL-E openAI generují obrázky na základě uživatelem zadaných textových výzev. Tato příručka ukazuje, jak používat modely DALL-E a konfigurovat jejich možnosti prostřednictvím volání rozhraní REST API.

Požadavky

  • Předplatné Azure. Můžete si ho zdarma vytvořit.
  • Prostředek Azure OpenAI vytvořený v oblasti Švédsko – střed . Další informace najdete v tématu Vytvoření a nasazení prostředku služby Azure OpenAI.
  • Nasaďte model dall-e-3 s prostředkem Azure OpenAI.

Volání rozhraní API pro generování imagí

Následující příkaz ukazuje nejzásadnější způsob použití DALL-E s kódem. Pokud tyto modely používáte programově poprvé, doporučujeme začít rychlým startem DALL-E.

Odešlete požadavek POST na:

https://<your_resource_name>.openai.azure.com/openai/deployments/<your_deployment_name>/images/generations?api-version=<api_version>

Nahraďte následující zástupné symboly:

  • <your_resource_name> je název vašeho prostředku Azure OpenAI.
  • <your_deployment_name> je název nasazení modelu DALL-E 3.
  • <api_version> je verze rozhraní API, které chcete použít. Například 2024-02-01.

Povinná záhlaví:

  • Content-Type: application/json
  • api-key: <your_API_key>

Text:

Následuje ukázkový text požadavku. Zadáte řadu možností definovaných v pozdějších částech.

{
    "prompt": "A multi-colored umbrella on the beach, disposable camera",
    "size": "1024x1024", 
    "n": 1,
    "quality": "hd", 
    "style": "vivid"
}

Výstup

Výstup z úspěšného volání rozhraní API pro generování imagí vypadá jako v následujícím příkladu. Pole url obsahuje adresu URL, kde si můžete stáhnout vygenerovaný obrázek. Adresa URL zůstane aktivní po dobu 24 hodin.

{ 
    "created": 1698116662, 
    "data": [ 
        { 
            "url": "<URL_to_generated_image>",
            "revised_prompt": "<prompt_that_was_used>" 
        }
    ]
} 

Odmítnutí volání rozhraní API

Výzvy a obrázky se filtrují na základě našich zásad obsahu a vrací chybu při zobrazení výzvy nebo obrázku s příznakem.

Pokud je výzva označena příznakem, error.code hodnota ve zprávě je nastavena na contentFilterhodnotu . Tady je příklad:

{
    "created": 1698435368,
    "error":
    {
        "code": "contentFilter",
        "message": "Your task failed as a result of our safety system."
    }
}

Je také možné, že se vygenerovaná image filtruje. V tomto případě je chybová zpráva nastavena na Vygenerovaný obrázek byl filtrován v důsledku našeho bezpečnostního systému. Tady je příklad:

{
    "created": 1698435368,
    "error":
    {
        "code": "contentFilter",
        "message": "Generated image was filtered as a result of our safety system."
    }
}

Psaní výzev k obrázku

Výzvy k obrázku by měly popisovat obsah, který chcete vidět na obrázku, a vizuální styl obrázku.

Při psaní výzev vezměte v úvahu, že rozhraní API pro generování obrázků mají filtr kon režim stanu ration. Pokud služba rozpozná vaši výzvu jako škodlivý obsah, nevygeneruje obrázek. Další informace najdete v tématu Filtrování obsahu.

Tip

Důkladný přehled o tom, jak můžete upravit textové výzvy k vygenerování různých druhů obrázků, najdete v průvodci technikou výzvy k zobrazení obrázku.

Určení možností rozhraní API

Následující parametry těla rozhraní API jsou k dispozici pro generování imagí DALL-E.

Velikost

Zadejte velikost vygenerovaných imagí. Musí to být jeden z 1024x1024modelů , 1792x1024nebo 1024x1792 pro MODELY DALL-E 3. Čtvercové obrázky se generují rychleji.

Styl

DALL-E 3 zavádí dvě možnosti stylu: natural a vivid. Přirozený styl je více podobný výchozímu stylu DALL-E 2, zatímco živý styl generuje více hyper-reálné a kinematografické obrázky.

Přirozený styl je užitečný v případech, kdy DALL-E 3 přehání nebo zaměňuje předmět, který má být jednodušší, subduduovaný nebo realistický.

Výchozí hodnota je vivid.

Kvalita

Existují dvě možnosti pro kvalitu obrázku: hd a standard. Možnost hd vytvoří obrázky s jemnými podrobnostmi a větší konzistencí na obrázku. Standardní image je možné generovat rychleji.

Výchozí hodnota je standard.

Počet

U DALL-E 3 nemůžete v jednom volání rozhraní API vygenerovat více než jednu image: n parametr musí být nastavený na hodnotu 1. Pokud potřebujete vygenerovat více imagí najednou, proveďte paralelní žádosti.

Formát odpovědi

Formát, ve kterém se vrátí vygenerované obrázky. Musí to být jedna z url (adresa URL odkazující na obrázek) nebo b64_json (základní kód 64 bajtů ve formátu JSON). Výchozí hodnota je url.