Partilhar via


Como trabalhar com os modelos DALL-E

Os modelos DALL-E da OpenAI geram imagens com base em prompts de texto fornecidos pelo usuário. Este guia demonstra como usar os modelos DALL-E e configurar suas opções por meio de chamadas de API REST.

Pré-requisitos

  • Uma subscrição do Azure. Você pode criar um gratuitamente.
  • Um recurso OpenAI do Azure criado na região Central da Suécia. Para obter mais informações, consulte Criar e implantar um recurso do Serviço OpenAI do Azure.
  • Implante um modelo dall-e-3 com seu recurso do Azure OpenAI.

Chamar as APIs de geração de imagem

O comando a seguir mostra a maneira mais básica de usar DALL-E com código. Se esta é a primeira vez que utiliza estes modelos programaticamente, recomendamos que comece com o início rápido DALL-E.

Envie um pedido POST para:

https://<your_resource_name>.openai.azure.com/openai/deployments/<your_deployment_name>/images/generations?api-version=<api_version>

Substitua os seguintes espaços reservados:

  • <your_resource_name> é o nome do seu recurso Azure OpenAI.
  • <your_deployment_name> é o nome da implantação do modelo DALL-E 3.
  • <api_version> é a versão da API que você deseja usar. Por exemplo, 2024-02-01.

Cabeçalhos obrigatórios:

  • Content-Type: application/json
  • api-key: <your_API_key>

Corpo:

A seguir está um corpo de solicitação de exemplo. Você especifica um número de opções, definidas em seções posteriores.

{
    "prompt": "A multi-colored umbrella on the beach, disposable camera",
    "size": "1024x1024", 
    "n": 1,
    "quality": "hd", 
    "style": "vivid"
}

Saída

A saída de uma chamada de API de geração de imagem bem-sucedida se parece com o exemplo a seguir. O url campo contém um URL onde pode descarregar a imagem gerada. O URL permanece ativo por 24 horas.

{ 
    "created": 1698116662, 
    "data": [ 
        { 
            "url": "<URL_to_generated_image>",
            "revised_prompt": "<prompt_that_was_used>" 
        }
    ]
} 

Rejeição de chamada de API

Prompts e imagens são filtrados com base em nossa política de conteúdo, retornando um erro quando um prompt ou imagem é sinalizado.

Se o prompt for sinalizado, o error.code valor na mensagem será definido como contentFilter. Eis um exemplo:

{
    "created": 1698435368,
    "error":
    {
        "code": "contentFilter",
        "message": "Your task failed as a result of our safety system."
    }
}

Também é possível que a própria imagem gerada seja filtrada. Neste caso, a mensagem de erro está definida como Imagem gerada foi filtrada como resultado do nosso sistema de segurança. Eis um exemplo:

{
    "created": 1698435368,
    "error":
    {
        "code": "contentFilter",
        "message": "Generated image was filtered as a result of our safety system."
    }
}

Gravando prompts de imagem

Os prompts de imagem devem descrever o conteúdo que você deseja ver na imagem e o estilo visual da imagem.

Ao escrever prompts, considere que as APIs de geração de imagem vêm com um filtro de moderação de conteúdo. Se o serviço reconhecer seu prompt como conteúdo prejudicial, ele não gerará uma imagem. Para obter mais informações, consulte Filtragem de conteúdo.

Gorjeta

Para uma visão completa de como você pode ajustar seus prompts de texto para gerar diferentes tipos de imagens, consulte o Guia de engenharia de prompt de imagem.

Especificar opções da API

Os seguintes parâmetros de corpo da API estão disponíveis para geração de imagem DALL-E.

Tamanho

Especifique o tamanho das imagens geradas. Deve ser um dos 1024x1024modelos , 1792x1024, ou 1024x1792 para DALL-E 3. As imagens quadradas são mais rápidas de gerar.

Estilo

DALL-E 3 introduz duas opções de estilo: natural e vivid. O estilo natural é mais semelhante ao estilo padrão DALL-E 2, enquanto o estilo vívido gera imagens mais hiper-reais e cinematográficas.

O estilo natural é útil nos casos em que o DALL-E 3 exagera ou confunde um assunto que deveria ser mais simples, moderado ou realista.

O valor predefinido é vivid.

Qualidade

Existem duas opções para a qualidade da imagem: hd e standard. A opção hd cria imagens com detalhes mais finos e maior consistência em toda a imagem. As imagens padrão podem ser geradas mais rapidamente.

O valor predefinido é standard.

Número

Com o DALL-E 3, você não pode gerar mais de uma imagem em uma única chamada de API: o n parâmetro deve ser definido como 1. Se você precisar gerar várias imagens ao mesmo tempo, faça solicitações paralelas.

Formato da resposta

O formato em que as imagens geradas são retornadas. Deve ser um dos (um URL apontando para a imagem) ou b64_json (o código base de url 64 bytes no formato JSON). A predefinição é url.