Compartilhar via


Como trabalhar com os modelos do DALL-E

Os modelos do DALL-E do OpenAI geram imagens com base nos prompts de texto fornecidos pelo usuário. Este guia demonstra como usar os modelos do DALL-E e configurar as opções por chamadas à API REST.

Pré-requisitos

Chamar as APIs de Geração de Imagem

O comando a seguir mostra a maneira mais básica de usar o DALL-E com código. Se esta for sua primeira vez usando esses modelos programaticamente, recomendamos começar com o início rápido do DALL-E.

Enviar uma solicitação POST para:

https://<your_resource_name>.openai.azure.com/openai/deployments/<your_deployment_name>/images/generations?api-version=<api_version>

Substitua os seguintes espaços reservados:

  • <your_resource_name> é o nome do seu recurso OpenAI do Azure.
  • <your_deployment_name> é o nome da implantação do modelo do DALL-E 3.
  • <api_version> é a versão da API que você deseja usar. Por exemplo, 2024-02-01.

Cabeçalhos necessários:

  • Content-Type: application/json
  • api-key: <your_API_key>

Corpo:

Veja a seguir um corpo de solicitação de exemplo. Especifique várias opções, definidas nas seções posteriores.

{
    "prompt": "A multi-colored umbrella on the beach, disposable camera",
    "size": "1024x1024", 
    "n": 1,
    "quality": "hd", 
    "style": "vivid"
}

Saída

A saída de uma chamada à API de geração de imagem bem-sucedida tem a seguinte aparência. O campo url contém uma URL na qual é possível baixar a imagem gerada. A URL permanece ativa por 24 horas.

{ 
    "created": 1698116662, 
    "data": [ 
        { 
            "url": "<URL_to_generated_image>",
            "revised_prompt": "<prompt_that_was_used>" 
        }
    ]
} 

Rejeição de chamada à API

Os prompts e imagens são filtrados com base na nossa política de conteúdo, retornando um erro quando um prompt ou imagem é sinalizado.

Se o prompt for sinalizado, o valor error.code na mensagem será definido como contentFilter. Veja um exemplo:

{
    "created": 1698435368,
    "error":
    {
        "code": "contentFilter",
        "message": "Your task failed as a result of our safety system."
    }
}

Também é possível que a própria imagem gerada seja filtrada. Nesse caso, a mensagem de erro é definida como Imagem gerada foi filtrada como resultado de nosso sistema de segurança. Veja um exemplo:

{
    "created": 1698435368,
    "error":
    {
        "code": "contentFilter",
        "message": "Generated image was filtered as a result of our safety system."
    }
}

Gravação de prompts de imagem

Os prompts de imagem devem descrever o conteúdo que você deseja ver na imagem e o estilo visual da imagem.

Ao gravar prompts, considere que as APIs de geração de imagem vêm com um filtro de moderação de conteúdo. Se o serviço reconhecer seu prompt como conteúdo prejudicial, ele não gera uma imagem. Para obter mais informações, consulte o artigo Filtragem de conteúdo.

Dica

Para obter uma visão detalhada de como ajustar os prompts de texto para gerar diferentes tipos de imagens, consulte o Guia de engenharia de prompts de imagem.

Especificar opções de API

Os parâmetros de corpo da API a seguir estão disponíveis para a geração de imagem do DALL-E.

Tamanho

Especifique o tamanho das imagens geradas. Deve ser 1024x1024, 1792x1024 ou 1024x1792 para modelos do DALL-E 3. Imagens quadradas são geradas mais rapidamente.

Estilo

O DALL-E 3 apresenta duas opções de estilo: natural e vivid. O estilo natural é mais semelhante ao estilo padrão do DALL-E 2, enquanto o estilo vívido gera mais imagens hiper-reais e cinematográficas.

O estilo natural é útil nos casos em que o DALL-E 3 exagera ou confunde um assunto que deve ser mais simples, subjugado ou realista.

O valor padrão é vivid.

Quality

Há duas opções para a qualidade da imagem: hd e standard. A opção hd cria imagens com detalhes mais finos e maior consistência em toda a imagem. As imagens padrão podem ser geradas mais rapidamente.

O valor padrão é standard.

Número

Com o DALL-E 3, você não pode gerar mais de uma imagem em uma única chamada à API: no parâmetro deve ser definido como 1. Se você precisar gerar várias imagens ao mesmo tempo, faça solicitações paralelas.

Formato de resposta

O formato no qual as imagens geradas são retornadas. Deve ser url (uma URL apontando para a imagem) ou b64_json (o código base de 64 bytes no formato JSON). O padrão é url.