Como trabalhar com os modelos do DALL-E
Os modelos do DALL-E do OpenAI geram imagens com base nos prompts de texto fornecidos pelo usuário. Este guia demonstra como usar os modelos do DALL-E e configurar as opções por chamadas à API REST.
Pré-requisitos
- Uma assinatura do Azure. É possível criar uma gratuitamente.
- Um recurso do OpenAI do Azure criado na região Suécia Central. Para obter mais informações, consulte Criar e implantar um recurso do Serviço OpenAI do Azure.
- Implante um modelo de dall-e-3 com o recurso do OpenAI do Azure.
Chamar as APIs de Geração de Imagem
O comando a seguir mostra a maneira mais básica de usar o DALL-E com código. Se esta for sua primeira vez usando esses modelos programaticamente, recomendamos começar com o início rápido do DALL-E.
Enviar uma solicitação POST para:
https://<your_resource_name>.openai.azure.com/openai/deployments/<your_deployment_name>/images/generations?api-version=<api_version>
Substitua os seguintes espaços reservados:
<your_resource_name>
é o nome do seu recurso OpenAI do Azure.<your_deployment_name>
é o nome da implantação do modelo do DALL-E 3.<api_version>
é a versão da API que você deseja usar. Por exemplo,2024-02-01
.
Cabeçalhos necessários:
Content-Type
:application/json
api-key
:<your_API_key>
Corpo:
Veja a seguir um corpo de solicitação de exemplo. Especifique várias opções, definidas nas seções posteriores.
{
"prompt": "A multi-colored umbrella on the beach, disposable camera",
"size": "1024x1024",
"n": 1,
"quality": "hd",
"style": "vivid"
}
Saída
A saída de uma chamada à API de geração de imagem bem-sucedida tem a seguinte aparência. O campo url
contém uma URL na qual é possível baixar a imagem gerada. A URL permanece ativa por 24 horas.
{
"created": 1698116662,
"data": [
{
"url": "<URL_to_generated_image>",
"revised_prompt": "<prompt_that_was_used>"
}
]
}
Rejeição de chamada à API
Os prompts e imagens são filtrados com base na nossa política de conteúdo, retornando um erro quando um prompt ou imagem é sinalizado.
Se o prompt for sinalizado, o valor error.code
na mensagem será definido como contentFilter
. Veja um exemplo:
{
"created": 1698435368,
"error":
{
"code": "contentFilter",
"message": "Your task failed as a result of our safety system."
}
}
Também é possível que a própria imagem gerada seja filtrada. Nesse caso, a mensagem de erro é definida como Imagem gerada foi filtrada como resultado de nosso sistema de segurança. Veja um exemplo:
{
"created": 1698435368,
"error":
{
"code": "contentFilter",
"message": "Generated image was filtered as a result of our safety system."
}
}
Gravação de prompts de imagem
Os prompts de imagem devem descrever o conteúdo que você deseja ver na imagem e o estilo visual da imagem.
Ao gravar prompts, considere que as APIs de geração de imagem vêm com um filtro de moderação de conteúdo. Se o serviço reconhecer seu prompt como conteúdo prejudicial, ele não gera uma imagem. Para obter mais informações, consulte o artigo Filtragem de conteúdo.
Dica
Para obter uma visão detalhada de como ajustar os prompts de texto para gerar diferentes tipos de imagens, consulte o Guia de engenharia de prompts de imagem.
Especificar opções de API
Os parâmetros de corpo da API a seguir estão disponíveis para a geração de imagem do DALL-E.
Tamanho
Especifique o tamanho das imagens geradas. Deve ser 1024x1024
, 1792x1024
ou 1024x1792
para modelos do DALL-E 3. Imagens quadradas são geradas mais rapidamente.
Estilo
O DALL-E 3 apresenta duas opções de estilo: natural
e vivid
. O estilo natural é mais semelhante ao estilo padrão do DALL-E 2, enquanto o estilo vívido gera mais imagens hiper-reais e cinematográficas.
O estilo natural é útil nos casos em que o DALL-E 3 exagera ou confunde um assunto que deve ser mais simples, subjugado ou realista.
O valor padrão é vivid
.
Quality
Há duas opções para a qualidade da imagem: hd
e standard
. A opção hd cria imagens com detalhes mais finos e maior consistência em toda a imagem. As imagens padrão podem ser geradas mais rapidamente.
O valor padrão é standard
.
Número
Com o DALL-E 3, você não pode gerar mais de uma imagem em uma única chamada à API: n
o parâmetro deve ser definido como 1. Se você precisar gerar várias imagens ao mesmo tempo, faça solicitações paralelas.
Formato de resposta
O formato no qual as imagens geradas são retornadas. Deve ser url
(uma URL apontando para a imagem) ou b64_json
(o código base de 64 bytes no formato JSON). O padrão é url
.