Como usar modelos de geração de imagem do Azure OpenAI

2025-07-02

Os modelos de geração de imagens da OpenAI renderizam imagens com base em prompts de texto fornecidos pelo usuário e, opcionalmente, imagens fornecidas. Este guia demonstra como usar os modelos de geração de imagem e configurar suas opções por meio de chamadas de API REST.

Pré-requisitos

Uma assinatura do Azure. Você pode criar um gratuitamente.
Um recurso OpenAI do Azure criado em uma região com suporte. Consulte Disponibilidade da região.
Implante um dall-e-3 ou gpt-image-1 modelo com seu recurso do Azure OpenAI. Para obter mais informações sobre implantações, consulte Criar um recurso e implantar um modelo com o Azure OpenAI.
- GPT-image-1 é o modelo mais recente e apresenta uma série de melhorias em relação ao DALL-E 3. Está disponível em acesso limitado: solicite o acesso com este formulário.

Chamar a API de geração de imagens

O comando a seguir mostra a maneira mais básica de usar um modelo de imagem com código. Se esta é a primeira vez que utiliza estes modelos programaticamente, recomendamos que comece com o início rápido.

GPT-Imagem-1
DALL-E 3

Envie um pedido POST para:

https://<your_resource_name>.openai.azure.com/openai/deployments/<your_deployment_name>/images/generations?api-version=<api_version>

Endereço URL:

Substitua os seguintes valores:

<your_resource_name> é o nome do seu recurso Azure OpenAI.
<your_deployment_name> é o nome da implantação do modelo DALL-E 3 ou GPT-image-1.
<api_version> é a versão da API que você deseja usar. Por exemplo, 2025-04-01-preview.

Cabeçalhos obrigatórios:

Content-Type: application/json
api-key: <your_API_key>

Corpo:

A seguir está um corpo de solicitação de exemplo. Você especifica um número de opções, definidas em seções posteriores.

{
    "prompt": "A multi-colored umbrella on the beach, disposable camera",
    "model": "gpt-image-1",
    "size": "1024x1024", 
    "n": 1,
    "quality": "high"
}

Envie um pedido POST para:

https://<your_resource_name>.openai.azure.com/openai/deployments/<your_deployment_name>/images/generations?api-version=<api_version>

Endereço URL:

Substitua os seguintes valores:

<your_resource_name> é o nome do seu recurso Azure OpenAI.
<your_deployment_name> é o nome da implantação do modelo DALL-E 3 ou GPT-image-1.
<api_version> é a versão da API que você deseja usar. Por exemplo, 2024-02-01.

Cabeçalhos obrigatórios:

Content-Type: application/json
api-key: <your_API_key>

Corpo:

A seguir está um corpo de solicitação de exemplo. Você especifica um número de opções, definidas em seções posteriores.

{
    "prompt": "A multi-colored umbrella on the beach, disposable camera",
    "size": "1024x1024", 
    "n": 1,
    "quality": "hd", 
    "style": "vivid"
}

Sugestão

Para custos de token de geração de imagem, consulte Tokens de imagem.

Resultado

A resposta de uma chamada de API de geração de imagem bem-sucedida se parece com o exemplo a seguir. O url campo contém um URL onde pode descarregar a imagem gerada. O URL permanece ativo por 24 horas.

{ 
    "created": 1698116662, 
    "data": [ 
        { 
            "url": "<URL_to_generated_image>",
            "revised_prompt": "<prompt_that_was_used>" 
        }
    ]
}

Rejeição de chamada de API

Prompts e imagens são filtrados com base em nossa política de conteúdo, retornando um erro quando um prompt ou imagem é sinalizado.

Se o prompt for sinalizado, o error.code valor na mensagem será definido como contentFilter. Aqui está um exemplo:

{
    "created": 1698435368,
    "error":
    {
        "code": "contentFilter",
        "message": "Your task failed as a result of our safety system."
    }
}

Também é possível que a própria imagem gerada seja filtrada. Neste caso, a mensagem de erro está definida como Imagem gerada foi filtrada como resultado do nosso sistema de segurança. Aqui está um exemplo:

{
    "created": 1698435368,
    "error":
    {
        "code": "contentFilter",
        "message": "Generated image was filtered as a result of our safety system."
    }
}

Escrever prompts de texto em imagem

Seus prompts devem descrever o conteúdo que você deseja ver na imagem e o estilo visual da imagem.

Ao escrever prompts, tenha em consideração que as APIs de imagem vêm com um filtro de moderação de conteúdo. Se o serviço reconhecer seu prompt como conteúdo prejudicial, ele não gerará uma imagem. Para obter mais informações, consulte Filtragem de conteúdo.

Sugestão

Para uma visão completa de como você pode ajustar seus prompts de texto para gerar diferentes tipos de imagens, consulte o Guia de engenharia de prompt de imagem.

Especificar opções da API

Os seguintes parâmetros de corpo da API estão disponíveis para modelos de geração de imagem.

GPT-Imagem-1
DALL-E 3

Tamanho

Especifique o tamanho das imagens geradas. Deve ser um dos 1024x1024, 1024x1536 ou 1536x1024 modelos para GPT-image-1. As imagens quadradas são mais rápidas de gerar.

Qualidade

Existem três opções para a qualidade da imagem: low, medium, e high. Imagens de qualidade inferior podem ser geradas mais rapidamente.

O valor predefinido é high.

Número

Você pode gerar entre uma e 10 imagens em uma única chamada de API. O valor predefinido é 1.

ID de utilizador

Use o parâmetro user para especificar um identificador exclusivo para o usuário que faz a solicitação. Isso é útil para rastrear e monitorar padrões de uso. O valor pode ser qualquer cadeia de caracteres, como um ID de usuário ou endereço de e-mail.

Formato de saída

Use o parâmetro output_format para especificar o formato da imagem gerada. Os formatos suportados são PNG e JPEG. A predefinição é PNG.

Observação

As imagens WEBP não são suportadas no Azure OpenAI nos Modelos do Azure AI Foundry.

Compressão

Use o parâmetro output_compression para especificar o nível de compactação para a imagem gerada. Insira um inteiro entre 0 e 100, onde 0 é sem compressão e 100 é compressão máxima. A predefinição é 100.

Tamanho

Especifique o tamanho das imagens geradas. Deve ser um dos 1024x1024modelos , 1792x1024, ou 1024x1792 para DALL-E 3. As imagens quadradas são mais rápidas de gerar.

Estilo

DALL-E 3 oferece duas opções de estilo: natural e vivid. O estilo natural é mais semelhante ao estilo padrão de modelos mais antigos, enquanto o estilo vívido gera imagens mais hiper-reais e cinematográficas.

O estilo natural é útil nos casos em que o DALL-E 3 exagera ou confunde um assunto que deveria ser mais simples, moderado ou realista.

O valor predefinido é vivid.

Qualidade

Existem duas opções para a qualidade da imagem: hd e standard. A opção hd cria imagens com detalhes mais finos e maior consistência em toda a imagem. As imagens padrão podem ser geradas mais rapidamente.

O valor predefinido é standard.

Número

Com o DALL-E 3, não é possível gerar mais de uma imagem em uma única chamada de API: o n parâmetro deve ser definido como 1. Se você precisar gerar várias imagens ao mesmo tempo, faça solicitações paralelas.

Formato da resposta

O formato no qual são retornadas as imagens geradas em DALL-E 3. Deve ser um dos url ou b64_json. Este parâmetro não é suportado para GPT-image-1, que sempre retorna imagens codificadas em base64.

Chamar a API de edição de imagem

A API de edição de imagem permite modificar imagens existentes com base nos prompts de texto fornecidos. A chamada de API é semelhante à chamada de API de geração de imagem, mas você também precisa fornecer uma imagem de entrada.

Importante

A imagem de entrada deve ter menos de 20 MB de tamanho e deve ser um arquivo PNG ou JPG.

GPT-Imagem-1
DALL-E 3

Envie um pedido POST para:

https://<your_resource_name>.openai.azure.com/openai/deployments/<your_deployment_name>/images/edits?api-version=<api_version>

Endereço URL:

Substitua os seguintes valores:

<your_resource_name> é o nome do seu recurso Azure OpenAI.
<your_deployment_name> é o nome da implantação do modelo DALL-E 3 ou GPT-image-1.
<api_version> é a versão da API que você deseja usar. Por exemplo, 2025-04-01-preview.

Cabeçalhos obrigatórios:

Content-Type: multipart/form-data
api-key: <your_API_key>

Corpo:

A seguir está um corpo de solicitação de exemplo. Você especifica um número de opções, definidas em seções posteriores.

Importante

A API de edição de imagem usa dados de várias partes/formulários, não dados JSON. O exemplo abaixo mostra dados de formulário de exemplo que seriam anexados a uma solicitação cURL.

-F "image[]=@beach.png" \
-F 'prompt=Add a beach ball in the center' \
-F "model=gpt-image-1" \
-F "size=1024x1024" \
-F "n=1" \
-F "quality=high"

Resultado

A resposta de uma chamada de API de edição de imagem bem-sucedida se parece com o exemplo a seguir. O b64_json campo contém os dados da imagem de saída.

{ 
    "created": 1698116662, 
    "data": [ 
        { 
            "b64_json": "<base64 image data>",
            "revised_prompt": "<prompt_that_was_used>" 
        }
    ]
}

Especificar opções da API

Os seguintes parâmetros de corpo da API estão disponíveis para modelos de edição de imagem, além dos disponíveis para modelos de geração de imagem.

Imagem

O valor da imagem indica o arquivo de imagem que você deseja editar.

Máscara

O parâmetro mask é do mesmo tipo que o parâmetro de entrada de imagem principal. Ele define a área da imagem que você deseja que o modelo edite, usando pixels totalmente transparentes (alfa de zero) nessas áreas. A máscara deve ser um arquivo PNG e ter as mesmas dimensões da imagem de entrada.

Compartilhar via

Como usar modelos de geração de imagem do Azure OpenAI

Pré-requisitos

Chamar a API de geração de imagens

Resultado

Rejeição de chamada de API

Escrever prompts de texto em imagem

Especificar opções da API

Tamanho

Qualidade

Número

ID de utilizador

Formato de saída

Compressão

Chamar a API de edição de imagem

Resultado

Especificar opções da API

Imagem

Máscara

Conteúdo relacionado

Comentários

Recursos adicionais