Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
Os modelos de geração de imagens da OpenAI renderizam imagens com base em prompts de texto fornecidos pelo usuário e, opcionalmente, imagens fornecidas. Este guia demonstra como usar os modelos de geração de imagem e configurar suas opções por meio de chamadas de API REST.
Pré-requisitos
- Uma assinatura do Azure. Você pode criar um gratuitamente.
- Um recurso OpenAI do Azure criado em uma região com suporte. Consulte Disponibilidade da região.
- Implante um
dall-e-3
ougpt-image-1
modelo com seu recurso do Azure OpenAI. Para obter mais informações sobre implantações, consulte Criar um recurso e implantar um modelo com o Azure OpenAI.- GPT-image-1 é o modelo mais recente e apresenta uma série de melhorias em relação ao DALL-E 3. Está disponível em acesso limitado: solicite o acesso com este formulário.
Chamar a API de geração de imagens
O comando a seguir mostra a maneira mais básica de usar um modelo de imagem com código. Se esta é a primeira vez que utiliza estes modelos programaticamente, recomendamos que comece com o início rápido.
Envie um pedido POST para:
https://<your_resource_name>.openai.azure.com/openai/deployments/<your_deployment_name>/images/generations?api-version=<api_version>
Endereço URL:
Substitua os seguintes valores:
-
<your_resource_name>
é o nome do seu recurso Azure OpenAI. -
<your_deployment_name>
é o nome da implantação do modelo DALL-E 3 ou GPT-image-1. -
<api_version>
é a versão da API que você deseja usar. Por exemplo,2025-04-01-preview
.
Cabeçalhos obrigatórios:
-
Content-Type
:application/json
-
api-key
:<your_API_key>
Corpo:
A seguir está um corpo de solicitação de exemplo. Você especifica um número de opções, definidas em seções posteriores.
{
"prompt": "A multi-colored umbrella on the beach, disposable camera",
"model": "gpt-image-1",
"size": "1024x1024",
"n": 1,
"quality": "high"
}
Sugestão
Para custos de token de geração de imagem, consulte Tokens de imagem.
Resultado
A resposta de uma chamada de API de geração de imagem bem-sucedida se parece com o exemplo a seguir. O url
campo contém um URL onde pode descarregar a imagem gerada. O URL permanece ativo por 24 horas.
{
"created": 1698116662,
"data": [
{
"url": "<URL_to_generated_image>",
"revised_prompt": "<prompt_that_was_used>"
}
]
}
Rejeição de chamada de API
Prompts e imagens são filtrados com base em nossa política de conteúdo, retornando um erro quando um prompt ou imagem é sinalizado.
Se o prompt for sinalizado, o error.code
valor na mensagem será definido como contentFilter
. Aqui está um exemplo:
{
"created": 1698435368,
"error":
{
"code": "contentFilter",
"message": "Your task failed as a result of our safety system."
}
}
Também é possível que a própria imagem gerada seja filtrada. Neste caso, a mensagem de erro está definida como Imagem gerada foi filtrada como resultado do nosso sistema de segurança. Aqui está um exemplo:
{
"created": 1698435368,
"error":
{
"code": "contentFilter",
"message": "Generated image was filtered as a result of our safety system."
}
}
Escrever prompts de texto em imagem
Seus prompts devem descrever o conteúdo que você deseja ver na imagem e o estilo visual da imagem.
Ao escrever prompts, tenha em consideração que as APIs de imagem vêm com um filtro de moderação de conteúdo. Se o serviço reconhecer seu prompt como conteúdo prejudicial, ele não gerará uma imagem. Para obter mais informações, consulte Filtragem de conteúdo.
Sugestão
Para uma visão completa de como você pode ajustar seus prompts de texto para gerar diferentes tipos de imagens, consulte o Guia de engenharia de prompt de imagem.
Especificar opções da API
Os seguintes parâmetros de corpo da API estão disponíveis para modelos de geração de imagem.
Tamanho
Especifique o tamanho das imagens geradas. Deve ser um dos 1024x1024
, 1024x1536
ou 1536x1024
modelos para GPT-image-1. As imagens quadradas são mais rápidas de gerar.
Qualidade
Existem três opções para a qualidade da imagem: low
, medium
, e high
. Imagens de qualidade inferior podem ser geradas mais rapidamente.
O valor predefinido é high
.
Número
Você pode gerar entre uma e 10 imagens em uma única chamada de API. O valor predefinido é 1
.
ID de utilizador
Use o parâmetro user para especificar um identificador exclusivo para o usuário que faz a solicitação. Isso é útil para rastrear e monitorar padrões de uso. O valor pode ser qualquer cadeia de caracteres, como um ID de usuário ou endereço de e-mail.
Formato de saída
Use o parâmetro output_format para especificar o formato da imagem gerada. Os formatos suportados são PNG
e JPEG
. A predefinição é PNG
.
Observação
As imagens WEBP não são suportadas no Azure OpenAI nos Modelos do Azure AI Foundry.
Compressão
Use o parâmetro output_compression para especificar o nível de compactação para a imagem gerada. Insira um inteiro entre 0
e 100
, onde 0
é sem compressão e 100
é compressão máxima. A predefinição é 100
.
Chamar a API de edição de imagem
A API de edição de imagem permite modificar imagens existentes com base nos prompts de texto fornecidos. A chamada de API é semelhante à chamada de API de geração de imagem, mas você também precisa fornecer uma imagem de entrada.
Importante
A imagem de entrada deve ter menos de 20 MB de tamanho e deve ser um arquivo PNG ou JPG.
Envie um pedido POST para:
https://<your_resource_name>.openai.azure.com/openai/deployments/<your_deployment_name>/images/edits?api-version=<api_version>
Endereço URL:
Substitua os seguintes valores:
-
<your_resource_name>
é o nome do seu recurso Azure OpenAI. -
<your_deployment_name>
é o nome da implantação do modelo DALL-E 3 ou GPT-image-1. -
<api_version>
é a versão da API que você deseja usar. Por exemplo,2025-04-01-preview
.
Cabeçalhos obrigatórios:
-
Content-Type
:multipart/form-data
-
api-key
:<your_API_key>
Corpo:
A seguir está um corpo de solicitação de exemplo. Você especifica um número de opções, definidas em seções posteriores.
Importante
A API de edição de imagem usa dados de várias partes/formulários, não dados JSON. O exemplo abaixo mostra dados de formulário de exemplo que seriam anexados a uma solicitação cURL.
-F "image[]=@beach.png" \
-F 'prompt=Add a beach ball in the center' \
-F "model=gpt-image-1" \
-F "size=1024x1024" \
-F "n=1" \
-F "quality=high"
Resultado
A resposta de uma chamada de API de edição de imagem bem-sucedida se parece com o exemplo a seguir. O b64_json
campo contém os dados da imagem de saída.
{
"created": 1698116662,
"data": [
{
"b64_json": "<base64 image data>",
"revised_prompt": "<prompt_that_was_used>"
}
]
}
Especificar opções da API
Os seguintes parâmetros de corpo da API estão disponíveis para modelos de edição de imagem, além dos disponíveis para modelos de geração de imagem.
Imagem
O valor da imagem indica o arquivo de imagem que você deseja editar.
Máscara
O parâmetro mask é do mesmo tipo que o parâmetro de entrada de imagem principal. Ele define a área da imagem que você deseja que o modelo edite, usando pixels totalmente transparentes (alfa de zero) nessas áreas. A máscara deve ser um arquivo PNG e ter as mesmas dimensões da imagem de entrada.