Compartilhar via


Trabalhando com modelos do OpenAI do Azure

O Serviço OpenAI do Azure é alimentado por um conjunto diversificado de modelos com diferentes funcionalidades e pontos de preço. A disponibilidade do modelo varia de acordo com a região.

Você pode obter uma lista de modelos disponíveis para inferência e ajuste fino pelo recurso Azure OpenAI usando a API de Lista de Modelos.

Atualizações de modelo

O OpenAI do Azure agora dá suporte a atualizações automáticas para implantações de modelo selecionadas. Em modelos com suporte a atualização automática, uma lista suspensa de versão do modelo está visível no portal do Azure AI Foundry em Implantações e Editar:

Captura de tela da interface de usuário de implantação de modelo no portal da Fábrica de IA do Azure.

Você pode saber mais sobre as versões de modelo do Azure OpenAI e como elas funcionam no artigo sobre as versões de modelo do Azure OpenAI.

Observação

As atualizações automáticas de modelo só têm suporte para tipos de implantação Standard. Para obter mais informações sobre como gerenciar atualizações e migrações de modelo em tipos de implantação provisionados, consulte a seção sobre gerenciamento de modelos em tipos de implantação provisionados

Atualização automática para padrão

Quando você define sua implantação como Atualização automática para o padrão, a implantação do modelo é atualizada automaticamente dentro de duas semanas após uma alteração na versão padrão. Para uma versão prévia, ela é atualizada automaticamente quando uma nova versão prévia estiver disponível, a partir de duas semanas após o lançamento da nova versão prévia.

Se você ainda estiver nas fases iniciais de teste para modelos de inferência, recomendamos implantar modelos com a atualização automática para o padrão definida sempre que estiver disponível.

Versão específica do modelo

À medida que seu uso do OpenAI do Azure evolui e você começa a criar e integrar aplicativos, talvez você queira controlar manualmente as atualizações do modelo. Você pode primeiro testar e validar se o comportamento do aplicativo é consistente para o seu caso de uso antes de fazer a atualização.

Quando você seleciona uma versão de modelo específica para uma implantação, essa versão permanece selecionada até que você opte por fazer a atualização manualmente ou até que a data de desativação do modelo seja atingida. Quando a data de desativação for atingida, o modelo será atualizado automaticamente para a versão padrão no momento da desativação.

Exibição das datas de desativação

Para modelos atualmente implantados, no portal da Fábrica de IA do Azure, selecione Implantações:

Captura de tela da interface de implantação do portal da Fábrica de IA do Azure.

Configuração de atualização de implantação de modelo

Você pode verificar quais opções de atualização de modelo estão definidas para modelos implantados anteriormente no portal da Fábrica de IA do Azure. Selecione Implantações> Na coluna nome da implantação, selecione um dos nomes de implantação realçados em azul.

A seleção de um nome de implantação abre as Propriedades da implantação do modelo. Exiba quais opções de atualização estão definidas para sua implantação na Política de atualização de versão:

Captura de tela da interface do usuário da propriedade de implantações de modelo.

A propriedade correspondente também pode ser acessada via REST, Azure PowerShell e CLI do Azure.

Opção Ler Atualizar
REST Sim. Se versionUpgradeOption não for retornado, significa que é null Sim
PowerShell do Azure Sim. VersionUpgradeOption pode ser verificado em relação a $null Sim
CLI do Azure Sim. Ele mostra null se versionUpgradeOption não estiver definido. Não. Atualmente não é possível atualizar a opção de upgrade de versão.

Há três opções distintas de atualização de implantação de modelo:

Nome Descrição
OnceNewDefaultVersionAvailable Quando uma nova versão é designada como padrão, a implantação do modelo é atualizada automaticamente para a versão padrão dentro de duas semanas após a alteração da designação.
OnceCurrentVersionExpired Quando a data de desativação é atingida, a implantação do modelo é atualizada automaticamente para a versão padrão atual.
NoAutoUpgrade A implantação do modelo nunca é atualizada automaticamente. Depois que a data de desativação é atingida, a implantação do modelo para de funcionar. Você precisa atualizar seu código que faz referência a essa implantação para apontar para uma implantação de modelo não expirada.

Observação

null é equivalente a OnceCurrentVersionExpired. Se a opção de Política de atualização de versão não estiver presente nas propriedades de um modelo que dá suporte a atualizações de modelo, isso indicará que o valor está atualmente null. Depois que você modifica explicitamente esse valor, a propriedade fica visível na página de propriedades do estúdio e também por meio da API REST.

Exemplos

Reveja o guia de introdução ao Microsoft Azure PowerShell para instalar o Azure PowerShell localmente ou você pode utilizar o Azure Cloud Shell.

As etapas abaixo demonstram como verificar a propriedade da opção VersionUpgradeOption, bem como atualizá-la:

// Step 1: Get Deployment
$deployment = Get-AzCognitiveServicesAccountDeployment -ResourceGroupName {ResourceGroupName} -AccountName {AccountName} -Name {DeploymentName}
 
// Step 2: Show Deployment VersionUpgradeOption
$deployment.Properties.VersionUpgradeOption
 
// VersionUpgradeOption can be null - one way to check is
$null -eq $deployment.Properties.VersionUpgradeOption
 
// Step 3: Update Deployment VersionUpgradeOption
$deployment.Properties.VersionUpgradeOption = "NoAutoUpgrade"
New-AzCognitiveServicesAccountDeployment -ResourceGroupName {ResourceGroupName} -AccountName {AccountName} -Name {DeploymentName} -Properties $deployment.Properties -Sku $deployment.Sku
 
// repeat step 1 and 2 to confirm the change.
// If not sure about deployment name, use this command to show all deployments under an account
Get-AzCognitiveServicesAccountDeployment -ResourceGroupName {ResourceGroupName} -AccountName {AccountName}
// To update to a new model version

// Step 1: Get Deployment
$deployment = Get-AzCognitiveServicesAccountDeployment -ResourceGroupName {ResourceGroupName} -AccountName {AccountName} -Name {DeploymentName}

// Step 2: Show Deployment Model properties
$deployment.Properties.Model.Version

// Step 3: Update Deployed Model Version
$deployment.Properties.Model.Version = "0613"
New-AzCognitiveServicesAccountDeployment -ResourceGroupName {ResourceGroupName} -AccountName {AccountName} -Name {DeploymentName} -Properties $deployment.Properties -Sku $deployment.Sku

// repeat step 1 and 2 to confirm the change.

Atualizar e implantar modelos por meio da API

PUT https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.CognitiveServices/accounts/{accountName}/deployments/{deploymentName}?api-version=2023-05-01

Parâmetros de caminho

Parâmetro Type Necessário? Descrição
acountname string Obrigatório O nome do seu recurso OpenAI do Azure.
deploymentName string Obrigatório O nome da implantação que você escolheu quando implantou um modelo existente ou o nome que deseja que uma nova implantação de modelo tenha.
resourceGroupName string Obrigatório O nome do grupo de recursos associado para essa implantação de modelo.
subscriptionId string Obrigatório ID da Assinatura para a assinatura associada.
api-version string Obrigatório A versão da API a ser usada para esta operação. Isso segue o formato AAAA-MM-DD.

Versões com suporte

Corpo da solicitação

Esse é apenas um subconjunto dos parâmetros de corpo da solicitação disponíveis. Para obter a lista completa dos parâmetros, você pode consultar a documentação de referência da API REST.

Parâmetro Tipo Descrição
versionUpgradeOption String Opções de atualização de versão do modelo de implantação:
OnceNewDefaultVersionAvailable
OnceCurrentVersionExpired
NoAutoUpgrade
ALOCADA inteiro Isso representa a quantidade de cota que você está atribuindo a essa implantação. Um valor de 1 é igual a 1.000 tokens por minuto (TPM)

Solicitação de exemplo

curl -X PUT https://management.azure.com/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/resource-group-temp/providers/Microsoft.CognitiveServices/accounts/docs-openai-test-001/deployments/gpt-35-turbo?api-version=2023-05-01 \
  -H "Content-Type: application/json" \
  -H 'Authorization: Bearer YOUR_AUTH_TOKEN' \
  -d '{"sku":{"name":"Standard","capacity":120},"properties": {"model": {"format": "OpenAI","name": "gpt-35-turbo","version": "0613"},"versionUpgradeOption":"OnceCurrentVersionExpired"}}'

Observação

Há várias maneiras de gerar um token de autorização. O método mais fácil para teste inicial é iniciar o Cloud Shell do portal do Azure. Em seguida, execute az account get-access-token. Você pode usar esse token como token de autorização temporário para teste de API.

Exemplo de resposta

 {
  "id": "/subscriptions/{subscription-id}/resourceGroups/resource-group-temp/providers/Microsoft.CognitiveServices/accounts/docs-openai-test-001/deployments/gpt-35-turbo",
  "type": "Microsoft.CognitiveServices/accounts/deployments",
  "name": "gpt-35-turbo",
  "sku": {
    "name": "Standard",
    "capacity": 120
  },
  "properties": {
    "model": {
      "format": "OpenAI",
      "name": "gpt-35-turbo",
      "version": "0613"
    },
    "versionUpgradeOption": "OnceCurrentVersionExpired",
    "capabilities": {
      "chatCompletion": "true"
    },
    "provisioningState": "Succeeded",
    "rateLimits": [
      {
        "key": "request",
        "renewalPeriod": 10,
        "count": 120
      },
      {
        "key": "token",
        "renewalPeriod": 60,
        "count": 120000
      }
    ]
  },
  "systemData": {
    "createdBy": "docs@contoso.com",
    "createdByType": "User",
    "createdAt": "2023-02-28T02:57:15.8951706Z",
    "lastModifiedBy": "docs@contoso.com",
    "lastModifiedByType": "User",
    "lastModifiedAt": "2023-10-31T15:35:53.082912Z"
  },
  "etag": "\"GUID\""
}

Gerenciando modelos em tipos de implantação provisionados

As implantações provisionadas dão suporte a práticas distintas de gerenciamento de modelos. As práticas de gerenciamento de modelo de implantação provisionada destinam-se a fornecer o maior controle sobre quando e como você migra entre versões de modelo e famílias de modelos. Atualmente, há duas abordagens disponíveis para gerenciar modelos em implantações provisionadas: (1) migrações in-loco e (2) migrações de várias implantações.

Pré-requisitos

  • Valide se a versão do modelo de destino ou a família de modelos tem suporte para o tipo de implantação existente. As migrações só podem ocorrer entre implantações provisionadas do mesmo tipo de implantação. Para obter mais informações sobre tipos de implantação, examine a documentação tipo de implantação.
  • Valide a disponibilidade de capacidade para a versão do modelo de destino ou a família de modelos antes de tentar uma migração. Para obter mais informações sobre como determinar a disponibilidade de capacidade, consulte a documentação de transparência de capacidade.
  • Para migrações de várias implantações, valide se você tem cota suficiente para dar suporte a várias implantações simultaneamente. Para obter mais informações sobre como validar a cota para cada tipo de implantação provisionada, examine a documentação cota provisionada.

Migrações in-loco para implantações provisionadas

As migrações in-loco permitem que você mantenha o mesmo nome e tamanho da implantação provisionada enquanto altera a versão do modelo ou a família de modelos atribuída a essa implantação. Com migrações in-loco, o Serviço OpenAI do Azure cuida da migração de qualquer tráfego existente entre versões de modelo ou famílias de modelos durante a migração em uma janela de 20 a 30 minutos. Durante toda a janela de migração, sua implantação provisionada exibirá um estado provisionado de "atualização". Você pode continuar a usar sua implantação provisionada como faria normalmente. Depois que a migração in-loco for concluída, o estado provisionado será atualizado para "bem-sucedido", indicando que todo o tráfego foi migrado para a versão do modelo de destino ou família de modelos.

Migração in-loco: atualização da versão do modelo

As migrações in-loco destinadas à atualização de uma implantação provisionada existente para uma nova versão de modelo dentro da mesma família de modelos têm suporte por meio da Fábrica de IA do Azure, da API REST e da CLI do Azure. Para executar uma migração in-loco direcionada a uma atualização de versão do modelo na Fábrica de IA do Azure, selecione Implantações> na coluna de nome da implantação, selecione o nome da implantação provisionada que você deseja migrar.

A seleção de um nome de implantação abre as Propriedades da implantação do modelo. Nessa exibição, selecione o botão editar, que mostrará a caixa de diálogo Atualizar implantação. Selecione a lista suspensa de versão do modelo para definir uma nova versão do modelo para a implantação provisionada. Conforme observado, o estado de provisionamento será alterado para "atualizando" durante a migração e será revertido para "bem-sucedido" assim que a migração for concluída.

Captura de tela da caixa de diálogo de implantação de atualização com o seletor de campo de versão do modelo aberto para mostrar as opções de versão do modelo disponíveis para seleção.

Migração in-loco: alteração da família do modelo

A migração in-loco que visa atualizar uma implantação provisionada existente para uma nova família de modelos tem suporte por meio da API REST e da CLI do Azure. Para executar uma migração in-loco direcionada a uma alteração de família de modelo, use a solicitação de exemplo abaixo como guia. Na solicitação, você precisará atualizar o nome do modelo e a versão do modelo para o qual está migrando.

curl -X PUT https://management.azure.com/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/resource-group-temp/providers/Microsoft.CognitiveServices/accounts/docs-openai-test-001/deployments/gpt-4o-ptu-deployment?api-version=2024-10-01 \
  -H "Content-Type: application/json" \
  -H 'Authorization: Bearer YOUR_AUTH_TOKEN' \
  -d '{"sku":{"name":"GlobalProvisionedManaged","capacity":100},"properties": {"model": {"format": "OpenAI","name": "gpt-4o-mini","version": "2024-07-18"}}}'

Exemplo de resposta

 {
  "id": "/subscriptions/{subscription-id}/resourceGroups/resource-group-temp/providers/Microsoft.CognitiveServices/accounts/docs-openai-test-001/deployments/gpt-4o-ptu-deployment",
  "type": "Microsoft.CognitiveServices/accounts/deployments",
  "name": "gpt-4o-ptu-deployment",
  "sku": {
    "name": "GlobalProvisionedManaged",
    "capacity": 100
  },
  "properties": {
    "model": {
      "format": "OpenAI",
      "name": "gpt-4o-mini",
      "version": "2024-07-18"
    },
    "versionUpgradeOption": "OnceCurrentVersionExpired",
    "currentCapacity": 100
    "capabilities": {
      "area": "EUR",
      "chatCompletion": "true"
      "jsonObjectResponse": "true",
      "maxContextToken": "128000",
      "maxOutputToken": "16834",
      "assistants": "true"
    },
    "provisioningState": "Updating",
    "rateLimits": [
      {
        "key": "request",
        "renewalPeriod": 10,
        "count": 300
      }
    ]
  },
  "systemData": {
    "createdBy": "docs@contoso.com",
    "createdByType": "User",
    "createdAt": "2025-01-28T02:57:15.8951706Z",
    "lastModifiedBy": "docs@contoso.com",
    "lastModifiedByType": "User",
    "lastModifiedAt": "2025-01-29T15:35:53.082912Z"
  },
  "etag": "\"GUID\""
}

Observação

Há várias maneiras de gerar um token de autorização. O método mais fácil para teste inicial é iniciar o Cloud Shell do portal do Azure. Em seguida, execute az account get-access-token. Você pode usar esse token como token de autorização temporário para teste de API.

Migrações de várias implantações para implantações provisionadas

As migrações de várias implantações permitem que você tenha maior controle sobre o processo de migração do modelo. Com migrações de várias implantações, você pode determinar a rapidez com que deseja migrar o tráfego existente para a versão do modelo de destino ou a família de modelos em uma nova implantação provisionada. O processo para migrar para uma nova versão de modelo ou família de modelos usando a abordagem de migração de várias implantações é o seguinte:

  • Crie uma nova implantação provisionada. Para essa nova implantação, você pode optar por manter o mesmo tipo de implantação provisionada que a implantação existente ou selecionar um novo tipo de implantação, se desejar.
  • Faça a transição do tráfego da implantação provisionada existente para a implantação provisionada recém-criada com a versão do modelo de destino ou a família de modelos até que todo o tráfego seja descarregado da implantação original.
  • Após o tráfego ter sido migrado para a nova implantação, valide se não há nenhuma solicitação de inferência sendo processada na implantação provisionada anterior ao se certificar de que a métrica Solicitações do OpenAI do Azure não mostre nenhuma chamada à API feita no prazo de 5 a 10 minutos após o tráfego de inferência ser migrado para a nova implantação. Para obter mais informações sobre essa métrica, confira a documentação referente a Monitorar o OpenAI do Azure.
  • Depois de confirmar que nenhuma chamada de inferência foi feita, exclua a implantação provisionada original.

Próximas etapas