Partilhar via


Como implementar modelos do Azure OpenAI com o Azure AI Studio

Importante

Alguns dos recursos descritos neste artigo podem estar disponíveis apenas na visualização. Essa visualização é fornecida sem um contrato de nível de serviço e não a recomendamos para cargas de trabalho de produção. Algumas funcionalidades poderão não ser suportadas ou poderão ter capacidades limitadas. Para obter mais informações, veja Termos Suplementares de Utilização para Pré-visualizações do Microsoft Azure.

Neste artigo, você aprenderá a criar implantações de modelo do Azure OpenAI no Azure AI Studio.

O serviço Azure OpenAI oferece um conjunto diversificado de modelos com diferentes capacidades e preços. Ao implantar modelos do Azure OpenAI no Azure AI Studio, você pode consumir as implantações, usando o fluxo de prompt ou outra ferramenta. A disponibilidade do modelo varia por região. Para saber mais sobre os detalhes de cada modelo, consulte Modelos do Azure OpenAI Service.

Para modificar e interagir com um modelo do Azure OpenAI no playground do Azure AI Studio , primeiro você precisa implantar um modelo base do Azure OpenAI em seu projeto. Depois que o modelo for implantado e estiver disponível em seu projeto, você poderá consumir seu ponto de extremidade da API REST como está ou personalizar ainda mais com seus próprios dados e outros componentes (incorporações, índices e muito mais).

Implantar um modelo OpenAI do Azure a partir do catálogo de modelos

Siga as etapas abaixo para implantar um modelo OpenAI do Azure, como gpt-4 um ponto de extremidade em tempo real do catálogo de modelos do AI Studio:

  1. Inicie sessão no AI Studio e aceda à página inicial .

  2. Selecione Catálogo de modelos na barra lateral esquerda.

  3. No filtro Coleções, selecione Azure OpenAI.

    Uma captura de tela mostrando como filtrar por modelos OpenAI do Azure no catálogo.

  4. Selecione um modelo como gpt-4 na coleção do Azure OpenAI.

  5. Selecione Implantar para abrir a janela de implantação.

  6. Selecione o hub no qual você deseja implantar o modelo. Se você não tiver um hub, poderá criar um.

  7. Especifique o nome da implantação e modifique outras configurações padrão dependendo de suas necessidades.

  8. Selecione Implementar.

  9. Você pousa na página de detalhes da implantação. Selecione Abrir no playground.

  10. Selecione Exibir código para obter exemplos de código que podem ser usados para consumir o modelo implantado em seu aplicativo.

Implantar um modelo OpenAI do Azure a partir do seu projeto

Como alternativa, você pode iniciar a implantação iniciando a partir do seu projeto no AI Studio.

  1. Vá para o seu projeto no AI Studio.
  2. Selecione Implantações de componentes>.
  3. Selecione + Criar implantação.
  4. No filtro Coleções, selecione Azure OpenAI.
  5. Selecione um modelo como gpt-4 na coleção do Azure OpenAI.
  6. Selecione Confirmar para abrir a janela de implantação.
  7. Especifique o nome da implantação e modifique outras configurações padrão dependendo de suas necessidades.
  8. Selecione Implementar.
  9. Você pousa na página de detalhes da implantação. Selecione Abrir no playground.
  10. Selecione Exibir código para obter exemplos de código que podem ser usados para consumir o modelo implantado em seu aplicativo.

Inferindo o modelo OpenAI do Azure

Para executar a inferência no modelo implantado, você pode usar o playground ou exemplos de código. O playground é uma interface baseada na web que permite interagir com o modelo em tempo real. Você pode usar o playground para testar o modelo com diferentes prompts e ver as respostas do modelo.

Para obter mais exemplos de como consumir o modelo implantado em seu aplicativo, consulte os seguintes inícios rápidos do Azure OpenAI:

Disponibilidade regional e limites de cota de um modelo

Para modelos do Azure OpenAI, a quota predefinida de modelos varia de acordo com o modelo e a região. Alguns modelos podem estar disponíveis apenas em algumas regiões. Para obter mais informações sobre disponibilidade e limites de cota, consulte Cotas e limites do Serviço OpenAI do Azure.

Cota para implantar e inferir um modelo

Para modelos do Azure OpenAI, a implantação e a inferência consomem a cota atribuída à sua assinatura por região, por modelo, em unidades de Tokens por Minuto (TPM). Ao se inscrever no Azure AI Studio, você recebe a cota padrão para a maioria dos modelos disponíveis. Em seguida, você atribui o TPM a cada implantação à medida que ela é criada, reduzindo assim a cota disponível para esse modelo na quantidade atribuída. Você pode continuar a criar implantações e atribuir-lhes TPMs até atingir seu limite de cota.

Depois de atingir o limite de cota, a única maneira de criar novas implantações desse modelo é:

Para saber mais sobre a quota, consulte Quota do Azure AI Studio e Gerir a quota do Serviço OpenAI do Azure.

  • Saiba mais sobre o que pode fazer no Azure AI Studio
  • Obtenha respostas às perguntas frequentes no artigo de perguntas frequentes sobre a IA do Azure