Implantar os modelos da IA generativa

Concluído

Primeiro, você precisa implantar um modelo para chat ou fazer chamadas de API para receber respostas a prompts. Ao criar uma nova implantação, você precisa indicar qual modelo base implantar. Você pode implantar qualquer número de implantações em um ou vários recursos do Azure OpenAI, desde que seus tokens por minuto (TPM) permaneçam dentro da cota de implantação.

Implantar usando o IA do Azure Studio

Na página Implantações do IA do Azure Studio, você pode criar uma nova implantação selecionando um nome de modelo no menu. Os modelos base disponíveis estão na lista da página de modelos.

Captura de tela do assistente de implantação de modelo do portal IA do Azure Studio.

Na página Implantações no Studio, você também pode exibir informações sobre todas as suas implantações, incluindo nome da implantação, nome do modelo, versão do modelo, status, data de criação e muito mais.

Implantar usando a CLI do Azure

Você também pode implantar um modelo usando o console. Usando este exemplo, substitua as seguintes variáveis por seus valores de recurso:

  • OAIResourceGroup: substitua pelo nome do grupo de recursos
  • MyOpenAIResource: substitua pelo nome do seu recurso
  • MyModel: substitua por um nome exclusivo para o modelo
  • gpt-35-turbo: substitua-o pelo modelo base que deseja implantar
az cognitiveservices account deployment create \
   -g OAIResourceGroup \
   -n MyOpenAIResource \
   --deployment-name MyModel \
   --model-name gpt-35-turbo \
   --model-version "0301"  \
   --model-format OpenAI \
   --sku-name "Standard" \
   --sku-capacity 1

Implantar usando a API REST

Você pode implantar um modelo usando a API REST. No corpo da solicitação, especifique o modelo base que deseja implantar. Veja um exemplo na documentação do OpenAI do Azure.