Como implementar modelos do Azure OpenAI com o Azure AI Studio
Importante
Alguns dos recursos descritos neste artigo podem estar disponíveis apenas na visualização. Essa visualização é fornecida sem um contrato de nível de serviço e não a recomendamos para cargas de trabalho de produção. Algumas funcionalidades poderão não ser suportadas ou poderão ter capacidades limitadas. Para obter mais informações, veja Termos Suplementares de Utilização para Pré-visualizações do Microsoft Azure.
Neste artigo, você aprenderá a criar implantações de modelo do Azure OpenAI no Azure AI Studio.
O serviço Azure OpenAI oferece um conjunto diversificado de modelos com diferentes capacidades e preços. Ao implantar modelos do Azure OpenAI no Azure AI Studio, você pode consumir as implantações, usando o fluxo de prompt ou outra ferramenta. A disponibilidade do modelo varia por região. Para saber mais sobre os detalhes de cada modelo, consulte Modelos do Azure OpenAI Service.
Para modificar e interagir com um modelo do Azure OpenAI no playground do Azure AI Studio , primeiro você precisa implantar um modelo base do Azure OpenAI em seu projeto. Depois que o modelo for implantado e estiver disponível em seu projeto, você poderá consumir seu ponto de extremidade da API REST como está ou personalizar ainda mais com seus próprios dados e outros componentes (incorporações, índices e muito mais).
Implantar um modelo OpenAI do Azure a partir do catálogo de modelos
Siga as etapas abaixo para implantar um modelo OpenAI do Azure, como gpt-4
um ponto de extremidade em tempo real do catálogo de modelos do AI Studio:
Inicie sessão no AI Studio e aceda à página inicial .
Selecione Catálogo de modelos na barra lateral esquerda.
No filtro Coleções, selecione Azure OpenAI.
Selecione um modelo como
gpt-4
na coleção do Azure OpenAI.Selecione Implantar para abrir a janela de implantação.
Selecione o hub no qual você deseja implantar o modelo. Se você não tiver um hub, poderá criar um.
Especifique o nome da implantação e modifique outras configurações padrão dependendo de suas necessidades.
Selecione Implementar.
Você pousa na página de detalhes da implantação. Selecione Abrir no playground.
Selecione Exibir código para obter exemplos de código que podem ser usados para consumir o modelo implantado em seu aplicativo.
Implantar um modelo OpenAI do Azure a partir do seu projeto
Como alternativa, você pode iniciar a implantação iniciando a partir do seu projeto no AI Studio.
- Vá para o seu projeto no AI Studio.
- Selecione Implantações de componentes>.
- Selecione + Criar implantação.
- No filtro Coleções, selecione Azure OpenAI.
- Selecione um modelo como
gpt-4
na coleção do Azure OpenAI. - Selecione Confirmar para abrir a janela de implantação.
- Especifique o nome da implantação e modifique outras configurações padrão dependendo de suas necessidades.
- Selecione Implementar.
- Você pousa na página de detalhes da implantação. Selecione Abrir no playground.
- Selecione Exibir código para obter exemplos de código que podem ser usados para consumir o modelo implantado em seu aplicativo.
Inferindo o modelo OpenAI do Azure
Para executar a inferência no modelo implantado, você pode usar o playground ou exemplos de código. O playground é uma interface baseada na web que permite interagir com o modelo em tempo real. Você pode usar o playground para testar o modelo com diferentes prompts e ver as respostas do modelo.
Para obter mais exemplos de como consumir o modelo implantado em seu aplicativo, consulte os seguintes inícios rápidos do Azure OpenAI:
Disponibilidade regional e limites de cota de um modelo
Para modelos do Azure OpenAI, a quota predefinida de modelos varia de acordo com o modelo e a região. Alguns modelos podem estar disponíveis apenas em algumas regiões. Para obter mais informações sobre disponibilidade e limites de cota, consulte Cotas e limites do Serviço OpenAI do Azure.
Cota para implantar e inferir um modelo
Para modelos do Azure OpenAI, a implantação e a inferência consomem a cota atribuída à sua assinatura por região, por modelo, em unidades de Tokens por Minuto (TPM). Ao se inscrever no Azure AI Studio, você recebe a cota padrão para a maioria dos modelos disponíveis. Em seguida, você atribui o TPM a cada implantação à medida que ela é criada, reduzindo assim a cota disponível para esse modelo na quantidade atribuída. Você pode continuar a criar implantações e atribuir-lhes TPMs até atingir seu limite de cota.
Depois de atingir o limite de cota, a única maneira de criar novas implantações desse modelo é:
- Pode pedir mais quota ao enviar um formulário de aumento de quota.
- Ajuste a cota alocada em outras implantações de modelo para liberar tokens para novas implantações no Portal OpenAI do Azure.
Para saber mais sobre a quota, consulte Quota do Azure AI Studio e Gerir a quota do Serviço OpenAI do Azure.
Conteúdos relacionados
- Saiba mais sobre o que pode fazer no Azure AI Studio
- Obtenha respostas às perguntas frequentes no artigo de perguntas frequentes sobre a IA do Azure
Comentários
https://aka.ms/ContentUserFeedback.
Brevemente: Ao longo de 2024, vamos descontinuar progressivamente o GitHub Issues como mecanismo de feedback para conteúdos e substituí-lo por um novo sistema de feedback. Para obter mais informações, veja:Submeter e ver comentários