Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Neste artigo, você aprenderá a criar um aplicativo de contêiner que usa as GPUs sem servidor para alimentar um aplicativo de IA.
Com as GPUs sem servidor, você tem acesso direto aos recursos de computação de GPU sem precisar fazer a configuração manual de infraestrutura, como instalar drivers. Tudo o que você precisa fazer é implantar a imagem do modelo de IA.
Neste tutorial, você:
- Crie um novo aplicativo de contêiner e um ambiente
- Configurar o ambiente para usar as GPUs sem servidor
- Implantar seu aplicativo nos Aplicativos de Contêiner do Azure
- Usar o novo aplicativo de habilitação de GPU sem servidor
- Habilitar o streaming de artefatos para reduzir a inicialização a frio da GPU
Pré-requisitos
| Recurso | Descrição |
|---|---|
| Conta do Azure | Você precisa de uma conta do Azure com uma assinatura ativa. Se não tiver uma, poderá criar uma gratuitamente. |
| Acesso às GPUs sem servidor | O acesso às GPUs só estará disponível após solicitar cotas de GPU. Envie sua solicitação de cota de GPU por meio de um caso de suporte ao cliente. |
| Recurso | Descrição |
|---|---|
| Conta do Azure | Você precisa de uma conta do Azure com uma assinatura ativa. Se não tiver uma, poderá criar uma gratuitamente. |
| Acesso às GPUs sem servidor | O acesso às GPUs só estará disponível após solicitar cotas de GPU. Envie sua solicitação de cota de GPU por meio de um caso de suporte ao cliente. |
| Azure CLI | Instale a CLI do Azure ou atualize para a versão mais recente. |
Criar seu aplicativo de contêiner
Acesse o portal do Azure e pesquise e selecione Aplicativos de Contêiner.
Selecione Criar e selecione Aplicativo de Contêiner.
Na janela Básico, insira os seguintes valores em cada seção.
Em detalhes do Projeto, insira os seguintes valores:
Configuração Valor Subscription Selecione sua assinatura do Azure. Grupo de recursos Selecione Criar e insira my-gpu-demo-group. Nome do aplicativo de contêiner Insira my-gpu-demo-app. Origem da implantação Selecione Imagem do contêiner. Em Ambiente de Aplicativos de Contêiner, insira os seguintes valores:
Configuração Valor Região Selecione Suécia Central.
Para regiões com mais suporte, consulte Como usar as GPUs sem servidor no Azure.Ambiente de Aplicativos de Contêiner Selecione Criar novo. Na janela Criar ambiente de Aplicativos de Contêiner, insira os seguintes valores:
Configuração Valor Nome do ambiente Insira my-gpu-demo-env. Selecione Criar.
Selecione Avançar: contêiner >.
Na janela Contêiner, insira os seguintes valores:
Configuração Valor Nome Insira my-gpu-demo-container. Origem da imagem Selecione Docker Hub ou outros registros. Tipo de Imagem Selecione pública Servidor de logon do registro Insira mcr.microsoft.com. Imagem e marca Insira k8se/gpu-quickstart:latest. Perfil de carga de trabalho Selecione Consumo – Até 4 vCPUs e 8 GiB de memória. GPU Marque a caixa de seleção. Tipo de GPU Selecione Consumption-GPU-NC8as-T4 - Até 8 vCPUs, 56 GiB de memória e clique no link para incluir o perfil no seu ambiente. Selecione Avançar: entrada >.
Na janela Entrada, insira os seguintes valores:
Configuração Valor Entrada Selecione a caixa de seleção Habilitado. Tráfego de entrada Selecione botão de opção Aceitar tráfego de qualquer lugar. Porta de destino Insira 80. Selecione Examinar + criar.
Selecione Criar.
Aguarde alguns instantes para que a implantação seja concluída e selecione Ir para o recurso.
A conclusão desse processo pode demorar até cinco minutos.
Usar seu aplicativo de GPU
Na janela Visão geral, selecione o link do URL do Aplicativo para abrir o front-end do aplicativo Web no navegador e usar o aplicativo GPU.
Observação
- Para obter o melhor desempenho de seus aplicativos de GPU, siga as etapas para melhorar o início frio para das GPUs sem servidor.
- Quando há vários contêineres em seu aplicativo, o primeiro contêiner obtém acesso à GPU.
Criar variáveis de ambiente
Defina as variáveis de ambiente a seguir. Antes de executar este comando, substitua <PLACEHOLDERS> pelos seus valores.
RESOURCE_GROUP="<RESOURCE_GROUP>"
ENVIRONMENT_NAME="<ENVIRONMENT_NAME>"
LOCATION="swedencentral"
CONTAINER_APP_NAME="<CONTAINER_APP_NAME>"
CONTAINER_IMAGE="mcr.microsoft.com/k8se/gpu-quickstart:latest"
WORKLOAD_PROFILE_NAME="NC8as-T4"
WORKLOAD_PROFILE_TYPE="Consumption-GPU-NC8as-T4"
Criar seu aplicativo de contêiner
Crie o grupo de recursos para conter os recursos criados neste tutorial. Esse comando deve gerar
Succeeded.az group create \ --name $RESOURCE_GROUP \ --location $LOCATION \ --query "properties.provisioningState"Crie um ambiente de Aplicativos de Contêiner para hospedar seu aplicativo de contêiner. Esse comando deve gerar
Succeeded.az containerapp env create \ --name $ENVIRONMENT_NAME \ --resource-group $RESOURCE_GROUP \ --location "$LOCATION" \ --query "properties.provisioningState"Adicione um perfil de carga de trabalho ao seu ambiente.
az containerapp env workload-profile add \ --name $ENVIRONMENT_NAME \ --resource-group $RESOURCE_GROUP \ --workload-profile-name $WORKLOAD_PROFILE_NAME \ --workload-profile-type $WORKLOAD_PROFILE_TYPECrie seu aplicativo de contêiner.
az containerapp create \ --name $CONTAINER_APP_NAME \ --resource-group $RESOURCE_GROUP \ --environment $ENVIRONMENT_NAME \ --image $CONTAINER_IMAGE \ --target-port 80 \ --ingress external \ --cpu 8.0 \ --memory 56.0Gi \ --workload-profile-name $WORKLOAD_PROFILE_NAME \ --query properties.configuration.ingress.fqdnEsse comando gera a URL do aplicativo para seu aplicativo de contêiner.
Usar seu aplicativo de GPU
Abra a URL do seu aplicativo de contêiner no navegador. Observe que pode levar até cinco minutos para que o aplicativo de contêiner seja iniciado.
Os Aplicativos de Contêiner do Azure com GPUs sem servidor permitem inserir um comando para gerar uma imagem. Você também pode simplesmente selecionar Generate Image para usar o prompt padrão. Na próxima etapa, você exibirá os resultados do processamento de GPU.
Observação
- Para obter o melhor desempenho de seus aplicativos de GPU, siga as etapas para melhorar o início frio para das GPUs sem servidor.
- Quando há vários contêineres em seu aplicativo, o primeiro contêiner obtém acesso à GPU.
Monitore sua GPU
Depois de gerar uma imagem, use as seguintes etapas para exibir os resultados do processamento da GPU:
Abra o aplicativo de contêiner no portal do Azure.
Na seção Monitoramento, selecione Console.
Selecione sua réplica.
Selecione seu contêiner.
Selecione Reconectar.
Na janela Escolher iniciar comando, selecione /bin/bashe selecione Conectar.
Após configurar o shell for, insira o comando nvidia-smi para examinar o status e a saída da GPU.
Limpar os recursos
Os recursos criados neste tutorial têm um efeito na sua fatura do Azure.
Se você não usar esses serviços a longo prazo, siga as etapas para remover tudo o que foi criado neste tutorial.
No portal do Azure pesquise e selecione Grupos de recursos.
Selecione my-gpu-demo-group.
Selecione Excluir grupo de recursos.
Na caixa de confirmação, insira my-gpu-demo-group.
Selecione Excluir.
Execute o comando a seguir.
az group delete --name $RESOURCE_GROUP