Partilhar via


Gerenciar e aumentar cotas de recursos com o Azure AI Studio

Importante

Alguns dos recursos descritos neste artigo podem estar disponíveis apenas na visualização. Essa visualização é fornecida sem um contrato de nível de serviço e não a recomendamos para cargas de trabalho de produção. Algumas funcionalidades poderão não ser suportadas ou poderão ter capacidades limitadas. Para obter mais informações, veja Termos Suplementares de Utilização para Pré-visualizações do Microsoft Azure.

A cota oferece a flexibilidade de gerenciar ativamente a alocação de limites de taxa nas implantações em sua assinatura. Este artigo descreve o processo de gerenciamento de cota para suas máquinas virtuais do Azure AI Studio e modelos do Azure OpenAI.

O Azure utiliza limites e quotas para evitar ultrapassar o orçamento devido a fraudes e para respeitar as restrições de capacidade do Azure. Também é uma boa maneira de controlar os custos para os administradores. Considere estes limites ao dimensionar para cargas de trabalho de produção.

Neste artigo, você aprende sobre:

  • Limites padrão nos recursos do Azure
  • Criando cotas no nível de hub do Azure AI Studio.
  • Ver as suas quotas e limites
  • Solicitar aumentos de quotas e limites

Considerações especiais

As quotas são aplicadas a cada subscrição na sua conta. Se você tiver várias assinaturas, deverá solicitar um aumento de cota para cada assinatura.

Uma cota é um limite de crédito nos recursos do Azure, não uma garantia de capacidade. Se tiver necessidades de capacidade de grande escala, contacte o suporte do Azure para aumentar a quota.

Nota

A computação do Azure AI Studio tem uma cota separada da cota de computação principal.

Os limites predefinidos variam consoante o tipo, como avaliação gratuita, pay as you go e série da máquina virtual (VM), como Dv2, F e G.

Quota do Azure AI Studio

As seguintes ações no Azure AI Studio consomem quota:

  • Criação de uma instância de computação.
  • Construindo um índice vetorial.
  • Implantação de modelos abertos a partir do catálogo de modelos.

Computação do Azure AI Studio

A computação do Azure AI Studio tem um limite de cota padrão para o número de núcleos e o número de recursos de computação exclusivos permitidos por região em uma assinatura.

  • A cota no número de núcleos é dividida por cada família VM e pelo total acumulado de núcleos.
  • A cota sobre o número de recursos de computação exclusivos por região é separada da cota principal da VM, pois se aplica apenas aos recursos de computação gerenciados

Para aumentar os limites de computação, você pode solicitar um aumento de cota no Azure AI Studio.

Os recursos disponíveis incluem:

  • Os núcleos dedicados por região têm um limite predefinido de 24 a 300, dependendo do tipo de oferta da subscrição. Pode aumentar o número de núcleos dedicados por subscrição para cada família de VM. Famílias de VMs especializadas, como as séries NCv2, NCv3 ou ND, começam com um padrão de zero núcleos. As GPUs também têm zero núcleos por predefinição.
  • O limite total de computação por região tem um limite predefinido de 500 por região numa determinada subscrição e pode ser aumentado até um valor máximo de 2500 por região. Esse limite é compartilhado entre instâncias de computação e implantações de endpoint online gerenciado. Uma instância de computação é considerada um cluster de nó único para fins de quota. Para aumentar o limite total de computação, abra uma solicitação de suporte ao cliente on-line.

Ao abrir a solicitação de suporte para aumentar o limite total de computação, forneça as seguintes informações:

  1. Selecione Técnico para o tipo de problema.

  2. Selecione a subscrição para a qual pretende aumentar a quota.

  3. Selecione Machine Learning como o tipo de serviço.

  4. Selecione o recurso para o qual você deseja aumentar a cota.

  5. No campo Resumo, insira "Aumentar limites totais de computação"

  6. Selecione Instância de computação o tipo de problema e Cota como o subtipo de problema.

    Captura de tela da página para enviar solicitações de cota de computação no portal do Azure.

  7. Selecione Seguinte.

  8. Na página Detalhes adicionais, forneça a ID da assinatura, a região, o novo limite (entre 500 e 2500) e a justificativa comercial para aumentar os limites totais de computação para a região.

  9. Selecione Criar para enviar o tíquete de solicitação de suporte.

Quota partilhada do Azure AI Studio

O Azure AI Studio fornece um pool de cotas compartilhadas que está disponível para diferentes usuários em várias regiões usarem simultaneamente. Dependendo da disponibilidade, os usuários podem acessar temporariamente a cota do pool compartilhado e usar a cota para realizar testes por um período limitado de tempo. A duração do tempo específico depende do caso de uso. Ao usar temporariamente a cota do pool de cotas, você não precisa mais registrar um tíquete de suporte para um aumento de cota de curto prazo ou esperar que sua solicitação de cota seja aprovada antes de poder prosseguir com sua carga de trabalho.

O uso do pool de cotas compartilhadas está disponível para testar a inferência para modelos Llama-2, Phi, Nemotron, Mistral, Dolly e Deci-DeciLM do Catálogo de Modelos. Você deve usar a cota compartilhada apenas para criar pontos de extremidade de teste temporários, não pontos de extremidade de produção. Para endpoints em produção, você deve solicitar uma cota dedicada. A cobrança de cota compartilhada é baseada no uso, assim como a cobrança para famílias de máquinas virtuais dedicadas.

Instâncias de contentores

Para obter mais informações, consulte Limites de instâncias de contêiner.

Armazenamento

O Armazenamento do Azure tem um limite de 250 contas de armazenamento por região, por assinatura. Este limite inclui contas de armazenamento Standard e Premium.

Exibir e solicitar cotas no Azure AI Studio

Use cotas para gerenciar a alocação de destino de computação entre vários hubs do Azure AI Studio na mesma assinatura.

Por padrão, todos os hubs compartilham a mesma cota que a cota de nível de assinatura para famílias VM. No entanto, você pode definir uma cota máxima para famílias de VMs individuais para controle de custos e governança mais granulares em hubs em uma assinatura. As quotas para famílias de VM individuais permitem-lhe partilhar a capacidade e evitar problemas de contenção de recursos.

  1. No Azure AI Studio, vá para a página inicial e selecione Cota.

  2. Selecione a guia Azure ML para exibir a cota para as famílias de VMs. A cota é exibida no nível de assinatura na região do Azure selecionada. Para solicitar mais cota, selecione a família VM e, em seguida, selecione Solicitar cota.

    Captura de ecrã da página para ver e solicitar quota para famílias de VM no Azure AI Studio.

Próximos passos