Partilhar via


Limites de limitação de computação

Aplica-se a: ✔️ VMs ✔️ Linux VMs ✔️ do Windows Conjuntos ✔️ de escala flexíveis Conjuntos de balanças uniformes

O Microsoft Compute implementa o mecanismo de limitação para ajudar no desempenho geral do serviço e oferecer uma experiência consistente aos clientes. As solicitações de API que excedem os limites máximos permitidos são limitadas e os usuários recebem um erro HTTP 429. Todas as políticas de limitação de computação são implementadas por região.

Como funcionam as políticas de limitação?

O Microsoft Compute implementa políticas de limitação que limitam o número de solicitações de API feitas por recurso e por assinatura, por região, por minuto. Se o número de solicitações de API exceder esses limites, as solicitações serão limitadas. Veja como esses limites funcionam:

  • Por limite de recursos – Cada recurso, como uma máquina virtual (VM), tem um limite específico para solicitações de API. Por exemplo, vamos supor que um usuário crie 10 VMs em uma assinatura. O usuário pode invocar até 12 solicitações de atualização para cada VM em um minuto. Se o usuário exceder o limite para a VM, as solicitações de API serão limitadas. Esse limite garante que alguns recursos não consumam os limites de nível de assinatura e limitem outros recursos.

  • Limite de assinatura – Além dos limites de recursos, há um limite abrangente no número de solicitações de API em todos os recursos de uma assinatura. Todas as solicitações de API além desse limite são limitadas, independentemente de o limite para um recurso individual ter sido atingido. Por exemplo, vamos supor que um usuário tenha 200 VMs em uma assinatura. Embora o usuário tenha o direito de iniciar até 12 solicitações de atualização de VM para cada VM, o limite agregado para solicitações de API de atualização de VM é limitado a 1500 por minuto. Todas as solicitações de API de VM de atualização para a assinatura superior a 1500 são limitadas.

Como o Microsoft Compute determina os limites de limitação?

Para determinar os limites para cada recurso e assinatura, o Microsoft Compute usa o algoritmo de bucket de token. Esse algoritmo cria buckets para cada limite e mantém um número específico de tokens em cada bucket. O número de tokens em um bucket representa o limite de limitação a qualquer minuto.

No início da janela de limitação, quando o recurso é criado, o bucket é preenchido até sua Capacidade Máxima. Cada solicitação de API iniciada pelo usuário consome um token. Quando a contagem de tokens se esgota para zero, as solicitações de API subsequentes são limitadas. O bucket é reabastecido com novos tokens a cada minuto a uma taxa consistente chamada Bucket Refill Rate para um recurso e uma assinatura.

Por exemplo: Vamos considerar a 'política de limitação para API de atualização de VM' que estipula uma taxa de recarga de bucket de quatro tokens por minuto e uma capacidade máxima de bucket de 12 tokens. O usuário invoca a solicitação Update VM API para uma máquina virtual (VM) de acordo com a tabela a seguir. Inicialmente, o bucket é preenchido com 12 tokens no início da janela de limitação. No quarto minuto, o usuário utiliza todos os 12 tokens, deixando o bucket vazio. No quinto minuto, o bucket é reabastecido com quatro novos tokens de acordo com a Bucket Refill Rate. Assim, quatro solicitações de API podem ser feitas no quinto minuto, enquanto o Microsoft Compute limita uma solicitação de API devido a tokens insuficientes.

(min)
Número de fichas no início (A) 12 12 8 12 4 4
Pedidos por minuto (B) 0 8 0 13 5 0
Solicitações limitadas (C) 0 0 0 1 1 0
Tokens restantes no final do período
D = Máx(A-B, 0)
12 4 8 0 0 4

Processo semelhante é seguido para determinar os limites de limitação no nível da assinatura. As seções a seguir detalham a taxa de recarga de bucket e a capacidade máxima de bucket usadas para determinar limites de limitação para máquinas virtuais, conjuntos de escala de máquina virtual e VMs de conjunto de escala de máquinas virtuais.

Limites de limitação para máquinas virtuais

As solicitações de API para máquinas virtuais são categorizadas em sete políticas distintas. Cada política tem seus próprios limites, dependendo de quão intensivas são as solicitações de API sob essa política. A tabela a seguir contém uma lista abrangente dessas políticas, as APIs REST correspondentes e seus respetivos limites de limitação:

Categoria de política APIs REST Nível de recursos Nível de recursos Nível de Subscrição Nível de Subscrição
Taxa de recarga da caçamba (por minuto) Capacidade máxima da caçamba
(Por Min)
Taxa de recarga da caçamba
(Por Min)
Capacidade máxima da caçamba
(Por Min)
Colocar VM
(Criar novas VMs)
Criar 4 12 500 1500
Atualizar VM
(Atualizar VMs existentes)
Atualização
Reaplicar Reiniciar
Desligamento
Iniciar
Generalizar
Converter em discos gerenciados
Voltar a implementar
Realizar Manutenção
Captura
Executar comando
Criar ou atualizar
Extensões - Atualização
Extensões - Excluir
Reimagem
Atualização
Executar comandos - Atualizar
Executar comandos - Excluir
Executar comandos - Criar ou atualizar
4 12 500 1500
Excluir VM
(Excluir VMs)
Eliminar
Simular despejo
Desalocar
4 12 500 1500
Baixo custo Obter VM
(Obter informações sobre uma única VM)
Obter
Visualização da instância
Extensões - Obter
Lista de tamanhos disponíveis
Recuperar dados de diagnóstico de inicialização
Executar comandos - Obter por máquina virtual
Executar comandos - Lista por máquina virtual
12 36 8,000 24,000
Alto custo Obter VM1
(Obter informações sobre várias VMs)
Lista
Listar tudo
Lista por localização
ND ND 300 900
Comece a operação
(Obter informações sobre operações assíncronas de VM)
Status das operações assíncronas 15 45 5.000 15 000
Operações de patch de convidado de VM
(Avaliar e instalar patches de convidados)
Avaliar patches
Instalar patches
2 6 200 600

1 Apenas as políticas de nível de subscrição são aplicáveis.

Limites de limitação para conjuntos de dimensionamento de máquinas virtuais

As solicitações de API para o Conjunto de Escala de Máquina Virtual (Uniform & Flex) são categorizadas em 5 políticas distintas. Cada política tem seus próprios limites, dependendo de quão intensivas são as solicitações de API sob essa política. Essas políticas são aplicáveis aos modos de orquestração Flex e Uniforme. A tabela a seguir contém uma lista abrangente dessas políticas, as APIs REST correspondentes e seus respetivos limites de limitação:

Categoria de política APIs REST Nível de recursos Nível de recursos Nível de Subscrição Nível de Subscrição
Taxa de recarga da caçamba
(Por Min)
Capacidade máxima da caçamba
(Por Min)
Taxa de recarga da caçamba (por minuto) Capacidade máxima da caçamba
(Por Min)
Put
(Criar novo conjunto de escalas)
Criar 4 12 125 375
Atualizar
(Atualizar o conjunto de escalas existente)
Atualização
Início2
Reiniciar2
Reimplantar2
Realizar Manutenção2
Reimagem2
Recriar imagem de todos os2
Criar ou atualizar
Atualizações contínuas - Cancelar
Extensões - Criar
Extensões - Atualização
Extensões - Excluir
Caminhada de domínio de atualização da plataforma Force Recovery Service Fabric
Converter em grupo de posicionamento único
Definir estado do serviço de orquestração
4 12 500 1500
Delete
(Excluir conjunto de escalas)
Eliminar
Desligamento2
Desalocar
4 12 175 525
Baixo Custo Obter
(Obter informações sobre o conjunto de escala única)
Obter
Lista Skus
Atualizações contínuas - Obtenha as últimas novidades
Obter histórico de atualização do SO
12 36 800 2,400
Alto Custo Obter
(Obtenha informações com uso intensivo de recursos)
Obter visualização de instância
Lista2
Listar todos os2
Lista por Localização2
10 30 360 1,080

2 Apenas as políticas de nível de subscrição são aplicáveis.

Limites de limitação para máquinas virtuais de conjunto de escala de máquinas virtuais

As solicitações de API para Máquinas Virtuais de Conjunto de Escala de Máquina Virtual são categorizadas em 3 políticas distintas. Cada política tem seus próprios limites, dependendo de quão intensivas são as solicitações de API sob essa política. A tabela a seguir contém uma lista abrangente dessas políticas, as APIs REST correspondentes e seus respetivos limites de limitação:

Categoria de política APIs REST Nível de recursos Nível de recursos Nível de Subscrição Nível de Subscrição
Taxa de recarga da caçamba
(Por Min)
Capacidade máxima da caçamba
(Por Min)
Taxa de recarga da caçamba
(Por Min)
Capacidade máxima da caçamba
(Por Min)
Atualizar VMs de conjunto de escala
(Atualizar VMs existentes em um conjunto de escalas)
Iniciar
Recomeçar
Reimagem
ReimageAll
Atualização
Simular despejo
Extensões- Criar ou atualizar
RunCommands - Criar ou atualizar
RunCommands - Atualização
4 12 500 1500
Excluir VMs do conjunto de dimensionamento
(Excluir VMs do conjunto de escalas)
Eliminar
Desligamento
Desalocar
Extensões- Excluir
RunCommands - Excluir
4 12 500 1500
Obter VMs de conjunto de escala
(Obter informações sobre VMs de conjunto de escala)
Obter
Visualização GetInstance
Extensões- Obter
RunCommands - Obter
Dados de diagnóstico RetrieveBoot
12 36 2.000 6000

Diretrizes de solução de problemas

Caso os usuários ainda estejam enfrentando desafios devido à limitação de computação, consulte Solução de problemas de erros de limitação no Azure - Máquinas Virtuais. Ele tem detalhes sobre como solucionar problemas de limitação e práticas recomendadas para evitar ser limitado.

FAQs

Há alguma ação necessária dos usuários?

Os usuários não precisam alterar nada em suas configurações ou cargas de trabalho. Todas as APIs existentes continuam a funcionar como estão.

Quais são os benefícios das políticas de limitação?

As políticas de limitação oferecem vários benefícios:

  • Todos os recursos de computação têm uma janela uniforme de 1 min. Os usuários podem invocar com êxito chamadas de API, 1 minuto depois de serem limitados.

  • Nenhum recurso pode usar todos os limites de uma assinatura, pois os limites são definidos no nível do recurso.

  • A Microsoft Compute está introduzindo um novo algoritmo, o Token Bucket Algorithm, para determinar os limites. O algoritmo fornece buffer extra para os clientes, enquanto faz um grande número de solicitações de API.

O cliente recebe um alerta quando está prestes a atingir seus limites de limitação?

Como parte de cada resposta, o Microsoft Compute retorna x-ms-ratelimit-remaining-resource que pode ser usado para determinar os limites de limitação em relação às políticas. Uma lista de políticas de limitação aplicáveis é retornada como resposta aos cabeçalhos informativos da taxa de chamada.