Limites de limitação de computação
Aplica-se a: ✔️ VMs do Linux ✔️ VMs do Windows ✔️ Conjuntos de dimensionamento flexíveis ✔️ Conjuntos de dimensionamento uniformes
A Computação da Microsoft implementa o mecanismo de limitação para ajudar no desempenho geral do serviço e dar uma experiência consistente aos clientes. As solicitações de API que excedem os limites máximos permitidos são limitadas e os usuários recebem um erro HTTP 429. Todas as políticas de limitação de computação são implementadas por região.
Como funcionam as políticas de limitação?
A Computação da Microsoft implementa as políticas de limitação que limitam o número de solicitações de API feitas por recurso e por assinatura por região por minuto. Se o número de solicitações de API exceder esses limites, as solicitações serão limitadas. Veja como esses limites funcionam:
Por limite de recursos – Cada recurso, como uma VM (máquina virtual), tem um limite específico para solicitações de API. Por exemplo, vamos supor que um usuário crie 10 VMs em uma assinatura. O usuário pode invocar até 12 solicitações de atualização para cada VM em um minuto. Se o usuário exceder o limite da VM, as solicitações de API serão limitadas. Esse limite garante que alguns recursos não consumam os limites de nível de assinatura e limitem outros recursos.
Limite de assinatura – Além dos limites de recursos, há um limite geral no número de solicitações de API em todos os recursos dentro de uma assinatura. Todas as solicitações de API além desse limite são limitadas, independentemente de o limite de um recurso individual ter sido atingido. Por exemplo, vamos supor que um usuário tenha 200 VMs em uma assinatura. Embora o usuário tenha o direito de iniciar até 12 solicitações de atualização de VM para cada VM, o limite agregado para solicitações de API de atualização de VM é limitado a 1.500 por minuto. Todas as solicitações de API de atualização de VM para a assinatura que excedam 1.500 serão limitadas.
Como a Computação da Microsoft determina os limites de limitação?
Para determinar os limites para cada recurso e assinatura, a Computação da Microsoft usa o Algoritmo de bucket de token. Esse algoritmo cria buckets para cada limite e contém um número específico de tokens em cada bucket. O número de tokens em um bucket representa o limite de limitação em qualquer minuto.
No início da janela de limitação, quando o recurso é criado, o bucket é preenchido até sua Capacidade máxima. Cada solicitação de API iniciada pelo usuário consome um token. Quando a contagem de tokens chegar a zero, as solicitações de API subsequentes serão limitadas. O bucket é reabastecido com novos tokens a cada minuto a uma taxa consistente chamada Taxa de recarga de bucket para um recurso e uma assinatura.
Por exemplo: vamos considerar a "política de limitação da API de atualização de VM" que estipula uma taxa de recarga de bucket de quatro tokens por minuto e uma Capacidade máxima do bucket de 12 tokens. O usuário invoca a solicitação de API de atualização de VM para uma VM (máquina virtual) de acordo com a tabela a seguir. Inicialmente, o bucket é preenchido com 12 tokens no início da janela de limitação. No quarto minuto, o usuário utiliza todos os 12 tokens, deixando o bucket vazio. No quinto minuto, o bucket é reabastecido com quatro novos tokens de acordo com a Taxa de recarga de bucket. Portanto, quatro solicitações de API podem ser feitas no quinto minuto, enquanto a Computação da Microsoft limita uma solicitação de API devido a tokens insuficientes.
(min) | 1º | 2º | Firewall | 4º | 5º | 6º |
---|---|---|---|---|---|---|
Número de tokens no início (A) | 12 | 12 | 8 | 12 | 4 | 4 |
Solicitações por minuto (B) | 0 | 8 | 0 | 13 | 5 | 0 |
Solicitações limitadas (C) | 0 | 0 | 0 | 1 | 1 | 0 |
Tokens restantes no final do período D = Max(A-B, 0) |
12 | 4 | 8 | 0 | 0 | 4 |
Um processo semelhante é seguido para determinar os limites de limitação no nível da assinatura. As seções a seguir detalham a Taxa de recarga do bucket e a Capacidade máxima do bucket que é usada para determinar os limites de limitação de Máquinas virtuais, Conjuntos de Dimensionamento de Máquinas Virtuais e VMs do Conjunto de Dimensionamento de Máquinas Virtuais.
Limites de limitação para máquinas virtuais
As solicitações de API para Máquinas virtuais são categorizadas em sete políticas distintas. Cada política tem seus próprios limites, dependendo de quão intensivas são as solicitações de API nessa política. A tabela a seguir contém uma lista abrangente dessas políticas, as APIs REST correspondentes e seus respectivos limites de limitação:
Categoria de política | APIs REST | Nível do recurso | Nível do recurso | Nível de Assinatura | Nível de Assinatura |
---|---|---|---|---|---|
Taxa de recarga do bucket (Por minuto) | Capacidade máxima do bucket (Por min) |
Taxa de recarga do bucket (Por min) |
Capacidade máxima do bucket (Por min) |
||
Colocar VM (Criar novas VMs) |
Criar | 4 | 12 | 500 | 1.500 |
Atualizar VM (Atualizar VMs existentes) |
Atualizar Reaplicar Reiniciar Desligar Iniciar Generalizar Converter em discos gerenciados Reimplantar Executar manutenção Captura Executar Comando Criar ou atualizar Extensões – Atualizar Extensões – Excluir Recriação de imagem Atualizar Executar comandos – Atualizar Executar Comandos – Excluir Executar comandos – Criar ou atualizar |
4 | 12 | 500 | 1.500 |
Excluir VM (Excluir VMs) |
Delete (excluir) Simular remoção Desalocar |
4 | 12 | 500 | 1.500 |
Obter uma VM de baixo custo (Obter informações sobre uma única VM) |
Get Exibição de instância Extensões – Obter Listar tamanhos disponíveis Recuperar dados de diagnóstico de inicialização Executar comandos – Obter por máquina virtual Executar comandos – Listar por máquina virtual |
12 | 36 | 8,000 | 24.000 |
Obter uma VM de alto custo1 (Obter informações sobre várias VMs) |
Lista Listar todos Listar por localização |
NA | NA | 300 | 900 |
Operação GET (Obter informações sobre as operações assíncronas de VM) |
Status de operações assíncronas | 15 | 45 | 5\.000 | 15,000 |
Operações de patch de convidado da VM (Avaliar e instalar patches de convidado) |
Avaliar patches Instalar patches |
2 | 6 | 200 | 600 |
1 Somente as políticas de nível de assinatura são aplicáveis.
Limites de limitação para Conjuntos de Dimensionamento de Máquinas Virtuais
As solicitações de API para o Conjunto de Dimensionamento de Máquinas Virtuais (Uniform e Flex) são categorizadas em 5 políticas distintas. Cada política tem seus próprios limites, dependendo de quão intensivas são as solicitações de API nessa política. Essas políticas são aplicáveis aos modos de orquestração Flex e Uniform. A tabela a seguir contém uma lista abrangente dessas políticas, as APIs REST correspondentes e seus respectivos limites de limitação:
Categoria de política | APIs REST | Nível do recurso | Nível do recurso | Nível de Assinatura | Nível de Assinatura |
---|---|---|---|---|---|
Taxa de recarga do bucket (Por min) |
Capacidade máxima do bucket (Por min) |
Taxa de recarga do bucket (Por minuto) | Capacidade máxima do bucket (Por min) |
||
Colocar (Criar novo conjunto de dimensionamento) |
Criar | 4 | 12 | 125 | 375 |
Atualizar (Atualizar o conjunto de dimensionamento existente) |
Atualizar Iniciar2 Reiniciar2 Reimplantar2 Executar manutenção2 Refazer imagem2 Refazer todas as imagens2 Criar ou atualizar Atualizações sem interrupção – Cancelar Extensões – Criar Extensões – Atualizar Extensões – Excluir Force Recovery Service Fabric Platform Update Domain Walk Converter para grupo de canal único Definir estado do serviço de orquestração |
4 | 12 | 500 | 1.500 |
Excluir (Excluir conjunto de dimensionamento) |
Delete (excluir) Desligar2 Desalocar |
4 | 12 | 175 | 525 |
Obter baixo custo (Obter informações sobre um único conjunto de dimensionamento) |
Get Listar SKUs Atualizações sem interrupção – Obter as últimas Obter o histórico de atualização do sistema operacional |
12 | 36 | 800 | 2.400 |
Obter alto custo (Obter informações de uso intensivo de recursos) |
Obter exibição de instância Listar2 Listar todos2 Listar por localização2 |
10 | 30 | 360 | 1.080 |
2 Somente as políticas de nível de assinatura são aplicáveis.
Limites de limitação para Máquinas Virtuais do Conjunto de Dimensionamento de Máquinas Virtuais
As solicitações de API para Máquinas Virtuais do Conjunto de Dimensionamento de Máquinas Virtuais são categorizadas em três políticas distintas. Cada política tem seus próprios limites, dependendo de quão intensivas são as solicitações de API nessa política. A tabela a seguir contém uma lista abrangente dessas políticas, as APIs REST correspondentes e seus respectivos limites de limitação:
Categoria de política | APIs REST | Nível do recurso | Nível do recurso | Nível de Assinatura | Nível de Assinatura |
---|---|---|---|---|---|
Taxa de recarga do bucket (Por min) |
Capacidade máxima do bucket (Por min) |
Taxa de recarga do bucket (Por min) |
Capacidade máxima do bucket (Por min) |
||
Atualizar VMs do conjunto de dimensionamento (Atualizar VMs existentes em um conjunto de dimensionamento) |
Iniciar Reiniciar Recriação de imagem ReimageAll Atualizar SimulateEviction Extensões – Criar ou Atualizar RunCommands – Criar ou Atualizar RunCommands – Atualizar |
4 | 12 | 500 | 1.500 |
Excluir VMs do conjunto de dimensionamento (Excluir VMs do conjunto de dimensionamento) |
Delete (excluir) PowerOff Desalocar Extensões – Excluir RunCommands – Excluir |
4 | 12 | 500 | 1.500 |
Obter VMs do conjunto de dimensionamento (Obter informações sobre VMs do conjunto de dimensionamento) |
Get Exibição GetInstance Extensões – Obter RunCommands – Excluir Dados de diagnóstico RetrieveBoot |
12 | 36 | 2\.000 | 6.000 |
Diretrizes de solução de problemas
Caso os usuários ainda estejam enfrentando desafios devido à limitação de computação, consulte o tópico Solução de problemas de erros de limitação no Azure – Máquinas Virtuais. Ele tem detalhes sobre como solucionar problemas de limitação e melhores práticas para evitar a limitação.
Perguntas Frequentes
Os usuários precisam executar alguma ação?
Os usuários não precisam alterar nada em suas cargas de trabalho ou configuração. Todas as APIs existentes continuam funcionando como estão.
Quais benefícios as políticas de limitação fornecem?
As políticas de limitação oferecem vários benefícios:
Todos os recursos de computação têm uma janela uniforme de 1 min. Os usuários podem invocar chamadas à API com sucesso, 1 minuto depois da limitação.
Nenhum recurso pode usar todos os limites de uma assinatura, pois os limites são definidos no nível do recurso.
A Computação da Microsoft está introduzindo um novo algoritmo, Algoritmo de bucket de token, para determinar os limites. O algoritmo fornece buffer extra para os clientes, ao mesmo tempo em que faz um grande número de solicitações de API.
O cliente recebe um alerta quando está prestes a atingir seus limites de limitação?
Como parte de cada resposta, a Computação da Microsoft retorna x-ms-ratelimit-remaining-resource que pode ser usada para determinar os limites de limitação em relação às políticas. Uma lista de políticas de limitação aplicável é retornada como uma resposta aos Cabeçalhos informativos da taxa de chamadas.