Recomendações para otimizar os custos de dimensionamento

Aplica-se a esta recomendação de lista de verificação de Otimização de Custos do Azure Well-Architected Framework:

CO:12 Otimizar os custos de dimensionamento. Avalie o dimensionamento alternativo nas unidades de dimensionamento. Considere configurações de dimensionamento alternativas e alinhe-se com o modelo de custos. As considerações devem incluir a utilização nos limites herdados de cada instância, recurso e limite de unidade de dimensionamento. Utilize estratégias para controlar a procura e a oferta.

Este guia fornece recomendações para otimizar os custos de dimensionamento. O dimensionamento da otimização de custos é o processo de remoção de ineficiências no dimensionamento da carga de trabalho. O objetivo é reduzir os custos de dimensionamento, cumprindo todos os requisitos não funcionais. Gastar menos para obter o mesmo resultado. A otimização do dimensionamento permite-lhe evitar despesas desnecessárias, sobreaprovisionamento e desperdício. Também ajuda a evitar picos inesperados nos custos, controlando a procura e limitando a oferta. As práticas de dimensionamento ineficientes podem levar a um aumento da carga de trabalho e dos custos operacionais e afetar negativamente a saúde financeira global da carga de trabalho.

Definições

Termo Definição
Dimensionamento automático Uma abordagem de dimensionamento que adiciona ou remove automaticamente recursos quando um conjunto de condições é cumprido.
Métricas de custos Dados numéricos relacionados com o custo da carga de trabalho.
Reduzir verticalmente Uma estratégia de dimensionamento vertical que muda para um SKU inferior para fornecer menos recursos à carga de trabalho.
Reduzir horizontalmente Uma estratégia de dimensionamento horizontal que remove instâncias para fornecer menos recursos à carga de trabalho.
Aumentar horizontalmente Uma estratégia de dimensionamento horizontal que adiciona instâncias para fornecer mais recursos à carga de trabalho.
Unidade de dimensionamento Um grupo de recursos que se dimensionam proporcionalmente em conjunto.
Aumentar verticalmente Uma estratégia de dimensionamento vertical que muda para um SKU superior para fornecer mais recursos à carga de trabalho.
Unidade de manutenção de stock (SKU) Um escalão de serviço para um serviço do Azure.
Dados de utilização Os dados de utilização são informações diretas (reais) ou informações indiretas/representativas (proxy) sobre a quantidade de uma tarefa, serviço ou aplicação que está a ser utilizada.

Principais estratégias de design

O objetivo da otimização de custos do dimensionamento é aumentar e reduzir verticalmente no último momento responsável e reduzir verticalmente e reduzir assim que for prático. Para otimizar o dimensionamento da carga de trabalho, pode avaliar opções de dimensionamento alternativas nas unidades de dimensionamento e alinhá-las com o modelo de custos. Uma unidade de dimensionamento representa um agrupamento específico de recursos que pode ser dimensionado de forma independente ou em conjunto. Deve conceber unidades de dimensionamento para processar uma quantidade específica de carga e estas podem ser compostas por várias instâncias, servidores ou outros recursos. Tem de avaliar a relação custo/eficácia das unidades de dimensionamento da carga de trabalho e das alternativas de modelo.

Se não utilizar o dimensionamento, veja documentação de orientação sobre o dimensionamento da carga de trabalho. Tem de descobrir se a sua aplicação pode ser dimensionada. As aplicações sem estado são mais fáceis de dimensionar porque podem processar vários pedidos ao mesmo tempo. Além disso, avalie se a aplicação foi criada com os princípios de sistemas distribuídos. Os sistemas distribuídos podem lidar com o aumento da carga ao distribuir a carga de trabalho por vários nós. No entanto, uma aplicação singleton foi concebida para ter apenas uma instância em execução a qualquer momento. Assim, o dimensionamento pode não ser adequado para todas as cargas de trabalho.

Avaliar o aumento horizontal versus aumentar verticalmente

Avaliar o aumento horizontal versus aumentar verticalmente envolve determinar a abordagem mais económica entre aumentar os recursos num sistema existente (aumentar verticalmente) ou adicionar mais instâncias desse sistema (aumentar horizontalmente) com base em vários fatores, como preços, requisitos de carga de trabalho e tempo de inatividade aceitável. Escolher a abordagem de dimensionamento correta pode levar a poupanças significativas, garantindo que paga apenas o que precisa enquanto cumpre os padrões de desempenho e fiabilidade.

O objetivo é determinar a escolha mais económica com base nos preços do escalão de serviço, nos traços de carga de trabalho, no período de inatividade aceitável e no modelo de custos. Para alguns, pode ser mais económico optar por instâncias mais caras em menos números. Por outro lado, para outros, um escalão mais barato com mais instâncias pode ser melhor. Para tomar uma decisão informada, tem de analisar dados reais ou representativos da sua configuração e avaliar os méritos de custos relativos de cada estratégia. Para avaliar a abordagem mais económica, considere estas recomendações:

  • Recolher dados de utilização: recolha dados de produção reais ou dados proxy que representem os padrões de utilização da carga de trabalho e a utilização de recursos. Estes dados devem incluir métricas como a utilização da CPU, a utilização da memória, o tráfego de rede e quaisquer outras métricas relevantes que afetem o custo do dimensionamento.

  • Definir métricas de custos: identifique as métricas de custos relevantes para a carga de trabalho, como o custo por hora, o custo por transação ou o custo por unidade de utilização de recursos. Estas métricas ajudam-no a comparar a relação custo/eficácia de diferentes opções de dimensionamento.

  • Recolher dados de utilização: recolha dados de produção reais ou dados proxy que representem os padrões de utilização da carga de trabalho e a utilização de recursos. Estes dados devem incluir métricas como a utilização da CPU, a utilização da memória, o tráfego de rede e quaisquer outras métricas relevantes que afetam o custo do dimensionamento

  • Definir métricas de custos: identifique as métricas de custos relevantes para a carga de trabalho, como o custo por hora, o custo por transação ou o custo por unidade de utilização de recursos. Estas métricas ajudam-no a comparar a relação custo/eficácia de diferentes opções de dimensionamento.

  • Veja os requisitos: ao decidir entre estratégias de escalamento horizontal e de aumento horizontal, considere os requisitos de fiabilidade, desempenho e dimensionamento da carga de trabalho. Aumentar horizontalmente pode melhorar a fiabilidade através da redundância. Aumentar verticalmente aumenta a capacidade de um recurso, mas pode haver limites para aumentar verticalmente.

  • Considere os limites de recursos: ao avaliar as opções de dimensionamento, é importante considerar os limites inerentes a cada instância, recurso e limite de unidade de dimensionamento. Tenha em atenção os limites de dimensionamento superiores para cada recurso e planeie em conformidade. Além disso, tenha em atenção os limites da sua subscrição e de outros recursos.

  • Dimensionamento de teste: crie testes para diferentes cenários de dimensionamento, incluindo opções de aumento horizontal e vertical. Aplicar os dados de utilização, simular o comportamento da carga de trabalho em diferentes configurações de dimensionamento. Realize testes no mundo real com os cenários de dimensionamento modelados.

  • Calcular os custos: utilize os dados recolhidos e as métricas de custos para calcular os custos associados a cada configuração de dimensionamento. Considere fatores como preços de instâncias, utilização de recursos e quaisquer custos adicionais relacionados com o dimensionamento.

Otimizar o dimensionamento automático

Otimizar a política de dimensionamento automático envolve refinar o dimensionamento automático para reagir a alterações de carga com base nos requisitos não funcionais da carga de trabalho. Pode limitar as atividades de dimensionamento excessivo ao ajustar os limiares e ao utilizar o período de arrefecimento correto. Para otimizar o dimensionamento automático, considere as seguintes recomendações:

  • Analise a política de dimensionamento automático atual: compreenda a política existente e o respetivo comportamento em resposta a diferentes níveis de carga.

  • Veja requisitos não funcionais: identifique os requisitos não funcionais específicos que tem de considerar, como o tempo de resposta, a utilização de recursos ou o custo.

  • Ajustar limiares de dimensionamento: ajuste os limiares de dimensionamento com base nas características da carga de trabalho e nos requisitos não funcionais. Defina limiares para aumentar ou reduzir verticalmente com base em fatores como a utilização da CPU ao longo do tempo, o tráfego de rede ou o comprimento da fila.

  • Ajustar um período de arrefecimento: ajuste o período de arrefecimento para evitar atividades de dimensionamento excessivas acionadas por picos de carga temporários. Um período de arrefecimento introduz um atraso entre os eventos de dimensionamento, permitindo que o sistema estabilize antes de novas ações de dimensionamento.

  • Monitorizar e otimizar: monitorize continuamente o comportamento e o desempenho do sistema. Analise as atividades de dimensionamento e ajuste a política conforme necessário para otimizar o custo e cumprir os requisitos não funcionais pretendidos.

Contrapartida: a redução do número de eventos de dimensionamento aumenta as hipóteses de se deparar com problemas relacionados com o dimensionamento. Significa que está a eliminar a almofada extra ou a memória intermédia que pode ajudar a gerir potenciais problemas ou atrasos do dimensionamento.

Considerar o dimensionamento baseado em eventos

O dimensionamento automático orientado por eventos permite que a aplicação ajuste dinamicamente os recursos com base em eventos ou acionadores específicos em vez de métricas tradicionais, como a utilização da CPU ou da memória. Por exemplo, o dimensionamento automático baseado em eventos do Kubernetes (KEDA) pode dimensionar aplicações com base em dimensionadores, como o comprimento de um tópico do Kafka. A precisão ajuda a evitar flutuações de dimensionamento desnecessárias e desperdício de recursos. Um elevado nível de precisão acaba por otimizar os custos. Para utilizar o dimensionamento baseado em eventos, siga estes passos:

  • Escolha uma origem de evento: determine a origem de eventos que aciona o dimensionamento da unidade de dimensionamento. Uma origem pode ser uma fila de mensagens, uma plataforma de transmissão em fluxo ou qualquer outro sistema orientado por eventos.

  • Configurar a ingestão de eventos: configure a aplicação para consumir eventos da origem de eventos escolhida. Normalmente, envolve estabelecer uma ligação, subscrever os tópicos ou filas relevantes e processar os eventos recebidos.

  • Implementar a lógica de dimensionamento: escreva a lógica que determina quando e como a unidade de escala deve ser dimensionada com base nos eventos recebidos. Esta lógica deve considerar fatores como o número de eventos, a taxa de eventos recebidos ou quaisquer outras métricas relevantes.

  • Integrar com mecanismos de dimensionamento: consoante o ambiente de runtime da sua aplicação, pode utilizar diferentes mecanismos de dimensionamento para ajustar os recursos alocados à aplicação.

  • Configurar regras de dimensionamento: defina as regras de dimensionamento que especificam a forma como a unidade de dimensionamento deve ser dimensionada em resposta a eventos. Estas regras podem basear-se em limiares, padrões ou outros critérios que se alinhem com os requisitos da sua aplicação. Os limiares de dimensionamento devem estar relacionados com as métricas empresariais. Por exemplo, se adicionar mais duas instâncias, pode suportar mais 50 utilizadores no processamento do carrinho de compras.

  • Testar e monitorizar: valide o comportamento da implementação do dimensionamento baseado em eventos ao testá-lo com diferentes cenários de eventos. Monitorize as ações de dimensionamento e certifique-se de que as ações estão alinhadas com as suas expetativas.

Compromisso Configurar e otimizar o dimensionamento automático baseado em eventos pode ser complexo e uma configuração inadequada pode levar ao aprovisionamento excessivo ou ao subaprovisionamento de recursos.

Otimizar a procura e a oferta

Controle a procura em relação à sua oferta. Nas cargas de trabalho em que a utilização determina o dimensionamento, o custo correlaciona-se com o dimensionamento. Para otimizar os custos do dimensionamento, pode minimizar os gastos de dimensionamento. Pode descarregar a procura distribuindo a procura para outros recursos ou pode reduzir a procura ao implementar filas prioritárias, descarga de gateway, colocação em memória intermédia e limitação de taxa. Ambas as estratégias podem impedir custos indesejáveis devido ao dimensionamento e ao consumo de recursos. Também pode controlar a oferta ao limitar os limites de dimensionamento. Para otimizar a procura e a oferta da carga de trabalho, considere as seguintes recomendações.

Descarregar procura

A descarga da procura refere-se à prática de distribuir ou transferir a procura de recursos para outros recursos ou serviços. Pode utilizar várias tecnologias ou estratégias:

  • Colocação em cache: utilize a colocação em cache para armazenar dados ou conteúdos acedidos com frequência, reduzindo a carga na sua infraestrutura de back-end. Por exemplo, utilize redes de entrega de conteúdos (CDNs) para colocar em cache e servir conteúdo estático, reduzindo a necessidade de dimensionar o back-end. No entanto, nem todas as cargas de trabalho podem colocar dados em cache. As cargas de trabalho que requerem dados atualizados e em tempo real, como cargas de trabalho de negociação ou jogos, não devem utilizar uma cache. Os dados em cache seriam antigos e irrelevantes para o utilizador.

    Troca. A colocação em cache pode apresentar desafios em termos de invalidação da cache, consistência e gestão da expiração da cache. É importante conceber e implementar cuidadosamente estratégias de colocação em cache para evitar potenciais compromissos.

  • Descarga de conteúdo: descarregue conteúdo para serviços externos ou plataformas para reduzir a carga de trabalho na sua infraestrutura. Por exemplo, em vez de armazenar ficheiros de vídeo no servidor primário, pode alojar estes ficheiros num serviço de armazenamento separado independente do servidor primário. Pode carregar estes ficheiros grandes diretamente a partir do serviço de armazenamento. Esta abordagem liberta recursos nos seus servidores, permitindo-lhe utilizar um servidor mais pequeno. Pode ser mais barato armazenar ficheiros grandes num arquivo de dados separado. Pode utilizar uma CDN para melhorar o desempenho.

  • Balanceamento de carga: distribua os pedidos recebidos por vários servidores através do balanceamento de carga. O balanceamento de carga distribui uniformemente a carga de trabalho e impede que qualquer servidor individual fique sobrecarregado. Os balanceadores de carga otimizam a utilização de recursos e melhoram a eficiência da sua infraestrutura.

  • Descarga da base de dados: reduza a carga no servidor de aplicações principal ao descarregar operações de base de dados para um servidor de base de dados separado ou um serviço especializado. Por exemplo, utilize uma CDN para colocação em cache de conteúdo estático e uma cache de Redis para colocação em cache de conteúdo dinâmico (dados da base de dados). Técnicas como a fragmentação da base de dados, as réplicas de leitura ou a utilização de serviços de bases de dados geridas também podem reduzir a carga.

    Desvantagem: Descarregar tarefas específicas para recursos alternativos ajuda a reduzir ou evitar dimensionamentos e custos adicionais associados ao dimensionamento. No entanto, é importante considerar os desafios operacionais e de manutenção que podem surgir da descarga. Realizar uma análise abrangente de custo-benefício é crucial ao selecionar as técnicas de descarga mais adequadas para a sua carga de trabalho. Esta análise garante que o método escolhido é eficiente e viável em relação às poupanças previstas e às complexidades operacionais.

Reduzir a procura

Reduzir a procura de recursos significa implementar estratégias que ajudam a minimizar a utilização de recursos numa carga de trabalho. A descarga da procura muda a procura para outros recursos. A redução da procura diminui a procura na carga de trabalho. A redução da procura permite-lhe evitar o sobreaprovisionamento de recursos e o pagamento de capacidade não utilizada ou subutilizada. Deve utilizar padrões de conceção ao nível do código para reduzir a procura de recursos de carga de trabalho. Para reduzir a procura através de padrões de conceção, siga estes passos:

  • Compreender os padrões de conceção: familiarize-se com vários padrões de conceção que promovem a otimização de recursos.

  • Analisar os requisitos da carga de trabalho: avalie os requisitos específicos da carga de trabalho, incluindo os padrões de procura esperados, as cargas de pico e as necessidades de recursos.

  • Selecionar padrões de conceção adequados: escolha os padrões de estrutura que se alinham com os requisitos e objetivos da sua carga de trabalho. Por exemplo, se a carga de trabalho sofrer uma procura flutuante, os padrões de dimensionamento e limitação orientados por eventos podem ajudar a gerir a carga de trabalho ao alocar recursos dinamicamente. Aplique os padrões de estrutura selecionados à arquitetura da carga de trabalho. Poderá ter de separar os componentes da carga de trabalho, colocar aplicações em contentores, otimizar a utilização do armazenamento e muito mais.

  • Monitorizar e otimizar continuamente: avalie regularmente a eficácia dos padrões de estrutura implementados e ajuste conforme necessário. Monitorize a utilização de recursos, as métricas de desempenho e as oportunidades de otimização de custos.

Ao seguir estes passos e utilizar padrões de conceção adequados, pode reduzir a procura de recursos, otimizar os custos e garantir o funcionamento eficiente das respetivas cargas de trabalho.

Utilize estes padrões de conceção para reduzir a procura:

  • Cache à parte: o padrão verifica a cache para ver se os dados já estão armazenados na memória. Se os dados forem encontrados na cache, a aplicação pode obter e devolver rapidamente os dados, reduzindo a necessidade de consultar o arquivo de dados persistente.

  • Verificação de afirmações: ao separar os dados do fluxo de mensagens, este padrão reduz o tamanho das mensagens e suporta uma solução de mensagens mais económica.

  • Consumidores concorrentes: este padrão processa de forma eficiente os itens numa fila ao aplicar o processamento distribuído e simultâneo. Este padrão de conceção otimiza os custos ao dimensionar com base na profundidade da fila e ao definir limites em instâncias de consumidor simultâneas máximas.

  • Consolidação de recursos de computação: este padrão aumenta a densidade e consolida os recursos de computação ao combinar várias aplicações ou componentes na infraestrutura partilhada. Maximiza a utilização de recursos, evitando a capacidade aprovisionada não utilizada e reduzindo os custos.

  • Carimbos de implementação: a utilização de selos de implementação proporciona várias vantagens, como a distribuição geográfica de grupos de dispositivos, a implementação de novas funcionalidades em carimbos específicos e a observação do custo por dispositivo. Os selos de implementação permitem uma melhor escalabilidade, tolerância a falhas e utilização eficiente de recursos.

  • Descarga de gateway: este padrão descarrega o processamento de pedidos num dispositivo de gateway, redirecionando os custos dos recursos por nó para a implementação do gateway. A utilização deste padrão de conceção pode resultar num custo de propriedade mais baixo num modelo de processamento centralizado.

  • Publicador/subscritor: este padrão desassocia componentes numa arquitetura, substituindo a comunicação direta por um mediador de mensagens intermédio ou um barramento de eventos. Permite uma abordagem condicionada por eventos e faturação baseada no consumo, evitando o sobreaprovisionamento.

  • Nivelamento de carga baseado na fila: o padrão coloca em memória intermédia os pedidos recebidos ou as tarefas numa fila. A colocação em memória intermédia suaviza a carga de trabalho e reduz a necessidade de sobreaprovisionamento de recursos para processar a carga máxima. Os pedidos recebidos são processados de forma assíncrona para reduzir os custos.

  • Fragmentação: este padrão direciona pedidos específicos para um destino lógico, permitindo otimizações com colocalização de dados. A fragmentação pode levar a uma poupança de custos ao utilizar várias instâncias de recursos de armazenamento ou computação de especificações inferiores.

  • Alojamento de conteúdos estáticos: este padrão fornece conteúdo estático de forma eficiente através de uma plataforma de alojamento concebida para este fim. Evita a utilização de anfitriões de aplicações dinâmicos mais dispendiosos, otimizando a utilização de recursos.

  • Limitação: este padrão coloca limites na taxa (limitação de taxa) ou débito de pedidos recebidos a um recurso ou componente. Ajuda a informar a modelação de custos e pode ser associada diretamente ao modelo de negócio da aplicação.

  • Chave Valet: este padrão concede acesso seguro e exclusivo a um recurso sem envolver mais componentes, reduzindo a necessidade de recursos intermediários e melhorando a eficiência.

Fornecimento de controlo

Definir um limite superior sobre o montante que está disposto a gastar num determinado recurso ou serviço é uma forma de controlar a oferta. É uma estratégia importante para controlar os custos e garantir que as despesas não excedam um determinado nível. Estabeleça um orçamento e monitorize as despesas para garantir que se mantém dentro do montante definido. Pode utilizar plataformas de gestão de custos, alertas de orçamento ou controlar os padrões de utilização e gastos. Alguns serviços permitem-lhe limitar as taxas de fornecimento e limite e deve utilizar essas funcionalidades sempre que for útil.

Controlar a oferta refere-se à definição de um limite superior no montante que está disposto a gastar num determinado recurso ou serviço. É uma estratégia importante porque ajuda a controlar os custos e garante que as despesas não excedem um determinado nível. Estabeleça um orçamento e monitorize as despesas para garantir que se mantém dentro do limiar definido. Pode utilizar plataformas de gestão de custos, alertas de orçamento ou controlar os padrões de utilização e gastos. Alguns serviços permitem-lhe limitar as taxas de fornecimento e limite e deve utilizar essas funcionalidades sempre que for útil.

Desvantagem: limites mais rigorosos podem resultar em oportunidades perdidas de dimensionamento quando a procura aumenta, o que pode afetar potencialmente a experiência do utilizador. Pode causar encerramentos ou não conseguir responder à carga. É importante encontrar um equilíbrio entre a otimização de custos e garantir que tem recursos suficientes para satisfazer as suas necessidades empresariais.

Facilitação do Azure

Avaliar o aumento horizontal versus o aumento vertical: o Azure fornece um ambiente de teste onde pode implementar e testar diferentes configurações de dimensionamento. Ao utilizar os dados reais da carga de trabalho ou os dados de proxy, pode simular cenários do mundo real e medir os efeitos nos custos. O Azure oferece ferramentas e serviços para testes de desempenho, testes de carga e monitorização, o que pode ajudá-lo a avaliar a relação custo/eficácia das opções de aumento horizontal versus aumento vertical.

O Azure fornece recomendações de gestão de custos através de várias ferramentas e serviços, como o Assistente do Azure. Estas recomendações analisam os padrões de utilização, a utilização de recursos e as configurações de dimensionamento para fornecer informações e sugestões para otimizar os custos.

O Azure Load Testing é um serviço de teste de carga totalmente gerido que gera carga de alta escala. O serviço simula o tráfego para as suas aplicações, independentemente do local onde estão alojadas. Os programadores, os testadores e os engenheiros de garantia de qualidade (QA) podem utilizar testes de carga para otimizar o desempenho, escalabilidade ou capacidade da aplicação.

Otimizar o dimensionamento automático: muitos serviços de computação do Azure suportam a implementação de várias instâncias idênticas e a otimização rápida dos limiares e políticas de dimensionamento. O Azure fornece capacidades de dimensionamento automático que lhe permitem ajustar automaticamente o número de instâncias ou recursos com base na procura de cargas de trabalho. Pode definir regras e limiares de dimensionamento para acionar ações de aumento horizontal ou de aumento horizontal. Ao utilizar o dimensionamento automático, pode otimizar a alocação de recursos e a eficiência de custos ao dimensionar dinamicamente os recursos com base na procura real.

O Azure mantém uma lista de limites de subscrição e serviço. Existe um limite geral para o número de instâncias de um recurso que pode implementar em cada grupo de recursos com algumas exceções. Para obter mais informações, veja Limites de instâncias de recursos por grupo de recursos.

Otimizar a procura e a oferta: o Azure Monitor fornece informações sobre o desempenho e o estado de funcionamento das suas aplicações e infraestrutura. Pode utilizar o Azure Monitor para monitorizar a carga nos seus recursos e analisar tendências ao longo do tempo. Ao utilizar métricas e registos recolhidos pelo Azure Monitor, pode identificar áreas onde podem ser necessários ajustes de dimensionamento. Estas informações podem orientar o refinamento da política de dimensionamento automático para garantir que está alinhada com os requisitos não funcionais e os objetivos de otimização de custos.

  • Fornecimento de descarga: o Azure tem uma Rede de Entrega de Conteúdos (CDN) na cloud moderna denominada Azure Front Door e serviços de colocação em cache (Cache do Azure para Redis e HPC Cache do Azure). A CDN coloca o conteúdo em cache mais próximo dos utilizadores finais, reduzindo a latência de rede e melhorando os tempos de resposta. A colocação em cache armazena uma cópia dos dados em frente ao arquivo de dados principal, reduzindo a necessidade de pedidos repetidos para o back-end. Ao utilizar a CDN e os serviços de colocação em cache, pode otimizar o desempenho e reduzir a carga nos servidores para potenciais poupanças de custos.

  • Controlar a oferta: o Azure também lhe permite definir limites de recursos para a carga de trabalho na cloud. Ao definir limites de recursos, pode garantir que a carga de trabalho permanece dentro dos recursos alocados e evitar custos desnecessários. O Azure fornece vários mecanismos para definir limites de recursos, tais como quotas, políticas e alertas orçamentais. Estes mecanismos ajudam-no a monitorizar e controlar a utilização de recursos.

    Gestão de API podem limitar e limitar os pedidos. Ser capaz de limitar os pedidos recebidos é uma função fundamental do Azure Gestão de API. Ao controlar a taxa de pedidos ou o total de pedidos/dados transferidos, Gestão de API permite que os fornecedores de API protejam as suas APIs contra abusos e criem valor para diferentes camadas de produtos da API.

Lista de verificação otimização de custos

Veja o conjunto completo de recomendações.