Aanbevelingen voor het optimaliseren van schaalkosten

2023-11-15

Van toepassing op deze controlelijst voor Azure Well-Architected Framework Cost Optimization:

CO:12	Schaalkosten optimaliseren. Evalueer alternatieve schaalaanpassing binnen uw schaaleenheden. Overweeg alternatieve schaalconfiguraties en stem af op het kostenmodel. Overwegingen moeten het gebruik omvatten ten opzichte van de overgenomen limieten van elke instantie, resource en schaaleenheidgrens. Gebruik strategieën voor het beheren van de vraag en het aanbod.

Deze handleiding bevat aanbevelingen voor het optimaliseren van schaalkosten. Kosten optimaliseren van schalen is het proces van het verwijderen van inefficiëntie bij het schalen van workloads. Het doel is om de schaalkosten te verlagen terwijl nog steeds aan alle niet-functionele vereisten wordt voldaan. Uitgaven minder om hetzelfde resultaat te krijgen. Door schaalaanpassing te optimaliseren, kunt u onnodige uitgaven, overprovisioning en verspilling voorkomen. Het helpt ook onverwachte pieken in de kosten te voorkomen door de vraag te beheersen en het aanbod te beperken. Inefficiënte schaalprocedures kunnen leiden tot hogere workload- en operationele kosten en kunnen de algehele financiële status van de workload negatief beïnvloeden.

Definities

Termijn	Definitie
Automatisch schalen	Een schaalbenadering waarmee automatisch resources worden toegevoegd of verwijderd wanneer aan een set voorwaarden wordt voldaan.
Metrische kostengegevens	Numerieke gegevens met betrekking tot workloadkosten.
Omlaag schalen	Een strategie voor verticaal schalen die naar een lagere SKU verschuift om minder resources aan de workload te bieden.
Inschalen	Een horizontale schaalstrategie waarmee exemplaren worden verwijderd om minder resources aan de workload te bieden.
Uitschalen	Een horizontale schaalstrategie waarmee exemplaren worden toegevoegd om meer resources aan de workload te bieden.
Schaaleenheid	Een groep resources die evenredig worden geschaald.
Omhoog schalen	Een strategie voor verticaal schalen die naar een hogere SKU verschuift om meer resources aan de workload te bieden.
Voorraadbeheereenheid (SKU)	Een servicelaag voor een Azure-service.
Gebruiksgegevens	Gebruiksgegevens zijn directe informatie (real) of indirecte/representatieve informatie (proxy) over hoeveel een taak, service of toepassing wordt gebruikt.

Belangrijke ontwerpstrategieën

Het doel van het optimaliseren van de kosten is om omhoog en omlaag te schalen op het laatste verantwoordelijke moment en omlaag te schalen zodra het praktisch is. Als u schaalaanpassing voor uw workload wilt optimaliseren, kunt u alternatieve schaalopties in de schaaleenheden evalueren en deze afstemmen op het kostenmodel. Een schaaleenheid vertegenwoordigt een specifieke groepering van resources die onafhankelijk of samen kunnen worden geschaald. U moet schaaleenheden ontwerpen om een specifieke hoeveelheid belasting af te handelen en ze kunnen bestaan uit meerdere exemplaren, servers of andere resources. U moet de kosteneffectiviteit van uw workloadschaaleenheden en model alternatieve modellen evalueren.

Als u geen schaalaanpassing gebruikt, raadpleegt u de richtlijnen voor het schalen van de workload. U moet nagaan of uw toepassing kan worden geschaald. Staatloze toepassingen zijn eenvoudiger te schalen omdat ze meerdere aanvragen tegelijk kunnen verwerken. Evalueer ook of de toepassing is gebouwd met behulp van principes voor gedistribueerde systemen. Gedistribueerde systemen kunnen verhoogde belasting verwerken door de workload over meerdere knooppunten te verdelen. Een singleton-toepassing is echter ontworpen voor slechts één exemplaar dat op een bepaald moment wordt uitgevoerd. Schaalaanpassing is dus mogelijk niet geschikt voor alle workloads.

Uitschalen evalueren versus omhoog schalen

Het evalueren van uitschalen versus omhoog schalen omvat het bepalen van de meest rendabele benadering tussen het verhogen van resources in een bestaand systeem (omhoog schalen) of het toevoegen van meer exemplaren van dat systeem (uitschalen) op basis van verschillende factoren, zoals prijzen, workloadvereisten en acceptabele downtime. Het kiezen van de juiste schaalbenadering kan leiden tot aanzienlijke besparingen, zodat u alleen betaalt voor wat u nodig hebt, terwijl u nog steeds voldoet aan de prestatie- en betrouwbaarheidsstandaarden.

Het doel is om de meest kostenefficiënte keuze te bepalen op basis van servicelaagprijzen, workloadeigenschappen, acceptabele downtime en het kostenmodel. Voor sommigen is het misschien voordeliger om te kiezen voor duurdere exemplaren in minder getallen. Een goedkopere laag met meer exemplaren kan daarentegen beter zijn voor anderen. Als u een weloverwogen beslissing wilt nemen, moet u echte of representatieve gegevens van uw installatie analyseren en de relatieve kosten van elke strategie evalueren. Als u de meest kostenefficiënte benadering wilt evalueren, kunt u de volgende aanbevelingen overwegen:

Gebruiksgegevens verzamelen: verzamel werkelijke productiegegevens of proxygegevens die de gebruikspatronen en het resourcegebruik van de werkbelasting vertegenwoordigen. Deze gegevens moeten metrische gegevens bevatten, zoals CPU-gebruik, geheugengebruik, netwerkverkeer en andere relevante metrische gegevens die van invloed zijn op de kosten van schalen.
Metrische kosten definiëren: identificeer de metrische kostengegevens die relevant zijn voor uw workload, zoals de kosten per uur, kosten per transactie of kosten per resourcegebruik. Met deze metrische gegevens kunt u de kosteneffectiviteit van verschillende schaalopties vergelijken.
Gebruiksgegevens verzamelen: verzamel werkelijke productiegegevens of proxygegevens die de gebruikspatronen en het resourcegebruik van de werkbelasting vertegenwoordigen. Deze gegevens moeten metrische gegevens bevatten, zoals CPU-gebruik, geheugengebruik, netwerkverkeer en andere relevante metrische gegevens die van invloed zijn op de kosten van schalen
Metrische kosten definiëren: identificeer de metrische kostengegevens die relevant zijn voor uw workload, zoals de kosten per uur, kosten per transactie of kosten per resourcegebruik. Met deze metrische gegevens kunt u de kosteneffectiviteit van verschillende schaalopties vergelijken.
Raadpleeg de vereisten: houd rekening met de betrouwbaarheid, prestaties en schaalvereisten van uw workload bij het kiezen tussen uitschaal- en schaalstrategieën. Uitschalen kan de betrouwbaarheid verbeteren door redundantie. Als u omhoog schaalt, neemt de capaciteit van een resource toe, maar er zijn mogelijk limieten voor het aantal dat u omhoog kunt schalen.
Overweeg resourcelimieten: bij het evalueren van schaalopties is het belangrijk om rekening te houden met de inherente limieten van elke instantie, resource en schaaleenheidgrens. Houd rekening met de bovenliggende schaallimieten voor elke resource en plan dienovereenkomstig. Houd ook rekening met de limieten van uw abonnement en andere resources.
Testschalen: Maak tests voor verschillende schaalscenario's, waaronder opties voor uitschalen en omhoog schalen. Door de gebruiksgegevens toe te passen, simuleert u het gedrag van de werkbelasting onder verschillende schaalconfiguraties. Voer praktijktests uit met behulp van de gemodelleerde schaalscenario's.
Kosten berekenen: gebruik de verzamelde gegevens en metrische kostengegevens om de kosten te berekenen die zijn gekoppeld aan elke schaalconfiguratie. Houd rekening met factoren zoals instantieprijzen, resourcegebruik en eventuele extra kosten met betrekking tot schalen.

Automatisch schalen optimaliseren

Het optimaliseren van het beleid voor automatisch schalen omvat het verfijnen van automatisch schalen om te reageren op wijzigingen in de belasting op basis van de niet-functionele vereisten van de workload. U kunt overmatige schaalactiviteiten beperken door drempelwaarden aan te passen en de juiste afkoelperiode te gebruiken. Als u automatische schaalaanpassing wilt optimaliseren, moet u rekening houden met de volgende aanbevelingen:

Analyseer het huidige beleid voor automatisch schalen: inzicht in het bestaande beleid en het gedrag ervan als reactie op verschillende belastingsniveaus.
Raadpleeg niet-functionele vereisten: identificeer de specifieke niet-functionele vereisten die u moet overwegen, zoals reactietijd, resourcegebruik of kosten.
Schaaldrempels aanpassen: Pas de drempelwaarden voor schaalaanpassing aan op basis van de workloadkenmerken en niet-functionele vereisten. Stel drempelwaarden in voor omhoog of omlaag schalen op basis van factoren zoals CPU-gebruik in de loop van de tijd, netwerkverkeer of wachtrijlengte.
Een afkoelperiode aanpassen: pas de afkoelperiode aan om overmatige schaalactiviteiten te voorkomen die worden geactiveerd door tijdelijke belastingpieken. Een afkoelperiode introduceert een vertraging tussen schaalgebeurtenissen, zodat het systeem kan stabiliseren voordat verdere schaalacties worden uitgevoerd.
Bewaken en verfijnen: continu het gedrag en de prestaties van het systeem bewaken. Analyseer de schaalactiviteiten en pas het beleid zo nodig aan om de kosten te optimaliseren en te voldoen aan de gewenste niet-functionele vereisten.

Compromis: Als u het aantal schaalbeurtenissen vermindert, krijgt u de kans dat er problemen optreden met betrekking tot schalen. Dit betekent dat u het extra kussen of de extra buffer elimineert die kan helpen bij het beheren van potentiële problemen of vertragingen bij het schalen.

Schalen op basis van gebeurtenissen gebruiken

Met automatisch schalen op basis van gebeurtenissen kan de toepassing resources dynamisch aanpassen op basis van specifieke gebeurtenissen of triggers in plaats van traditionele metrische gegevens, zoals CPU- of geheugengebruik. Kubernetes-gebeurtenisgestuurde automatische schaalaanpassing (KEDA) kan bijvoorbeeld toepassingen schalen op basis van schaalders, zoals de lengte van een Kafka-onderwerp. Precisie helpt onnodige schaalschommelingen en resourceverspilling te voorkomen. Een hoge mate van precisie optimaliseert uiteindelijk de kosten. Als u schaalaanpassing op basis van gebeurtenissen wilt gebruiken, voert u de volgende stappen uit:

Kies een gebeurtenisbron: Bepaal de gebeurtenisbron die het schalen van uw schaaleenheid activeert. Een bron kan een berichtenwachtrij, een streamingplatform of een ander gebeurtenisgestuurd systeem zijn.
Gebeurtenisopname instellen: Configureer uw toepassing om gebeurtenissen van de gekozen gebeurtenisbron te gebruiken. Dit omvat meestal het tot stand brengen van een verbinding, het abonneren op de relevante onderwerpen of wachtrijen en het verwerken van de binnenkomende gebeurtenissen.
Schaallogica implementeren: schrijf de logica die bepaalt wanneer en hoe uw schaaleenheid moet worden geschaald op basis van de binnenkomende gebeurtenissen. Deze logica moet rekening houden met factoren zoals het aantal gebeurtenissen, de snelheid van binnenkomende gebeurtenissen of andere relevante metrische gegevens.
Integreren met schaalmechanismen: afhankelijk van de runtime-omgeving van uw toepassing, kunt u verschillende schaalmechanismen gebruiken om de resources aan te passen die aan de toepassing zijn toegewezen.
Schaalregels configureren: definieer de schaalregels die aangeven hoe uw schaaleenheid moet worden geschaald als reactie op gebeurtenissen. Deze regels kunnen worden gebaseerd op drempelwaarden, patronen of andere criteria die overeenkomen met de vereisten van uw toepassing. Drempelwaarden voor schalen moeten betrekking hebben op zakelijke metrische gegevens. Als u bijvoorbeeld nog twee exemplaren toevoegt, kunt u 50 meer gebruikers ondersteunen bij het verwerken van winkelwagens.
Testen en bewaken: Valideer het gedrag van uw implementatie voor schalen op basis van gebeurtenissen door deze te testen met verschillende gebeurtenisscenario's. Bewaak de schaalacties en zorg ervoor dat de acties overeenkomen met uw verwachtingen.

Het configureren en verfijnen van automatisch schalen op basis van gebeurtenissen kan complex zijn en een onjuiste configuratie kan leiden tot overinrichting of onderinrichting van resources.

Vraag en aanbod optimaliseren

Beheer de vraag tegen uw aanbod. Bij workloads waarbij het gebruik schaalt, worden de kosten gecorreleerd met de schaal. Als u de kosten van schalen wilt optimaliseren, kunt u de schaaluitgaven minimaliseren. U kunt de vraag offloaden door de vraag naar andere resources te distribueren of u kunt de vraag verminderen door prioriteitswachtrijen, gateway-offloading, buffering en snelheidsbeperking te implementeren. Beide strategieën kunnen ongewenste kosten voorkomen als gevolg van schalen en resourceverbruik. U kunt ook het aanbod beheren door de schaallimieten te beperken. Als u de vraag en het aanbod van workloads wilt optimaliseren, moet u rekening houden met de volgende aanbevelingen.

Offload-vraag

Offloading demand verwijst naar de praktijk van het distribueren of overdragen van de vraag naar resources naar andere resources of services. U kunt verschillende technologieën of strategieën gebruiken:

Caching: Gebruik caching om veelgebruikte gegevens of inhoud op te slaan, waardoor de belasting van uw back-endinfrastructuur wordt verminderd. Gebruik bijvoorbeeld CDN's (Content Delivery Networks) om statische inhoud in de cache op te cachen en te leveren, waardoor de back-end niet meer hoeft te worden geschaald. Niet elke workload kan echter gegevens in de cache opslaan. Workloads waarvoor actuele en realtime gegevens nodig zijn, zoals trading- of gamingworkloads, mogen geen cache gebruiken. De gegevens in de cache zijn oud en niet relevant voor de gebruiker.

Compromis. Caching kan problemen veroorzaken met betrekking tot ongeldige cache, consistentie en het beheren van de verlooptijd van de cache. Het is belangrijk dat u zorgvuldig cachestrategieën ontwerpt en implementeert om potentiële compromissen te voorkomen.
Offloading van inhoud: Inhoud offloaden naar externe services of platforms om de werkbelasting op uw infrastructuur te verminderen. In plaats van videobestanden op uw primaire server op te slaan, kunt u deze bestanden bijvoorbeeld hosten in een afzonderlijke opslagservice die onafhankelijk is van uw primaire server. U kunt deze grote bestanden rechtstreeks vanuit de opslagservice laden. Met deze methode worden resources op uw servers vrijgemaakt, zodat u een kleinere server kunt gebruiken. Het kan goedkoper zijn om grote bestanden op te slaan in een afzonderlijk gegevensarchief. U kunt een CDN gebruiken om de prestaties te verbeteren.
Taakverdeling: binnenkomende aanvragen verdelen over meerdere servers met behulp van taakverdeling. Taakverdeling verdeelt de werkbelasting gelijkmatig en voorkomt dat één server wordt overweldigd. Load balancers optimaliseren het resourcegebruik en verbeteren de efficiëntie van uw infrastructuur.
Database-offloading: verminder de belasting op de hoofdtoepassingsserver door databasebewerkingen te offloaden naar een afzonderlijke databaseserver of een gespecialiseerde service. Gebruik bijvoorbeeld een CDN voor het opslaan van statische inhoud en een Redis-cache voor dynamische inhoud (gegevens uit databasecache). Technieken zoals database-sharding, leesreplica's of het gebruik van beheerde databaseservices kunnen ook de belasting verminderen.

Afweging: het offloaden van specifieke taken naar alternatieve resources helpt om extra schaalaanpassing en kosten te voorkomen die zijn gekoppeld aan schalen. Het is echter belangrijk om rekening te houden met de operationele en onderhoudsuitdagingen die kunnen ontstaan door offloading. Het uitvoeren van een uitgebreide kosten-batenanalyse is van cruciaal belang bij het selecteren van de meest geschikte offloadingtechnieken voor uw workload. Deze analyse zorgt ervoor dat de gekozen methode zowel efficiënt als haalbaar is ten opzichte van de verwachte besparingen en operationele complexiteiten.

Vraag verminderen

Het verminderen van de vraag naar resources betekent het implementeren van strategieën waarmee het resourcegebruik in een workload wordt geminimaliseerd. Door de vraag te offloaden, wordt de vraag naar andere resources verplaatst. Het verminderen van de vraag vermindert de vraag op de workload. Door de vraag te verminderen, kunt u overprovisioning van resources voorkomen en betalen voor ongebruikte of onderbenutte capaciteit. U moet ontwerppatronen op codeniveau gebruiken om de vraag op workloadresources te verminderen. Volg deze stappen om de vraag te verminderen via ontwerppatronen:

Inzicht in ontwerppatronen: maak kennis met verschillende ontwerppatronen die resourceoptimalisatie bevorderen.
Werkbelastingvereisten analyseren: evalueer de specifieke vereisten van uw workload, inclusief de verwachte vraagpatronen, piekbelastingen en resourcebehoeften.
Selecteer de juiste ontwerppatronen: kies de ontwerppatronen die overeenkomen met de vereisten en doelstellingen van uw workload. Als uw workload bijvoorbeeld fluctuerende vraag ondervindt, kunnen gebeurtenisgestuurde schaal- en beperkingspatronen helpen bij het beheren van de workload door resources dynamisch toe te wijzen. Pas de geselecteerde ontwerppatronen toe op uw workloadarchitectuur. Mogelijk moet u workloadonderdelen scheiden, toepassingen in containers plaatsen, het opslaggebruik optimaliseren en meer.
Continu bewaken en optimaliseren: evalueer regelmatig de effectiviteit van de geïmplementeerde ontwerppatronen en pas deze indien nodig aan. Bewaak het resourcegebruik, de metrische prestatiegegevens en de mogelijkheden voor kostenoptimalisatie.

Door deze stappen te volgen en de juiste ontwerppatronen te gebruiken, kunt u de vraag naar resources verminderen, kosten optimaliseren en de efficiënte werking van hun workloads garanderen.

Gebruik deze ontwerppatronen om de vraag te verminderen:

Cache opzij: het patroon controleert de cache om te zien of de gegevens al in het geheugen zijn opgeslagen. Als de gegevens in de cache worden gevonden, kan de toepassing de gegevens snel ophalen en retourneren, waardoor er minder query's hoeven te worden uitgevoerd op het permanente gegevensarchief.
Claimcontrole: Door gegevens van de berichtenstroom te scheiden, vermindert dit patroon de grootte van berichten en biedt ondersteuning voor een rendabelere berichtenoplossing.
Concurrerende consumenten: dit patroon verwerkt items in een wachtrij efficiënt door gedistribueerde en gelijktijdige verwerking toe te passen. Dit ontwerppatroon optimaliseert de kosten door te schalen op basis van wachtrijdiepte en limieten in te stellen voor maximale gelijktijdige consumentenexemplaren.
Consolidatie van rekenresources: dit patroon verhoogt de dichtheid en consolideert rekenresources door meerdere toepassingen of onderdelen in een gedeelde infrastructuur te combineren. Het maximaliseert het resourcegebruik, vermijdt ongebruikte ingerichte capaciteit en verlaagt de kosten.
Implementatiestempels: Het gebruik van implementatiestempels biedt verschillende voordelen, zoals het geografisch distribueren van groepen apparaten, het implementeren van nieuwe functies op specifieke stempels en het observeren van kosten per apparaat. Implementatiestempels bieden betere schaalbaarheid, fouttolerantie en efficiënt resourcegebruik.
Gateway-offloading: dit patroon offload aanvraagverwerking in een gatewayapparaat, waarbij de kosten van resources per knooppunt worden omgeleid naar de implementatie van de gateway. Het gebruik van dit ontwerppatroon kan leiden tot lagere eigendomskosten in een gecentraliseerd verwerkingsmodel.
Uitgever/abonnee: dit patroon koppelt onderdelen in een architectuur los, waarbij directe communicatie wordt vervangen door een tussenliggende berichtbroker of gebeurtenisbus. Het maakt een gebeurtenisgestuurde benadering en facturering op basis van verbruik mogelijk, waardoor overprovisioning wordt vermeden.
Load leveling op basis van wachtrij: het patroon buffert binnenkomende aanvragen of taken in een wachtrij. Door de buffering wordt de workload soepeler gemaakt en is er minder behoefte aan overprovisioning van resources om piekbelasting te verwerken. Binnenkomende aanvragen worden asynchroon verwerkt om de kosten te verlagen.
Sharding: Dit patroon leidt specifieke aanvragen naar een logische bestemming, waardoor optimalisaties met gegevenscolocatie mogelijk zijn. Sharding kan leiden tot kostenbesparingen door gebruik te maken van meerdere exemplaren van reken- of opslagresources met een lagere specificatie.
Hosting van statische inhoud: Dit patroon levert efficiënt statische inhoud met behulp van een hostingplatform dat voor dit doel is ontworpen. Het vermijdt het gebruik van duurdere dynamische toepassingshosts, waardoor het resourcegebruik wordt geoptimaliseerd.
Beperking: Met dit patroon worden limieten voor de snelheid (snelheidsbeperking) of doorvoer van binnenkomende aanvragen naar een resource of onderdeel in de gaten. Het helpt kostenmodellering te informeren en kan rechtstreeks worden gekoppeld aan het bedrijfsmodel van de toepassing.
Valetsleutel: Dit patroon verleent veilige en exclusieve toegang tot een resource zonder dat er meer onderdelen nodig zijn, waardoor de noodzaak van intermediaire resources wordt verminderd en de efficiëntie wordt verbeterd.

Besturingselementvoorziening

Het definiëren van een bovengrens voor het bedrag dat u wilt uitgeven aan een bepaalde resource of service is een manier om de levering te beheren. Het is een belangrijke strategie voor het beheersen van de kosten en ervoor te zorgen dat uitgaven niet hoger zijn dan een bepaald niveau. Stel een budget vast en bewaak de uitgaven om ervoor te zorgen dat deze binnen het gedefinieerde bedrag blijft. U kunt platformen voor kostenbeheer, budgetwaarschuwingen gebruiken of gebruiks- en uitgavenpatronen bijhouden. Met sommige services kunt u de leverings- en limietsnelheden beperken en moet u deze functies gebruiken, indien nuttig.

Het beheren van het aanbod verwijst naar het definiëren van een bovengrens voor het bedrag dat u wilt uitgeven aan een bepaalde resource of service. Het is een belangrijke strategie omdat het helpt kosten te beheersen en ervoor zorgt dat uitgaven niet hoger zijn dan een bepaald niveau. Stel een budget vast en bewaak de uitgaven om ervoor te zorgen dat deze binnen de gedefinieerde drempelwaarde blijft. U kunt platformen voor kostenbeheer, budgetwaarschuwingen gebruiken of gebruiks- en uitgavenpatronen bijhouden. Met sommige services kunt u de leverings- en limietsnelheden beperken en moet u deze functies gebruiken, indien nuttig.

Compromis: Strengere limieten kunnen leiden tot gemiste kansen om te schalen wanneer de vraag toeneemt, wat mogelijk van invloed is op de gebruikerservaring. Dit kan leiden tot afsluitingen of kan niet reageren op de belasting. Het is belangrijk om een evenwicht te vinden tussen kostenoptimalisatie en ervoor te zorgen dat u voldoende resources hebt om te voldoen aan de behoeften van uw bedrijf.

Azure-facilitering

Uitschalen en omhoog schalen evalueren: Azure biedt een testomgeving waarin u verschillende schaalconfiguraties kunt implementeren en testen. Met behulp van de werkelijke workloadgegevens of proxygegevens kunt u praktijkscenario's simuleren en de effecten op de kosten meten. Azure biedt hulpprogramma's en services voor prestatietests, belastingstests en bewaking, waarmee u de kosteneffectiviteit van uitschalen en omhoog schalen kunt evalueren.

Azure biedt aanbevelingen voor kostenbeheer via verschillende hulpprogramma's en services, zoals Azure Advisor. Deze aanbevelingen analyseren uw gebruikspatronen, resourcegebruik en schaalconfiguraties om inzichten en suggesties te bieden voor het optimaliseren van kosten.

Azure Load Testing is een volledig beheerde service voor belastingstests waarmee grootschalige belasting wordt gegenereerd. De service simuleert verkeer voor uw toepassingen, ongeacht waar ze worden gehost. Ontwikkelaars, testers en QA-technici (Quality Assurance) kunnen belastingstests gebruiken om de prestaties, schaalbaarheid of capaciteit van toepassingen te optimaliseren.

Automatisch schalen optimaliseren: veel Azure-rekenservices ondersteunen het implementeren van meerdere identieke exemplaren en het snel afstemmen van de drempelwaarden en beleidsregels voor schalen. Azure biedt mogelijkheden voor automatisch schalen waarmee u automatisch het aantal exemplaren of resources kunt aanpassen op basis van de vraag naar workloads. U kunt schaalregels en drempelwaarden definiëren om uit- of inschaalacties te activeren. Met behulp van automatisch schalen kunt u resourcetoewijzing en kostenefficiëntie optimaliseren door resources dynamisch te schalen op basis van de werkelijke vraag.

Azure onderhoudt een lijst met abonnements- en servicelimieten. Er is een algemene limiet voor het aantal exemplaren van een resource dat u in elke resourcegroep kunt implementeren met enkele uitzonderingen. Zie Limieten voor resource-exemplaren per resourcegroep voor meer informatie.

Vraag en aanbod optimaliseren: Azure Monitor biedt inzicht in de prestaties en status van uw toepassingen en infrastructuur. U kunt Azure Monitor gebruiken om de belasting van uw resources te bewaken en trends in de loop van de tijd te analyseren. Met behulp van metrische gegevens en logboeken die door Azure Monitor worden verzameld, kunt u gebieden identificeren waar aanpassingen mogelijk nodig zijn. Deze informatie kan de verfijning van uw beleid voor automatisch schalen begeleiden om ervoor te zorgen dat het overeenkomt met de niet-functionele vereisten en doelstellingen voor kostenoptimalisatie.

Offloading-levering: Azure heeft een modern Cloud Content Delivery Network (CDN) genaamd Azure Front Door en cachingservices (Azure Cache voor Redis en Azure HPC Cache). Het CDN slaat inhoud dichter bij de eindgebruikers op, waardoor de netwerklatentie wordt verminderd en de reactietijden worden verbeterd. In de cache wordt een kopie van de gegevens voor het hoofdgegevensarchief opgeslagen, waardoor herhaalde aanvragen naar de back-end minder nodig zijn. Door CDN en cachingservices te gebruiken, kunt u de prestaties optimaliseren en de belasting op servers verminderen voor mogelijke kostenbesparingen.
Levering beheren: Met Azure kunt u ook resourcelimieten instellen voor uw cloudworkload. Door resourcelimieten te definiëren, kunt u ervoor zorgen dat uw workload binnen de toegewezen resources blijft en onnodige kosten voorkomt. Azure biedt verschillende mechanismen voor het instellen van resourcelimieten, zoals quota, beleid en budgetwaarschuwingen. Deze mechanismen helpen u bij het bewaken en beheren van resourcegebruik.

API Management kan aanvragen voor frequentielimieten en beperkingen afhandelen. Het beperken van binnenkomende aanvragen is een belangrijke rol van Azure API Management. Door de snelheid van aanvragen of het totale aantal overgedragen aanvragen/gegevens te beheren, kunnen API Management API-providers hun API's beschermen tegen misbruik en waarde creëren voor verschillende API-productlagen.

Controlelijst voor kostenoptimalisatie

Raadpleeg de volledige set aanbevelingen.

Controlelijst voor kostenoptimalisatie

Delen via

Aanbevelingen voor het optimaliseren van schaalkosten

Belangrijke ontwerpstrategieën

Uitschalen evalueren versus omhoog schalen

Automatisch schalen optimaliseren

Schalen op basis van gebeurtenissen gebruiken

Vraag en aanbod optimaliseren

Offload-vraag

Vraag verminderen

Besturingselementvoorziening

Azure-facilitering

Verwante koppelingen

Controlelijst voor kostenoptimalisatie

Feedback

Aanvullende resources