Identifiera lämpliga scenarier för autoskalning

Slutförd

Autoskalning kan utlösas enligt ett schema eller genom att dynamiskt utvärdera om systemet har ont om resurser. Till exempel kan autoskalning aktiveras om processor- eller minnesanvändningen ökar, om antalet inkommande begäranden till en tjänst verkar stegras eller en kombination av olika faktorer.

I bokningssystem för hotell är autoskalning användbart för hantering av kortvariga toppar i antalet bokningsbegäranden. Du kan också använda schemalagd autoskalning för att tillhandahålla fler resurser vid förutsägbara tider med hög belastning.

Vad är autoskalning?

Autoskalning är ett molnsystem eller en process som justerar tillgängliga resurser baserat på den aktuella efterfrågan. Autoskalning skalar in och upp till skillnad från att skala upp och ned.

Automatisk skalning i Azure App Service

Automatisk skalning i Azure App Service övervakar resursmåtten för en webbapp när webbappen körs. App Service identifierar när fler resurser krävs för att hantera en ökande arbetsbelastning och ser till att dessa resurser är tillgängliga innan systemet överbelastas.

Autoskalning svarar på ändringar i miljön genom att lägga till eller ta bort webbservrar och balansera belastningen mellan dem. Autoskalning påverkar inte processorkraften, minnet eller lagringskapaciteten för webbservrar som driver webbappen, utan ändrar bara antalet webbservrar.

Regler för autoskalning

Autoskalning fattar beslut baserat på de regler som du definierar. En regel anger tröskelvärdet för ett mått och utlöser en autoskalningshändelse när tröskelvärdet överskrids. Automatisk skalning kan också avallokera resurser när arbetsbelastningen minskar.

Definiera reglerna för autoskalning noggrant. Till exempel kommer en DoS-attack (Denial-of-Service) sannolikt att resultera i en storskalig tillströmning av inkommande trafik. Det vore både lönlöst och dyrt att försöka hantera en ökning av begäranden som kommer från en DoS-attack. Dessa begäranden är inte äkta och bör tas bort i stället för att bearbetas. En bättre lösning är att implementera identifiering och filtrering av begäranden som uppstår under sådana angrepp innan de når tjänsten.

När bör du överväga att använda autoskalning?

Autoskalning ger elasticitet för dina webbtjänster. Det är en lämplig lösning när du är värd för program som du inte enkelt kan förutsäga arbetsbelastningen för, eller för vilka arbetsbelastningen sannolikt kommer att variera avsevärt beroende på datum eller tid på dagen. Du kan till exempel förvänta dig ökad eller minskad aktivitet för en företagsapp under helgdagar.

Autoskalning förbättrar tillgängligheten och feltoleransen. Det kan hjälpa till att säkerställa att klientbegäranden till en webbtjänst inte nekas, antingen på grund av att en instans inte kan bekräfta begäranden i tid eller på grund av att en överbelastad instans kraschar.

Autoskalning fungerar på så sätt att det lägger till eller tar bort webbservrar. Om dina webbappar utför resursintensiv bearbetning som en del av varje begäran kan automatisk skalning vara en ineffektiv metod. I dessa situationer kan det vara nödvändigt att skala upp manuellt. Exempel: Om en begäran som skickas till en webbapp inbegriper komplex bearbetning i en stor datamängd kan den här enskilda begäran, beroende på instansens storlek, sluka all bearbetnings- och minneskapacitet i instansen.

Autoskalning är inte den bästa metoden för att hantera långsiktig tillväxt. Du kan ha en webbapp som börjar med några användare men som blir mer populär över tid. Autoskalning medför extra kostnader vad gäller övervakning av resurser och avgörande huruvida en skalningshändelse ska utlösas. Om du i det här scenariot kan förutse tillväxttakten kan det vara mer kostnadseffektivt att skala systemet över tid manuellt.

Antalet instanser av en webbtjänst är också en faktor när du överväger automatisk skalning. Kanske förväntar du dig att oftast köra endast några få instanser av en tjänst. I så fall kommer tjänsten dock alltid att vara sårbar för avbrottstid eller brist på tillgänglighet oavsett huruvida autoskalning är aktiverat. Ju färre instanser från början, desto mindre kapacitet måste du hantera en ökande arbetsbelastning medan autoskalning snurrar upp fler instanser.