Doporučení pro optimalizaci nákladů na škálování

Platí pro toto doporučení kontrolního seznamu optimalizace nákladů služby Azure Well-Architected Framework:

CO:12 Optimalizujte náklady na škálování. Vyhodnoťte alternativní škálování v rámci jednotek škálování. Zvažte alternativní konfigurace škálování a zarovnejte ho s modelem nákladů. Důležité informace by měly zahrnovat využití zděděných limitů každé instance, prostředku a jednotky škálování. Použijte strategie pro řízení poptávky a nabídky.

Tato příručka obsahuje doporučení pro optimalizaci nákladů na škálování. Optimalizace nákladů na škálování je proces odstranění nefektivnosti při škálování úloh. Cílem je snížit náklady na škálování a současně splnit všechny požadavky, které nejsou funkční. Pokud chcete získat stejný výsledek, utrácíte méně. Optimalizace škálování vám umožní vyhnout se zbytečným výdajům, nadměrnému zřizování a plýtvání. Pomáhá také předcházet neočekávaným špičkám v nákladech díky řízení poptávky a omezování nabídky. Neefektivní postupy škálování můžou vést ke zvýšení zatížení a provozních nákladů a negativně ovlivnit celkový finanční stav úlohy.

Definice

Období Definice
Automatické škálování Přístup škálování, který automaticky přidá nebo odebere prostředky při splnění sady podmínek.
Metriky nákladů Číselná data související s náklady na úlohy
Vertikální snížení kapacity Strategie vertikálního škálování, která se přesune na nižší skladovou položku, aby úlohám poskytovala méně prostředků.
Horizontální snížení kapacity Strategie horizontálního škálování, která odebírá instance, aby úlohy poskytovaly méně prostředků.
Horizontální navýšení kapacity Strategie horizontálního škálování, která přidává instance, aby úlohy poskytovaly více prostředků.
Jednotka škálování Skupina prostředků, které se úměrně škáluje.
Vertikální navýšení kapacity Strategie vertikálního škálování, která se přesune na vyšší skladovou položku, aby se úlohám poskytlo více prostředků.
Skladová jednotka (SKU) Úroveň služby Azure.
Údaje o využití Data o využití jsou buď přímé informace (skutečné), nebo nepřímé/reprezentativní informace (proxy) o tom, do jaké míry se úloha, služba nebo aplikace používá.

Klíčové strategie návrhu

Cílem optimalizace nákladů na škálování je vertikálně navýšit a snížit kapacitu v poslední zodpovědné chvíli a vertikálně snížit a snížit kapacitu, jakmile je to praktické. Pokud chcete optimalizovat škálování pro vaši úlohu, můžete vyhodnotit alternativní možnosti škálování v rámci jednotek škálování a přizpůsobit je nákladovém modelu. Jednotka škálování představuje konkrétní seskupení prostředků, které je možné škálovat nezávisle nebo společně. Jednotky škálování byste měli navrhnout tak, aby zvládly určité množství zatížení a mohly by se skládat z více instancí, serverů nebo jiných prostředků. Potřebujete vyhodnotit nákladovou efektivitu jednotek škálování úloh a alternativ modelu.

Pokud škálování nepoužíváte, projděte si doprovodné materiály ke škálování úlohy. Musíte zjistit, jestli se vaše aplikace může škálovat. Bezstavové aplikace se snadněji škálují, protože můžou zpracovávat více požadavků najednou. Také vyhodnoťte, jestli je aplikace vytvořená pomocí principů distribuovaných systémů. Distribuované systémy dokážou zvládnout zvýšenou zátěž rozdělením úlohy mezi několik uzlů. Jednoúčelová aplikace je však navržena tak, aby v daném okamžiku měla spuštěnou pouze jednu instanci. Škálování proto nemusí být vhodné pro všechny úlohy.

Vyhodnocení horizontálního navýšení kapacity a vertikálního navýšení kapacity

Vyhodnocení horizontálního navýšení kapacity a vertikálního navýšení kapacity zahrnuje určení nákladově nejefektivnějšího přístupu mezi zvýšením počtu prostředků v existujícím systému (vertikálním navýšením kapacity) nebo přidáním dalších instancí tohoto systému (horizontální navýšení kapacity) na základě různých faktorů, jako jsou ceny, požadavky na úlohy a přijatelné výpadky. Volba správného přístupu škálování může vést k významným úsporám, protože platíte jenom za to, co potřebujete, a přitom stále splňujete standardy výkonu a spolehlivosti.

Cílem je určit nákladově nejefektivnější volbu na základě cen úrovně služeb, vlastností úloh, přijatelných výpadků a modelu nákladů. U některých může být úspornější zvolit dražší instance v menším počtu. Naopak pro ostatní může být levnější úroveň s více instancemi lepší. Pokud chcete učinit informované rozhodnutí, musíte analyzovat skutečná nebo reprezentativní data z vašeho nastavení a vyhodnotit relativní náklady na každou strategii. Pokud chcete vyhodnotit nákladově nejefektivnější přístup, zvažte tato doporučení:

  • Shromažďování dat o využití: Shromážděte skutečná produkční data nebo proxy data, která představují vzory využití úloh a využití prostředků. Tato data by měla zahrnovat metriky, jako je využití procesoru, využití paměti, síťový provoz a všechny další relevantní metriky, které mají vliv na náklady na škálování.

  • Definování metrik nákladů: Určete metriky nákladů, které jsou relevantní pro vaši úlohu, například náklady za hodinu, náklady na transakci nebo náklady na jednotku využití prostředků. Tyto metriky vám pomůžou porovnat nákladovou efektivitu různých možností škálování.

  • Shromažďování dat o využití: Shromážděte skutečná produkční data nebo proxy data, která představují vzory využití úloh a využití prostředků. Tato data by měla zahrnovat metriky, jako je využití procesoru, využití paměti, síťový provoz a všechny další relevantní metriky, které ovlivňují náklady na škálování.

  • Definování metrik nákladů: Určete metriky nákladů, které jsou relevantní pro vaši úlohu, například náklady za hodinu, náklady na transakci nebo náklady na jednotku využití prostředků. Tyto metriky vám pomůžou porovnat nákladovou efektivitu různých možností škálování.

  • Projděte si požadavky: Při rozhodování mezi strategiemi škálování na více a více instancí zvažte požadavky úloh na spolehlivost, výkon a škálování. Horizontální navýšení kapacity může zvýšit spolehlivost prostřednictvím redundance. Vertikálním navýšením kapacity se zvýší kapacita prostředku, ale můžou existovat omezení, o kolik můžete vertikálně navýšit kapacitu.

  • Zvažte limity prostředků: Při vyhodnocování možností škálování je důležité vzít v úvahu základní omezení každé instance, prostředku a hranice jednotek škálování. Mějte na paměti horní limity škálování pro každý prostředek a odpovídajícím způsobem naplánujte. Kromě toho mějte na paměti limity vašeho předplatného a dalších prostředků.

  • Testovací škálování: Vytvářejte testy pro různé scénáře škálování, včetně možností horizontálního a vertikálního navýšení kapacity. Použití dat o využití simuluje chování úloh v různých konfiguracích škálování. Testování v reálném světě pomocí modelovaných scénářů škálování

  • Výpočet nákladů: Pomocí shromážděných dat a nákladových metrik můžete vypočítat náklady spojené s každou konfigurací škálování. Vezměte v úvahu faktory, jako jsou ceny instancí, využití prostředků a jakékoli další náklady související se škálováním.

Optimalizace automatického škálování

Optimalizace zásad automatického škálování zahrnuje upřesnění automatického škálování, aby reagovalo na změny zatížení na základě nefunkčních požadavků úlohy. Nadměrné aktivity škálování můžete omezit úpravou prahových hodnot a použitím správného období přestávky. Pokud chcete optimalizovat automatické škálování, zvažte následující doporučení:

  • Analýza aktuálních zásad automatického škálování: Seznamte se s existujícími zásadami a jejich chováním v reakci na různé úrovně zatížení.

  • Projděte si požadavky, které nejsou funkční: Určete konkrétní požadavky, které je potřeba vzít v úvahu, například dobu odezvy, využití prostředků nebo náklady.

  • Úprava prahových hodnot škálování: Upravte prahové hodnoty škálování na základě charakteristik úloh a nefunkčních požadavků. Nastavte prahové hodnoty pro vertikální navýšení nebo snížení kapacity na základě faktorů, jako je využití procesoru v průběhu času, síťový provoz nebo délka fronty.

  • Úprava období přestávky: Upravte dobu přestávky, abyste zabránili nadměrným aktivitám škálování aktivovaným dočasnými špičkami zatížení. Období přestávky přináší prodlevu mezi událostmi škálování, což umožňuje stabilizovat systém před dalšími akcemi škálování.

  • Monitorování a vyladění: Nepřetržitě monitorujte chování a výkon systému. Analyzujte aktivity škálování a upravte zásady podle potřeby, abyste optimalizovali náklady a splnili požadované požadavky, které nejsou funkční.

Kompromis: Snížení počtu událostí škálování zvyšuje pravděpodobnost, že dojde k problémům souvisejícím se škálováním. Znamená to, že odstraňujete dodatečný polštář nebo vyrovnávací paměť, které by mohly pomoct se správou potenciálních problémů nebo zpoždění při škálování.

Zvážení škálování na základě událostí

Automatické škálování založené na událostech umožňuje aplikaci dynamicky upravovat prostředky na základě konkrétních událostí nebo triggerů místo tradičních metrik, jako je využití procesoru nebo paměti. Například automatické škálování řízené událostmi (KEDA) Kubernetes může škálovat aplikace na základě škálovacích prostředků, jako je délka tématu Kafka. Přesnost pomáhá zabránit zbytečným výkyvům škálování a plýtvání prostředky. Vysoká úroveň přesnosti v konečném důsledku optimalizuje náklady. Pokud chcete použít škálování na základě událostí, postupujte takto:

  • Zvolte zdroj události: Určete zdroj událostí, který aktivuje škálování vaší jednotky škálování. Zdrojem může být fronta zpráv, platforma streamování nebo jakýkoli jiný systém řízený událostmi.

  • Nastavení příjmu událostí: Nakonfigurujte aplikaci tak, aby využívala události ze zvoleného zdroje událostí. Obvykle se jedná o navázání připojení, přihlášení k odběru relevantních témat nebo front a zpracování příchozích událostí.

  • Implementace logiky škálování: Napište logiku, která určuje, kdy a jak se má jednotka škálování škálovat na základě příchozích událostí. Tato logika by měla brát v úvahu faktory, jako je počet událostí, rychlost příchozích událostí nebo jakékoli jiné relevantní metriky.

  • Integrace s mechanismy škálování: V závislosti na prostředí runtime vaší aplikace můžete použít různé mechanismy škálování k úpravě prostředků přidělených aplikaci.

  • Konfigurace pravidel škálování: Definujte pravidla škálování, která určují, jak se má jednotka škálování škálovat v reakci na události. Tato pravidla můžou být založená na prahových hodnotách, vzorech nebo jakýchkoli jiných kritériích, která odpovídají požadavkům vaší aplikace. Prahové hodnoty škálování by se měly vztahovat k obchodním metrikám. Pokud například přidáte další dvě instance, můžete při zpracování nákupního košíku podporovat dalších 50 uživatelů.

  • Testování a monitorování: Ověřte chování implementace škálování na základě událostí tím, že ji otestujete pomocí různých scénářů událostí. Monitorujte akce škálování a ujistěte se, že akce odpovídají vašim očekáváním.

Kompromis Konfigurace a vyladění automatického škálování na základě událostí může být složité a nesprávná konfigurace může vést k nadměrnému nebo podřizovacímu počtu prostředků.

Optimalizace poptávky a nabídky

Ovládejte poptávku proti vaší nabídce. U úloh, u kterých škálování určuje využití, korelují náklady se škálováním. Pokud chcete optimalizovat náklady na škálování, můžete náklady na škálování minimalizovat. Můžete snížit zatížení tím, že ji distribuujete do jiných prostředků, nebo ji můžete snížit implementací prioritních front, snižováním zátěže brány, ukládáním do vyrovnávací paměti a omezováním rychlosti. Obě strategie můžou zabránit nežádoucím nákladům kvůli škálování a spotřebě prostředků. Můžete také řídit dodávky omezením limitů škálování. Pokud chcete optimalizovat poptávku po úlohách a jejich nabídku, zvažte následující doporučení.

Přesměrování zatížení poptávky

Snižování zatížení odkazuje na praxi distribuce nebo převodu poptávky po prostředcích na jiné prostředky nebo služby. Můžete použít různé technologie nebo strategie:

  • Ukládání do mezipaměti: Ukládání často přístupných dat nebo obsahu do mezipaměti, což snižuje zatížení back-endové infrastruktury. Můžete například použít sítě pro doručování obsahu (CDN) k ukládání do mezipaměti a obsluhování statického obsahu, což snižuje potřebu škálování back-endu. Ne každá úloha ale může ukládat data do mezipaměti. Úlohy, které vyžadují aktuální data a data v reálném čase, jako jsou obchodní nebo herní úlohy, by neměly používat mezipaměť. Data uložená v mezipaměti by byla pro uživatele stará a irelevantní.

    Kompromis. Ukládání do mezipaměti může představovat problémy z hlediska zneplatnění mezipaměti, konzistence a správy vypršení platnosti mezipaměti. Je důležité pečlivě navrhnout a implementovat strategie ukládání do mezipaměti, abyste se vyhnuli potenciálním kompromisům.

  • Přesměrování zpracování obsahu: Přesměrováním zátěže obsahu na externí služby nebo platformy snížíte zatížení vaší infrastruktury. Například místo ukládání videosouborů na primární server můžete tyto soubory hostovat v samostatné službě úložiště, která je nezávislá na primárním serveru. Tyto velké soubory můžete načíst přímo ze služby úložiště. Tento přístup uvolní prostředky na vašich serverech a umožní vám použít menší server. Ukládání velkých souborů v samostatném úložišti dat může být levnější. CdN můžete použít ke zvýšení výkonu.

  • Vyrovnávání zatížení: Distribuce příchozích požadavků mezi více serverů pomocí vyrovnávání zatížení. Vyrovnávání zatížení rovnoměrně distribuuje úlohu a zabraňuje zahlcení jednoho serveru. Nástroje pro vyrovnávání zatížení optimalizují využití prostředků a zlepšují efektivitu infrastruktury.

  • Snižování zátěže databáze: Snižte zatížení hlavního aplikačního serveru přesměrováním databázových operací na samostatný databázový server nebo specializovanou službu. Můžete například použít CDN pro ukládání statického obsahu do mezipaměti a mezipaměť Redis pro ukládání dynamického obsahu (data z databáze). Zatížení můžou snížit také techniky, jako je horizontální dělení databáze, repliky pro čtení nebo používání spravovaných databázových služeb.

    Kompromis: Snižování zátěže konkrétních úloh na alternativní prostředky pomáhá snížit nebo zabránit dodatečnému škálování a nákladům spojeným se škálováním. Je však důležité vzít v úvahu provozní problémy a problémy s údržbou, které mohou vyvstat při snižování zátěže. Provedení komplexní analýzy nákladů a výhod je zásadní při výběru nejvhodnějších technik snižování zátěže pro vaši úlohu. Tato analýza zajišťuje, aby zvolená metoda byla efektivní a proveditelná ve vztahu k očekávaným úsporám a provozním složitostem.

Snížení poptávky

Snížení poptávky po prostředcích znamená implementaci strategií, které pomáhají minimalizovat využití prostředků v úlohách. Přesměrováním poptávky se poptávka přesune na jiné prostředky. Snížení poptávky snižuje poptávku po úloze. Snížení poptávky vám umožní vyhnout se nadměrnému zřizování prostředků a platit za nevyužitou nebo nedostatečně využitou kapacitu. Ke snížení poptávky po prostředcích úloh byste měli použít vzory návrhu na úrovni kódu. Pokud chcete snížit poptávku prostřednictvím vzorů návrhu, postupujte takto:

  • Seznamte se se vzory návrhu: Seznamte se s různými vzory návrhu, které podporují optimalizaci prostředků.

  • Analýza požadavků úloh: Vyhodnoťte konkrétní požadavky vaší úlohy, včetně očekávaných vzorců poptávky, zatížení ve špičce a potřeb prostředků.

  • Výběr vhodných vzorů návrhu: Zvolte vzory návrhu, které odpovídají požadavkům a cílům úloh. Pokud například u vašich úloh dochází k kolísání poptávky, můžou vám při správě úloh pomocí dynamického přidělování prostředků pomoct vzorce škálování a omezování řízené událostmi. Použijte vybrané vzory návrhu na architekturu úloh. Možná budete muset oddělit komponenty úloh, kontejnerizovat aplikace, optimalizovat využití úložiště a provádět další akce.

  • Nepřetržité monitorování a optimalizace: Pravidelně vyhodnocujte efektivitu implementovaných vzorů návrhu a upravujte je podle potřeby. Monitorujte využití prostředků, metriky výkonu a příležitosti k optimalizaci nákladů.

Pomocí těchto kroků a vhodných vzorů návrhu můžete snížit poptávku po prostředcích, optimalizovat náklady a zajistit efektivní provoz úloh.

Pomocí těchto vzorů návrhu můžete snížit poptávku:

  • Ukládání do mezipaměti bokem: Model zkontroluje mezipaměť a zjistí, jestli jsou data už uložená v paměti. Pokud se data nacházejí v mezipaměti, aplikace je může rychle načíst a vrátit, čímž se sníží nutnost dotazovat se na trvalé úložiště dat.

  • Kontrola deklarace identity: Oddělením dat od toku zasílání zpráv tento model zmenšuje velikost zpráv a podporuje cenově výhodnější řešení zasílání zpráv.

  • Konkurující si příjemci: Tento model efektivně zpracovává položky ve frontě použitím distribuovaného a souběžného zpracování. Tento vzor návrhu optimalizuje náklady škálováním na základě hloubky fronty a nastavením limitů maximálního počtu souběžných instancí příjemců.

  • Konsolidace výpočetních prostředků: Tento model zvyšuje hustotu a konsoliduje výpočetní prostředky kombinováním více aplikací nebo komponent ve sdílené infrastruktuře. Maximalizuje využití prostředků, vyhýbá se nevyužité zřízené kapacitě a snižuje náklady.

  • Razítka nasazení: Použití razítek nasazení přináší několik výhod, jako je geografická distribuce skupin zařízení, nasazování nových funkcí do konkrétních kolků a sledování nákladů na zařízení. Razítka nasazení umožňují lepší škálovatelnost, odolnost proti chybám a efektivní využití prostředků.

  • Snižování zátěže bránou: Tento model přesměrovává zpracování požadavků v zařízení brány a přesměrovává náklady z prostředků jednotlivých uzlů na implementaci brány. Použití tohoto vzoru návrhu může vést k nižším nákladům na vlastnictví v modelu centralizovaného zpracování.

  • Vydavatel/odběratel: Tento model odděluje komponenty v architektuře a nahrazuje přímou komunikaci zprostředkujícím zprostředkovatele zpráv nebo sběrnici událostí. Umožňuje přístup založený na událostech a fakturaci na základě spotřeby, aby nedocházelo k nadměrnému zřizování.

  • Vyrovnávání zatížení na základě fronty: Tento vzor zatěžuje příchozí požadavky nebo úkoly ve frontě do vyrovnávací paměti. Ukládání do vyrovnávací paměti vyrovnává zatížení a snižuje potřebu nadměrného zřizování prostředků pro zvládnutí zatížení ve špičce. Příchozí požadavky se zpracovávají asynchronně, aby se snížily náklady.

  • Shardování: Tento model směruje konkrétní požadavky do logického cíle a umožňuje optimalizaci s využitím kolokace dat. Shardování může vést k úspoře nákladů díky použití více instancí výpočetních prostředků nebo prostředků úložiště s nižšími specifikacemi.

  • Hostování statického obsahu: Tento model efektivně poskytuje statický obsah pomocí hostitelské platformy navržené pro tento účel. Vyhnete se tak použití dražších dynamických hostitelů aplikací a optimalizujete využití prostředků.

  • Omezování: Tento model omezuje rychlost (omezování rychlosti) nebo propustnost příchozích požadavků na prostředek nebo komponentu. Pomáhá informovat o modelování nákladů a může být přímo svázán s obchodním modelem aplikace.

  • Osobní klíč: Tento model uděluje zabezpečený a exkluzivní přístup k prostředku bez nutnosti dalších komponent, což snižuje potřebu zprostředkujících prostředků a zvyšuje efektivitu.

Ovládací prvek

Definování horního limitu částky, kterou jste ochotni utratit za konkrétní prostředek nebo službu, je jedním ze způsobů, jak řídit dodávky. Je to důležitá strategie pro kontrolu nákladů a zajištění toho, aby výdaje nepřekročily určitou úroveň. Vytvořte rozpočet a sledujte výdaje, abyste zajistili, že zůstanou v definované výši. Můžete použít platformy pro správu nákladů, upozornění na rozpočet nebo sledování vzorců využití a výdajů. Některé služby umožňují omezit dodávky a omezit sazby a měli byste tyto funkce používat tam, kde je to užitečné.

Řízení nabídky označuje definování horního limitu částky, kterou jste ochotni utratit za konkrétní prostředek nebo službu. Je to důležitá strategie, protože pomáhá řídit náklady a zajišťuje, aby výdaje nepřekročily určitou úroveň. Vytvořte rozpočet a monitorujte výdaje, abyste zajistili, že zůstanou pod definovanou prahovou hodnotou. Můžete použít platformy pro správu nákladů, upozornění na rozpočet nebo sledování vzorců využití a výdajů. Některé služby umožňují omezit dodávky a omezit sazby a měli byste tyto funkce používat tam, kde je to užitečné.

Kompromis: Přísnější limity můžou mít za následek promarnění příležitostí ke škálování při zvýšení poptávky, což může mít vliv na uživatelské prostředí. Může to způsobit vypnutí nebo nemožnost reagovat na zatížení. Je důležité najít rovnováhu mezi optimalizací nákladů a zajištěním, abyste měli dostatek prostředků pro splnění obchodních potřeb.

Usnadnění Azure

Vyhodnocení horizontálního navýšení kapacity a vertikálního navýšení kapacity: Azure poskytuje testovací prostředí, ve kterém můžete nasazovat a testovat různé konfigurace škálování. Pomocí skutečných dat úloh nebo proxy dat můžete simulovat reálné scénáře a měřit vliv na náklady. Azure nabízí nástroje a služby pro testování výkonnosti, zátěžové testování a monitorování, které vám pomůžou vyhodnotit nákladovou efektivitu horizontálního navýšení kapacity oproti možnostem vertikálního navýšení kapacity.

Azure poskytuje doporučení pro správu nákladů prostřednictvím různých nástrojů a služeb, jako je Azure Advisor. Tato doporučení analyzují vzorce využití, využití prostředků a konfigurace škálování a poskytují přehledy a návrhy pro optimalizaci nákladů.

Azure Load Testing je plně spravovaná služba zátěžového testování, která generuje zátěž ve velkém měřítku. Služba simuluje provoz vašich aplikací bez ohledu na to, kde jsou hostované. Vývojáři, testeři a technici zajišťující kontrolu kvality můžou pomocí zátěžového testování optimalizovat výkon, škálovatelnost nebo kapacitu aplikací.

Optimalizace automatického škálování: Řada výpočetních služeb Azure podporuje nasazení více identických instancí a rychlé ladění prahových hodnot a zásad škálování. Azure poskytuje funkce automatického škálování, které umožňují automaticky upravit počet instancí nebo prostředků na základě požadavků úloh. Můžete definovat pravidla škálování a prahové hodnoty pro aktivaci akcí horizontálního navýšení nebo snížení kapacity. Pomocí automatického škálování můžete optimalizovat přidělování prostředků a nákladovou efektivitu dynamickým škálováním prostředků na základě skutečné poptávky.

Azure udržuje seznam omezení předplatného a služeb. Počet instancí prostředku, který můžete nasadit v každé skupině prostředků, je obecně omezený s některými výjimkami. Další informace najdete v tématu Limity instancí prostředků na skupinu prostředků.

Optimalizace poptávky a nabídky: Azure Monitor poskytuje přehled o výkonu a stavu vašich aplikací a infrastruktury. Azure Monitor můžete použít k monitorování zatížení prostředků a analýze trendů v průběhu času. Pomocí metrik a protokolů shromažďovaných službou Azure Monitor můžete identifikovat oblasti, ve kterých může být potřeba upravit škálování. Tyto informace můžou vést ke zpřesnění zásad automatického škálování, aby byly v souladu s nefunkčními požadavky a cíli optimalizace nákladů.

  • Přesměrování zátěže: Azure má moderní cloudovou službu Content Delivery Network (CDN), která se nazývá Azure Front Door a služby ukládání do mezipaměti (Azure Cache for Redis a Azure HPC Cache). Síť CDN ukládá obsah do mezipaměti blíže koncovým uživatelům, což snižuje latenci sítě a zkracuje dobu odezvy. Ukládání do mezipaměti ukládá kopii dat před hlavním úložištěm dat, což snižuje potřebu opakovaných požadavků na back-end. Pomocí CDN a služeb ukládání do mezipaměti můžete optimalizovat výkon a snížit zatížení serverů, abyste mohli ušetřit náklady.

  • Řízení nabídky: Azure také umožňuje nastavit limity prostředků pro cloudové úlohy. Definováním limitů prostředků můžete zajistit, aby vaše úlohy zůstaly v rámci přidělených prostředků a vyhnuly se zbytečným nákladům. Azure poskytuje různé mechanismy pro nastavení limitů prostředků, jako jsou kvóty, zásady a upozornění na rozpočet. Tyto mechanismy pomáhají monitorovat a řídit využití prostředků.

    API Management může omezit a omezit požadavky. Schopnost omezovat příchozí požadavky je klíčovou rolí Azure API Management. Díky řízení rychlosti požadavků nebo celkového počtu požadavků nebo přenášených dat API Management umožňuje poskytovatelům rozhraní API chránit svá rozhraní API před zneužitím a vytvářet hodnotu pro různé produktové úrovně rozhraní API.

Kontrolní seznam pro optimalizaci nákladů

Projděte si kompletní sadu doporučení.