Strategie optimalizace nákladů pro clustery HDInsight

Dokončeno

Prvním krokem při optimalizaci nákladů služby HDInsight je výběr správného typu clusteru pro obsluhované úlohy. Volba nesprávného typu clusteru může vést k delší době zpracování s větším využitím výpočetních prostředků, než je potřeba. Výsledkem jsou náklady, které nemusí být vhodné pro prováděné aktivity a mohou být pro operaci nadměrné.

Dříve bylo výběr správné velikosti clusteru stejně důležitý, aby se zajistilo, že vaše úlohy se dají rychle obsluhovat ve špičce. Výběr velikosti clusteru byl ale opraven. Nelze ho změnit bez zastavení clusteru a jeho ruční opětovné zřízení s novou velikostí. Tyto kroky byly nevhodné a zpozdily by zpracování dat.

V nedávné době služba HDInsight zavedla funkci automatického škálování, která škáluje výpočetní prostředky clusteru tak, aby vyhovovala potřebám zpracování na vyžádání. Funkce automatického škálování umožňuje vertikálně navýšit kapacitu clusteru HDInsight během poptávky ve špičce a vertikálně snížit kapacitu, když jsou operace relativně tiché. Tato funkce zajišťuje, že můžete minimalizovat výdaje v souladu s poptávkou, kterou vaše instalace HDInsight obsluhuje.

Clustery, které se nepoužívají, byste měli odstranit. Cluster HDInsight můžete monitorovat pomocí Apache Ambari nebo Azure Monitoru a identifikovat clustery, které se nevyužívají.