Sdílet prostřednictvím


Výběr skladové položky pro cluster Azure Data Explorer

Když vytvoříte nový cluster nebo optimalizujete cluster pro měnící se úlohu, Azure Data Explorer nabízí více skladových položek virtuálních počítačů, ze které si můžete vybrat. Tyto skladové položky výpočetních prostředků byly pečlivě vybrány tak, aby poskytovaly optimální náklady na každou úlohu.

Velikost a skladovou položku virtuálního počítače clusteru pro správu dat plně spravuje služba Azure Data Explorer. Určují je faktory, jako je velikost virtuálního počítače modulu a úloha příjmu dat.

Skladovou položku výpočetních prostředků pro cluster můžete kdykoli změnit vertikálním navýšením kapacity clusteru. Nejlepší je začít s nejmenší velikostí skladové položky, která odpovídá počátečnímu scénáři. K optimalizaci skladové položky výpočetních prostředků můžete také použít doporučení Azure Advisoru .

Cenovou kalkulačku můžete použít k odhadu cen clusteru Azure Data Explorer na základě úloh a objemu dat.

Tip

Zakoupením rezervace můžete předplatit náklady na cluster, virtuální počítače používané v clusteru a prostředky úložiště po dobu jednoho nebo tří let. Tyto rezervované instance (RI) se kupují samostatně a můžou ušetřit značné množství peněz za zajištění nejlepších sazeb pro váš cluster Azure Data Explorer. Další informace najdete v tématu Předplacení jednotek přirážky za Azure Data Explorer s využitím rezervované kapacity Azure Data Explorer.

Vyberte typ clusteru.

Azure Data Explorer nabízí dva typy clusterů:

  • Produkční (se smlouvou SLA): Produkční clustery obsahují aspoň dva uzly pro cluster modulu a aspoň dva uzly pro cluster pro správu dat. Tyto clustery fungují v rámci smlouvy SLA pro Azure Data Explorer.
  • Vývoj/testování (bez smlouvy SLA): Clustery pro vývoj/testování obsahují jeden uzel pro cluster modulu a jeden uzel pro cluster pro správu dat. Tyto clustery představují konfiguraci s nejnižšími náklady, protože mají nízký počet instancí. Pro tuto konfiguraci clusteru neexistuje žádná redundance ani smlouva SLA.

Vývoj vs. produkční prostředí

Vývojové clustery jsou skvělé pro vyhodnocení služeb, nastavení kanálu příjmu dat, testování konceptu (PoC) nebo ověření scénáře. Mezi hlavní rozdíly mezi vývojovými clustery a produkčními clustery patří:

  • Velikost vývojových clusterů je omezená a nemůžou se zvětšit nad rámec jednoho uzlu.
  • Azure Data Explorer markup se neúčtuje za vývojové clustery
  • Žádná smlouva SLA pro vývojové clustery

Typy skladových položek výpočetních prostředků

Clustery Azure Data Explorer podporují různé skladové položky pro různé typy úloh. Každá skladová položka nabízí odlišný poměr úložiště SSD a procesoru, který vám pomůže správně upravit velikost nasazení a vytvořit nákladově optimální řešení pro podnikové analytické úlohy.

Optimalizované pro výpočty

  • Poskytuje vysoký poměr jader k mezipaměti a nejnižší náklady na jádro.
  • Místní disk SSD pro vstupně-výstupní operace s nízkou latencí

Optimalizované pro úložiště

  • Poskytuje větší úložiště od 1 terabajt (TB) do 4 TB na uzel motoru a nejnižší náklady na gigabajt (GB).
  • Vhodné pro úlohy, které vyžadují úložiště pro velké objemy dat.
  • Některé skladové položky používají úložiště Premium Storage (PS) připojené k uzlu modulu místo místních disků SSD. Přístup k napájecímu serveru je pomalejší než místní disky SSD, takže skladové položky s napájecím serverem jsou dražší a výkonnější než jednotky SKU s připojeným místním diskem SSD.

Výběr a optimalizace skladové položky výpočetních prostředků

Výběr skladové položky výpočetních prostředků během vytváření clusteru

Při vytváření clusteru Azure Data Explorer vyberte optimální skladovou položku virtuálního počítače pro plánovanou úlohu. Následující atributy vám pomůžou zvolit správnou skladovou položku pro vaše prostředí:

Atribut Podrobnosti
Náklady na GB Vysoké náklady s optimalizovanými výpočetními prostředky Nízké náklady jsou u skladových položek optimalizovaných pro úložiště.
Náklady na jádro Nízké náklady s optimalizovanými výpočetními prostředky. Vysoké náklady se skladovými jednotkami optimalizovanými pro úložiště
Ceny rezervovaných instancí Sleva za rezervované instance se liší podle oblasti a skladové položky.

Poznámka

Náklady na výpočetní prostředky jsou nejvýznamnější součástí nákladů na cluster.

Optimalizace výpočetní jednotky SKU clusteru

Pokud chcete optimalizovat skladovou položku výpočetních prostředků clusteru, nakonfigurujte vertikální škálování a projděte si doporučení Azure Advisoru.

S různými možnostmi výpočetních skladových položek, ze které si můžete vybrat, můžete optimalizovat náklady na výkon a požadavky na horkou mezipaměť pro váš scénář. Zvolte skladovou položku optimalizovanou pro výpočty, která zajistí optimální výkon při velkých objemech dotazů. Při dotazování velkých objemů dat, která je potřeba uložit do mezipaměti, zvolte skladovou položku optimalizovanou pro úložiště s nejlepším výkonem.

Je vhodnější použít několik uzlů větších virtuálních počítačů, které využívají více paměti RAM, než mnoho menších virtuálních počítačů. Více paměti RAM je potřeba pro některé typy dotazů, které vyžadují vyšší nároky na paměť RAM, jako jsou dotazy využívající propojení tabulek. Proto při škálování clusteru doporučujeme vertikálně navýšit kapacitu na větší skladovou položku a podle potřeby vertikálně navýšit kapacitu přidáním dalších uzlů.

Poznámka

Změna nebo vertikální navýšení kapacity SKU clusteru může způsobit jedno až tříminutové přerušení služby. Při migraci skladové položky může dojít k ovlivnění výkonu dotazů a rozsah dopadu se může lišit v závislosti na vzorcích použití.

Dostupnost skladové položky

Dostupnost skladové položky se liší v závislosti na následujících faktorech:

  • Oblast: Ne všechny skladové položky jsou dostupné ve všech oblastech nebo zónách dostupnosti. Další informace najdete na stránce konkrétní skladové položky v části věnované dostupnosti v jednotlivých oblastech.
  • Předplatné: Některé skladové položky můžou být dostupné jenom pro konkrétní typy předplatného. Pokud skladová položka není pro vaše předplatné dostupná v umístění nebo zóně, která vyhovuje potřebám vaší firmy, odešlete žádost o skladovou položku podpora Azure.

Možnosti skladové položky

Pro virtuální počítače clusteru Azure Data Explorer jsou k dispozici následující řady skladových položek. Skupiny skladových položek v kategoriích optimalizovaných pro výpočetní prostředky a úložiště jsou seřazené podle doporučení.

Optimalizováno pro úložiště

Řada skladových položek Dostupná konfigurace virtuálních procesorů Typ skladové položky Podporuje premium storage
Lasv3 8, 16 , 32 AMD No
Lsv3 8, 16 , 32 Intel No
Easv4, Easv5, ECasv5 8, 16 AMD Yes
Esv4, Esv5 8, 16 Intel Yes
DSv2 8, 16 Intel Yes

Optimalizované pro výpočty

Řada skladových položek Dostupná konfigurace virtuálních procesorů Typ skladové položky Podporuje premium storage
Eadsv5, ECadsv5 2, 4, 8, 16 AMD No
Edv4, Edv5 2, 4, 8, 16 Intel No
Eav4 2, 4, 8, 16 AMD No
Dv2 2, 4, 8, 16 Intel No

Poznámka

Všechny skladové položky optimalizované pro výpočty se 2 jádry je možné nakonfigurovat jako vývojové clustery.

Doporučuje se používat L32asv3 nebo L32sv3 pouze v případech použití s velmi velkými clustery L16asv3/L16sv3, které dosahují limitu 1000 uzlů clusteru, nebo clustery s extrémně vysokou frekvencí souběžných požadavků. ECasv5 a ECadsv5 jsou důvěrné výpočetní skladové položky. Další podrobnosti najdete v tématu Důvěrné výpočetní virtuální počítače. V případě skladových položek ECasv5 optimalizovaných pro úložiště v případě, že používáte vlastní klíč spravovaný zákazníkem (CMK), provádí se šifrování CMK na účtech úložiště i na discích služby Premium Storage.

  • S Azure Data Explorer izolací výpočetních prostředků a úložiště můžete začít s nejoptimálnější cenovou skladovou položkou a po uplynutí vzoru využití nebo ztráty dat přejít na jinou skladovou položku.
  • Aktualizovaný seznam skladových položek výpočetních prostředků pro jednotlivé oblasti můžete zobrazit pomocí rozhraní ListSkus API azure Data Explorer.

Velikost mezipaměti

Azure Data Explorer si vyhrazuje část velikosti disku uvedenou v jednotlivých specifikacích SKU výpočetních prostředků Azure, která se má použít pro operace clusteru. Přesná velikost mezipaměti pro jednotlivé skladové položky je k dispozici v části výběr skladové položky na portálu.