Plánování svazků v clusterech Azure Stack HCI a Windows Server

Platí pro: Azure Stack HCI, verze 21H2 a 20H2; Windows Server 2022, Windows Server 2019

Tento článek obsahuje pokyny k plánování svazků clusteru tak, aby splňovaly požadavky na výkon a kapacitu vašich úloh, včetně výběru systému souborů, typu odolnosti a velikosti.

Poznámka

Prostory úložiště s přímým přístupem nepodporuje souborový server pro obecné použití. Pokud potřebujete spustit souborový server nebo jiné obecné služby ve službě Storage Space Direct, nakonfigurujte ho na virtuálních počítačích.

Kontrola: Co jsou svazky

Svazky jsou místem, kde umístíte soubory, které vaše úlohy potřebují, například soubory VHD nebo VHDX pro virtuální počítače Hyper-V. Svazky kombinují jednotky ve fondu úložiště, aby se zavedly výhody odolnosti proti chybám, škálovatelnosti a výkonu Prostory úložiště s přímým přístupem, softwarově definované technologie úložiště za Azure Stack HCI a Windows Serverem.

Poznámka

Termín "svazek" používáme ke společnému odkazování na svazek a virtuální disk pod ním, včetně funkcí poskytovaných jinými integrovanými funkcemi Windows, jako jsou sdílené svazky clusteru (CSV) a ReFS. Pochopení těchto rozdílů na úrovni implementace není nezbytné k plánování a nasazení Prostory úložiště s přímým přístupem úspěšně.

Diagram znázorňuje tři složky označené jako svazky, které jsou přidružené k virtuálnímu disku označenému jako svazky, všechny přidružené ke společnému fondu úložišť disků.

Všechny svazky jsou přístupné všemi servery v clusteru současně. Po vytvoření se zobrazí na všech serverech C :\ClusterStorage\ .

Snímek obrazovky zobrazuje okno Průzkumníka souborů s názvem ClusterStorage obsahující svazky s názvem Volume1, Volume2 a Volume3.

Volba počtu svazků, které se mají vytvořit

Doporučujeme nastavit počet svazků na násobek počtu serverů ve vašem clusteru. Pokud máte například 4 servery, budete mít konzistentnější výkon se 4 celkovými svazky než se 3 nebo 5. To umožňuje clusteru rovnoměrně distribuovat vlastnictví svazku (jeden server zpracovává orchestraci metadat pro každý svazek) rovnoměrně mezi servery.

Doporučujeme omezit celkový počet svazků na 64 svazků na cluster.

Výběr systému souborů

Doporučujeme použít nový odolný systém souborů (ReFS) pro Prostory úložiště s přímým přístupem. ReFS je prémiový systém souborů vytvořený pro virtualizaci a nabízí řadu výhod, včetně dramatických zrychlení výkonu a integrované ochrany před poškozením dat. Podporuje téměř všechny klíčové funkce NTFS, včetně Odstranění duplicitních dat ve Windows Serveru verze 1709 a novějších. Podrobnosti najdete v tabulce porovnání funkcí ReFS.

Pokud vaše úloha vyžaduje funkci, která systém souborů ReFS ještě nepodporuje, můžete místo toho použít systém souborů NTFS.

Tip

Svazky s různými systémy souborů můžou existovat ve stejném clusteru.

Volba typu odolnosti

Svazky v Prostory úložiště s přímým přístupem poskytují odolnost proti problémům s hardwarem, jako jsou například selhání jednotek nebo serverů, a umožňují nepřetržitou dostupnost v průběhu údržby serveru, jako jsou aktualizace softwaru.

Poznámka

Které typy odolnosti můžete zvolit, jsou nezávislé na tom, jaké typy jednotek máte.

Se dvěma servery

Se dvěma servery v clusteru můžete použít obousměrné zrcadlení nebo můžete použít vnořenou odolnost.

Obousměrné zrcadlení uchovává dvě kopie všech dat, jednu kopii na jednotkách na jednotlivých serverech. Efektivita úložiště je 50 procent; k zápisu 1 TB dat potřebujete alespoň 2 TB fyzické kapacity úložiště ve fondu úložiště. Obousměrné zrcadlení může bezpečně tolerovat jedno selhání hardwaru najednou (jeden server nebo jednotka).

Diagram znázorňuje svazky s popisky dat a kopírování připojené kruhovými šipkami a oba svazky jsou spojené s bankou disků na serverech.

Vnořená odolnost poskytuje odolnost dat mezi servery s obousměrným zrcadlením a pak zvyšuje odolnost v rámci serveru s obousměrným zrcadlením nebo akcelerovanou paritou zrcadlení. Vnoření zajišťuje odolnost dat i v případě, že se jeden server restartuje nebo není k dispozici. Efektivita úložiště je 25 procent s vnořeným obousměrným zrcadlením a přibližně 35 až 40 procent pro vnořenou zrcadlenou paritu. Vnořená odolnost může bezpečně tolerovat dvě selhání hardwaru najednou (dvě jednotky nebo server a jednotku na zbývajícím serveru). Kvůli této přidané odolnosti dat doporučujeme použít vnořenou odolnost v produkčních nasazeních dvou serverů. Další informace najdete v tématu Vnořené odolnosti.

Diagram znázorňuje vnořenou zrcadlenou akcelerovanou paritu s obousměrným zrcadlem mezi servery přidruženými k obousměrnému zrcadlení v rámci každého serveru odpovídající vrstvě parity v rámci každého serveru.

Se třemi servery

U tří serverů byste měli použít trojcestné zrcadlení pro lepší odolnost proti chybám a výkon. Trojcestné zrcadlení uchovává tři kopie všech dat, jednu kopii na jednotkách na jednotlivých serverech. Efektivita úložiště je 33,3 procenta – k zápisu 1 TB dat potřebujete alespoň 3 TB fyzické kapacity úložiště ve fondu úložiště. Trojcestné zrcadlení může bezpečně tolerovat alespoň dva hardwarové problémy (disk nebo server) najednou. Pokud dojde k nedostupnosti 2 uzlů, fond úložiště ztratí kvorum, protože disky nejsou dostupné 2/3 a virtuální disky nebudou dostupné. Uzel ale může být down a jeden nebo více disků na jiném uzlu může selhat a virtuální disky zůstanou online. Pokud například restartujete jeden server, když najednou selže jiná jednotka nebo server, všechna data zůstanou bezpečná a nepřetržitě přístupná.

Diagram znázorňuje data označená svazkem a dvě označená kopie připojená kruhovými šipkami s každým svazkem přidruženým k serveru obsahujícímu fyzické disky.

Se čtyřmi nebo více servery

Se čtyřmi nebo více servery si můžete vybrat pro každý svazek, ať už chcete použít trojcestné zrcadlení, duální paritu (často označované jako kódování mazání), nebo je kombinovat se zrcadlenou paritou.

Duální parita poskytuje stejnou odolnost proti chybám jako trojcestné zrcadlení, ale s lepší efektivitou úložiště. U čtyř serverů je efektivita úložiště 50,0 %. k ukládání 2 TB dat potřebujete 4 TB fyzické kapacity úložiště ve fondu úložiště. Tím se zvyšuje efektivita úložiště o 66,7 % se sedmi servery a nadále se zvyšuje až 80,0% efektivita úložiště. Kompromisem je, že kódování parity je náročnější na výpočetní výkon, což může omezit jeho výkon.

Diagram znázorňuje dva svazky označené daty a dvě označenou paritu propojenou kruhovými šipkami s každým svazkem přidruženým k serveru obsahujícímu fyzické disky.

Jaký typ odolnosti se má použít, závisí na potřebách vaší úlohy. Tady je tabulka, která shrnuje, které úlohy jsou vhodné pro každý typ odolnosti, a také výkon a efektivitu úložiště jednotlivých typů odolnosti.

Typ odolnosti Efektivita kapacity Rychlost Úlohy
Zrcadlo Efektivita úložiště zobrazující 33 %
Trojcestné zrcadlo: 33 %
Obousměrné zrcadlo: 50 %
Výkon znázorňující 100 %
Nejvyšší výkon
Virtualizované úlohy
Databáze
Další úlohy s vysokým výkonem
Zrcadlově akcelerovaná parita Efektivita úložiště znázorňující přibližně 50 %
Závisí na poměru zrcadla a parity.
Výkon znázorňující přibližně 20 %
Mnohem pomalejší než zrcadlo, ale až dvakrát tak rychle jako duální parita
Nejlepší pro velké sekvenční zápisy a čtení
Archivace a zálohování
Virtualizovaná desktopová infrastruktura
Duální parita Efektivita úložiště znázorňující přibližně 80 %
4 servery: 50 %
16 serverů: až 80 %
Výkon znázorňující přibližně 10 %
Nejvyšší využití procesoru vstupně-výstupních & operací při zápisech
Nejlepší pro velké sekvenční zápisy a čtení
Archivace a zálohování
Virtualizovaná desktopová infrastruktura

Pokud je výkon nejdůležitější

Úlohy, které mají přísné požadavky na latenci nebo které potřebují spoustu smíšených náhodných vstupně-výstupních operací za sekundu, jako jsou databáze SQL Server nebo virtuální počítače Hyper-V citlivé na výkon, by měly běžet na svazcích, které používají zrcadlení k maximalizaci výkonu.

Tip

Zrcadlení je rychlejší než jakýkoli jiný typ odolnosti. Zrcadlení používáme pro téměř všechny naše příklady výkonu.

Záleží-li na kapacitě nejvíce

Úlohy, které zapisují zřídka, jako jsou datové sklady nebo "studené" úložiště, by se měly spouštět na svazcích, které využívají duální paritu, aby se maximalizovala efektivita úložiště. Některé další úlohy, jako je například Scale-Out Souborový server (SoFS), infrastruktura virtuálních klientských počítačů (VDI) nebo jiné, které nevytvrdí spoustu rychlého posunu náhodného vstupně-výstupního provozu nebo nevyžadují nejlepší výkon, můžou také podle vašeho uvážení používat duální paritu. Parita v porovnání se zrcadlením nutně zvyšuje využití procesoru a latenci vstupně-výstupních operací, zejména u zápisů.

Při hromadném zápisu dat

Úlohy, které zapisují velké, sekvenční průchody, jako jsou archivní nebo zálohovací cíle, mají jinou možnost: jeden svazek může kombinovat zrcadlení a duální paritu. Nejprve zapíše zemi do zrcadlené části a postupně se přesunou do parity později. Tím se zrychlí příjem dat a sníží se využití prostředků při doručení velkých zápisů tím, že umožníte kódování parity náročné na výpočetní výkon delší dobu. Při změně velikosti částí zvažte, že množství zápisů, ke kterým dochází najednou (například jedna denní záloha), by se mělo pohodlně vejít do zrcadlové části. Pokud například ingestujete 100 GB jednou denně, zvažte použití zrcadlení pro 150 GB až 200 GB a duální paritu pro zbytek.

Výsledná efektivita úložiště závisí na poměrech, které zvolíte. Podívejte se na tuto ukázku pro některé příklady.

Tip

Pokud zjistíte náhlé snížení výkonu zápisu prostřednictvím příjmu dat, může to znamenat, že zrcadlová část není dostatečně velká nebo že zrcadlově akcelerovaná parita není vhodná pro váš případ použití. Pokud například výkon zápisu klesne z 400 MB/s na 40 MB/s, zvažte rozšíření zrcadlové části nebo přepnutí na trojcestné zrcadlení.

O nasazeních s NVMe, SSD a HDD

V nasazeních se dvěma typy jednotek poskytují rychlejší jednotky ukládání do mezipaměti, zatímco pomalejší jednotky poskytují kapacitu. K tomu dochází automaticky – další informace najdete v tématu Vysvětlení mezipaměti v Prostory úložiště s přímým přístupem. V takovýchnasazeních

V nasazeních se všemi třemi typy jednotek poskytují ukládání do mezipaměti pouze nejrychlejší jednotky (NVMe), takže dvě typy jednotek (SSD a HDD) poskytují kapacitu. Pro každý svazek můžete zvolit, jestli se nachází zcela na úrovni SSD, zcela na úrovni HDD, nebo jestli se nachází na obou svazcích.

Důležité

Doporučujeme použít vrstvu SSD k umístění vašich nejvýkonnějších úloh na vše flash.

Volba velikosti svazků

V Azure Stack HCI doporučujeme omezit velikost každého svazku na 64 TB.

Tip

Pokud používáte řešení zálohování, které spoléhá na službu Stínová kopie svazku (VSS) a poskytovatele softwaru Volsnap , stejně jako u úloh souborového serveru, omezení velikosti svazku na 10 TB zlepší výkon a spolehlivost. Řešení zálohování, která používají novější rozhraní RCT API hyper-V nebo klonování bloků ReFS nebo nativní rozhraní API zálohování SQL, fungují dobře až 32 TB a dále.

Stopa

Velikost svazku odkazuje na využitelnou kapacitu, množství dat, která může uložit. To poskytuje parametr -Size rutiny New-Volume a pak se zobrazí ve vlastnosti Size při spuštění rutiny Get-Volume .

Velikost se liší od stopy svazku, celková fyzická kapacita úložiště, která zabírá ve fondu úložiště. Nároky závisí na typu odolnosti. Například svazky, které používají trojcestné zrcadlení, mají trojnásobnou velikost.

Nároky na svazky se musí vejít do fondu úložiště.

Diagram znázorňuje 2 TB svazek ve srovnání s 6 TB stopami ve fondu úložiště s násobitelem tří zadaných hodnot.

Rezerva kapacity

Ponechání určité kapacity ve fondu úložiště nepřidělené dává svazkům prostor k opravě "na místě" po selhání jednotek, zlepšení bezpečnosti a výkonu dat. Pokud je k dispozici dostatečná kapacita, okamžitá a místní paralelní oprava může obnovit svazky na plnou odolnost i před nahrazením neúspěšných jednotek. K tomu dochází automaticky.

Doporučujeme zarezervovat ekvivalent jedné jednotky kapacity na server až na 4 jednotky. Můžete si rezervovat více podle vašeho uvážení, ale toto minimální doporučení zaručuje okamžitou, místní paralelní opravu může být úspěšné po selhání libovolné jednotky.

Diagram znázorňuje svazek přidružený k několika diskům ve fondu úložiště a nepřidružené disky označené jako rezerva.

Pokud máte například 2 servery a používáte 1 TB kapacitní jednotky, vystavte jako rezervu 2 x 1 = 2 TB fondu. Pokud máte 3 servery a 1 TB kapacitní jednotky, vyhraďte 3 x 1 = 3 TB jako rezervu. Pokud máte 4 nebo více serverů a 1 TB kapacitních jednotek, vystavte jako rezervu 4 x 1 = 4 TB.

Poznámka

V clusterech s jednotkami všech tří typů (NVMe + SSD + HDD) doporučujeme rezervovat ekvivalent jednoho SSD plus jeden hdd na server, až 4 jednotky každého.

Příklad: Plánování kapacity

Zvažte jeden čtyřserverový cluster. Každý server má některé jednotky mezipaměti plus šestnáct jednotek 2 TB pro kapacitu.

4 servers x 16 drives each x 2 TB each = 128 TB

Z tohoto 128 TB ve fondu úložiště jsme odložili čtyři jednotky nebo 8 TB, aby se místní opravy mohly stát, aniž by se po selhání nahradily jednotky. To ponechá ve fondu 120 TB fyzické kapacity úložiště, se kterou můžeme vytvářet svazky.

128 TB – (4 x 2 TB) = 120 TB

Předpokládejme, že potřebujeme, aby nasazení hostovaly některé vysoce aktivní virtuální počítače Hyper-V, ale máme také velké množství studeného úložiště – staré soubory a zálohy, které potřebujeme zachovat. Protože máme čtyři servery, pojďme vytvořit čtyři svazky.

Pojďme virtuální počítače umístit na první dva svazky, svazek1 a svazek2. Jako systém souborů (pro rychlejší vytváření a kontrolní body) zvolíme Systém souborů ReFS a trojcestné zrcadlení pro zajištění maximálního výkonu. Pojďme umístit studené úložiště na další dva svazky, svazek 3 a svazek 4. Jako systém souborů (pro Odstranění duplicitních dat) zvolíme systém souborů NTFS a duální paritu pro zajištění odolnosti za účelem maximalizace kapacity.

Nevyžadujeme, aby všechny svazky byly stejné velikosti, ale pro jednoduchost – můžeme je například vytvořit všech 12 TB.

Objem1 a Svazek2 zabírají 12 TB x 33,3% efektivitu = 36 TB fyzické kapacity úložiště.

Svazek3 a Svazek4 zabírají 12 TB x 50,0% efektivitu = 24 TB fyzické kapacity úložiště.

36 TB + 36 TB + 24 TB + 24 TB = 120 TB

Čtyři svazky přesně odpovídají fyzické kapacitě úložiště dostupné v našem fondu. Skvělé!

Diagram znázorňuje dva 12TB trojcestné zrcadlové svazky spojené s 36 TB úložiště a dva svazky duální parity 12 TB spojené s 24 TB a všechny zabírají 120 TB ve fondu úložiště.

Tip

Nemusíte hned vytvářet všechny svazky. Svazky můžete kdykoli rozšířit nebo později vytvořit nové svazky.

Pro zjednodušení tento příklad používá desetinné (základní-10) jednotky v celém formátu, což znamená 1 TB = 1 000 000 000 000 bajtů. Množství úložiště ve Windows se ale zobrazuje v binárních jednotkách (base-2). Například každá jednotka s 2 TB by se ve Windows zobrazovala jako 1,82 TiB. Podobně by se fond úložiště 128 TB zobrazoval jako 116,41 TiB. To se očekává.

Využití

Viz Vytváření svazků ve službě Azure Stack HCI.

Další kroky

Další informace najdete také v tématech: