Sdílet prostřednictvím


Spolehlivost ve službě Azure NetApp Files

Tento článek popisuje podporu spolehlivosti ve službě Azure NetApp Files, která pokrývá odolnost uvnitř oblastí prostřednictvím zón dostupnosti a nasazení ve více oblastech.

Při používání Azure je spolehlivost sdílenou odpovědností. Microsoft nabízí celou řadu možností, které podporují odolnost a obnovení. Zodpovídáte za pochopení toho, jak tyto možnosti fungují ve všech službách, které používáte, a výběrem možností, které potřebujete ke splnění vašich obchodních cílů a cílů dostupnosti.

Azure NetApp Files je nativní řešení úložiště souborů na podnikové úrovni, které se bezproblémově integruje v Rámci Azure a umožňuje sdílení souborů mezi klienty prostřednictvím protokolů NFS (Network File System) a SMB (Server Message Block). Služba Azure NetApp Files je navržená pro vysoký výkon a poskytuje škálovatelné a zabezpečené úložiště souborů spravované jako služba.

Pokud chcete použít Azure NetApp Files, musíte nakonfigurovat účet NetApp, který obsahuje fondy kapacity , které hostují svazky. Kapacitu a propustnost můžete nakonfigurovat nezávisle a spravovat možnosti ochrany dat, které vyhovují různým potřebám. Replikaci mezi svazky můžete povolit, i když jsou v různých umístěních.

Doporučení pro nasazení do produkčního prostředí

Informace o nasazení služby Azure NetApp Files pro podporu požadavků na spolehlivost vašeho řešení a o tom, jak spolehlivost ovlivňuje další aspekty architektury, najdete v tématu Osvědčené postupy architektury pro Azure NetApp Files v architektuře Azure Well-Architected Framework.

Přechodné chyby

Přechodné chyby jsou krátká, přerušovaná selhání ve složkách. V distribuovaném prostředí, jako je cloud, se vyskytují často a jsou normální součástí provozu. Přechodné chyby se opravují po krátké době. Je důležité, aby vaše aplikace mohly zpracovávat přechodné chyby, obvykle opakováním ovlivněných požadavků.

Všechny aplikace hostované v cloudu by měly při komunikaci se všemi cloudovými rozhraními API, databázemi a dalšími komponentami postupovat podle pokynů pro zpracování přechodných chyb Azure. Další informace najdete v tématu Doporučení pro zpracování přechodných chyb.

Kromě přechodných typů chyb, které můžou ovlivnit jakékoli cloudové řešení, může občasná plánovaná údržba, jako jsou aktualizace platformy, aktualizace služeb a upgrady softwaru, ovlivnit také Azure NetApp Files.

Z souborového protokolu, jako je NFS a SMB, nejsou přechodné chyby rušivé, pokud aplikace dokáže zpracovat vstupně-výstupní pozastavení (vstupně-výstupní operace), ke kterým může dojít během těchto událostí. Vstupně-výstupní pozastavení jsou obvykle krátké, od několika sekund do 30 sekund. Některé aplikace můžou vyžadovat ladění pro zpracování vstupně-výstupních pozastavení.

Protokol NFS je robustní a operace se soubory klientského serveru obvykle normálně pokračují. Některé aplikace můžou vyžadovat ladění pro zpracování vstupně-výstupních pozastavení po dobu 30 až 45 sekund. Ujistěte se, že víte o nastavení odolnosti aplikace, abyste se mohli vypořádat s událostmi údržby služby úložiště.

U aplikací interaktivních pro člověka, které používají protokol SMB, jsou obvykle dostatečná standardní nastavení protokolu. Azure NetApp Files také podporuje nepřetržitou dostupnost protokolu SMB, která umožňuje převzetí služeb při selhání s transparentním převzetím služeb při selhání protokolu SMB. Převzetí služeb při selhání SMB Transparent eliminuje přerušení, které způsobují události údržby služby. Zvyšuje také spolehlivost a uživatelské prostředí.

Nepřetržitá dostupnost protokolu SMB je dostupná jenom pro konkrétní aplikace.

Další doporučení najdete v tématu Nejčastější dotazy k odolnosti aplikací pro Azure NetApp Files.

Podpora zón dostupnosti

Zóny dostupnosti jsou fyzicky oddělené skupiny datacenter v rámci oblasti Azure. Když jedna zóna selže, mohou služby přejít na jednu ze zbývajících zón.

Azure NetApp Files podporuje zónová nasazení svazků. Pomocí funkce umístění svazku zóny dostupnosti v Azure NetApp Files nasaďte jednotlivé svazky do jediné zóny dostupnosti podle vašeho výběru. Tuto funkci můžete použít jenom v případě, že je služba Azure NetApp Files v této zóně dostupnosti a má dostatečnou kapacitu. Pokud máte aplikace citlivé na latenci, můžete svazek nasadit do stejné zóny dostupnosti jako výpočetní prostředky Azure a další služby.

V následujícím diagramu oranžové šipky s plnými hroty šipek představují způsob, jak všechny virtuální počítače v rámci regionu propojených virtuálních sítí mohou přistupovat ke všem prostředkům Azure NetApp Files. Zelené šipky představují způsob, jakým virtuální počítače, které přistupují ke svazkům Azure NetApp Files ve stejné zóně, sdílejí doménu selhání zóny dostupnosti. Mezi různými svazky na úrovni platformy není žádná replikace.

Diagram znázorňující umístění svazků ve zónách dostupnosti služby Azure NetApp Files

Diagram znázorňuje tři zóny dostupnosti v oblasti Azure. Oranžové šipky s plnými hroty spojují ikony představující virtuální počítače a prostředky Azure NetApp Files napříč zónami dostupnosti. Zelené šipky propojují virtuální počítače a svazky Azure NetApp Files ve stejné zóně dostupnosti.

Jednozónové nasazení nestačí ke splnění požadavků na vysokou spolehlivost. Pokud chcete asynchronně replikovat data mezi svazky v různých zónách dostupnosti, můžete použít replikaci mezi zónami. Replikaci mezi zónami musíte nakonfigurovat odděleně od umístění svazku zóny dostupnosti.

Pokud zóna dostupnosti selže, zodpovídáte za zjištění selhání a přepnutí na alternativní svazek v jiné zóně.

Podpora oblastí

Replikace mezi zónami je dostupná ve všech oblastech s podporou zóny dostupnosti , které podporují Službu Azure NetApp Files.

Úvahy

  • Umístění svazku zóny dostupnosti ve službě Azure NetApp Files poskytuje umístění zónových svazků. Při připojení k virtuálním počítačům ve stejné zóně dostupnosti se zobrazí nízká latence. Umístění svazku zóny dostupnosti ale neposkytuje umístění bezkontaktní komunikace s virtuálními počítači nebo jinými prostředky a svazek může být v jiné fyzické části datacentra.

  • Replikace je povolená mezi různými předplatnými Azure jenom v případě, že jsou ve stejném tenantovi Microsoft Entra.

  • Další informace o zónách dostupnosti v Azure NetApp Files najdete v tématu Požadavky a aspekty použití replikace mezi zónami a Správa umístění svazků zóny dostupnosti.

Náklady

Za povolení umístění svazku zóny dostupnosti ve službě Azure NetApp Files se neúčtují žádné další poplatky. Platíte jenom za fondy kapacity a prostředky, které nasazujete v rámci těchto zón.

Replikované svazky jsou hostované ve fondu kapacity. Náklady na replikaci mezi zónami jsou založeny na velikosti a úrovni zřízeného fondu kapacity. Za replikaci dat nejsou žádné další náklady.

Konfigurujte podporu zón dostupnosti

Musíte samostatně nakonfigurovat umístění svazku a replikaci mezi zónami.

Normální operace

Tato část popisuje, co očekávat, když je několik svazků Azure NetApp Files nasazených do samostatných zón dostupnosti, povolí se replikace mezi zónami a všechny zóny dostupnosti budou funkční.

  • Směrování provozu mezi zónami: Příchozí požadavky se směrují na konkrétní svazek, který se nachází v zóně dostupnosti, kterou vyberete.

  • Replikace dat mezi zónami: Replikace mezi zónami služby Azure NetApp Files znamená, že všechny změny zdrojového svazku se asynchronně replikují do cílových svazků. Můžete se rozhodnout, jak často replikace probíhá. Replikace mezi zónami podporuje tři plány replikace: každých 10 minut, hodinově a denně.

    Důležité

    10minutový plán replikace se nepodporuje u velkých svazků , které používají replikaci mezi zónami.

Zážitek zklidnění zóny

Tato část popisuje, co očekávat, když je několik svazků Azure NetApp Files nasazených do samostatných zón dostupnosti, povolí se replikace mezi zónami a dojde k výpadku zóny dostupnosti.

  • Detekce a odpověď: Zodpovídáte za zjištění ztráty zóny dostupnosti a zahájení převzetí služeb při selhání.

    Pokud chcete monitorovat stav svazku Azure NetApp Files, můžete použít metriky služby Azure Monitor. Azure Monitor detekuje všechny anomálie, které označují scénář zóny, prostřednictvím metrik v reálném čase, jako jsou vstupně-výstupní operace za sekundu (IOPS), latence a využití kapacity. Výstrahy a oznámení můžete nakonfigurovat tak, aby odesílali správcům, aby mohli okamžitě reagovat vyrovnáním sdílených složek nebo zahájením převzetí služeb při selhání nebo jinými protokoly zotavení po havárii.

    Převzetí služeb při selhání je manuální proces. Pokud potřebujete aktivovat cílový svazek, například když chcete převzít služby při selhání do cílové zóny dostupnosti, musíte přerušit partnerský vztah replikace a pak připojit cílový svazek. Další informace najdete v tématu automatické přesměrování na cílový svazek při výpadku.

  • Aktivní požadavky: Během události výpadku zóny můžou aktivní žádosti zaznamenat přerušení nebo vyšší latence.

  • Očekávaná ztráta dat: Velikost ztráty dat nebo cíle bodu obnovení (RPO), které můžete očekávat během převzetí služeb při selhání zóny, závisí na plánu replikace mezi zónami, který nakonfigurujete.

    Plán replikace Typický cíl bodu obnovení
    Každých 10 minut 20 minut
    Hodinově Dvě hodiny
    Každý den Méně než 48 hodin
  • Očekávaný výpadek: Převzetí služeb při selhání do jiné zóny vyžaduje, abyste přerušili vztah partnerského vztahu, aby aktivoval cílový svazek a poskytoval přístup ke čtení a zápisu dat v druhé lokalitě. Po aktivaci partnerského vztahu, který se přeruší, můžete očekávat, že se převzetí služeb při selhání dokončí během jedné minuty.

    Celková doba výpadku nebo plánovaná doba obnovení (RTO), kterou můžete očekávat během převzetí služeb při selhání zóny, ale závisí na několika faktorech, včetně doby, po kterou vaše systémy nebo procesy trvá zjištění ztráty zóny a zahájení procesů převzetí služeb při selhání. Je také důležité se rozhodnout, jestli se má automatizovat odpověď nebo jestli se vyžadují ruční kroky. Pro dobře připravené konfigurace obvykle celý proces vyžaduje několik minut až hodinu, než se dokončí.

  • Přesměrování provozu: Zodpovídáte za přesměrování provozu aplikace pro připojení k nově aktivnímu cílovému svazku. Další informace najdete v tématu automatické přesměrování na cílový svazek při výpadku.

Obnovení zóny

Navrácení služeb po obnovení je ruční proces, který vyžaduje provedení operace opětovné synchronizace, obnovení replikace a opětovné připojení zdrojového svazku, ke kterému má klient přístup. Další informace najdete v tématu Správa zotavení po havárii pomocí služby Azure NetApp Files.

Testování zónových selhání

Konfiguraci replikace mezi zónami můžete bezpečně otestovat pomocí snímků svazku. Další informace o přístupu vysoké úrovně k otestování konfigurace replikace napříč zónami najdete v tématu Testování zotavení po havárii pro Azure NetApp Files.

Podpora více regionů

Azure NetApp Files je ve výchozím nastavení služba s jednou oblastí. Pokud se oblast stane nedostupnou, svazky uložené v této oblasti jsou také nedostupné. Azure NetApp Files podporuje replikaci mezi oblastmi, aby se zlepšila odolnost, pokud dojde k regionálnímu výpadku. Data ze svazku Azure NetApp Files (zdroj) v jedné oblasti můžete asynchronně replikovat do jiného svazku Azure NetApp Files (cíl) v jiné oblasti, kterou Microsoft předem vybral. Tato funkce umožňuje přepnout kritickou aplikaci, pokud dojde k výpadku nebo havárii v rámci regionu.

Poznámka:

Můžete také replikovat jeden svazek do jiné zóny dostupnosti a do jiné oblasti. Další informace najdete v tématu Vysvětlení replikace služby Azure NetApp Files.

Podpora oblastí

Sekundární oblast, do které můžete replikovat svazky, závisí na primární oblasti. Další informace najdete v podporovaných párech oblastí.

Úvahy

Replikace je povolená mezi různými předplatnými Azure jenom v případě, že jsou ve stejném tenantovi Microsoft Entra.

Další aspekty související s replikací mezi oblastmi ve službě Azure NetApp Files najdete v tématu Požadavky a důležité informace o použití replikace mezi oblastmi.

Náklady

Poplatky za replikaci mezi oblastmi jsou založené na množství replikovaných dat. Další informace a některé ukázkové scénáře najdete v tématu Model nákladů pro replikaci mezi oblastmi.

Konfigurace podpory více oblastí

Normální operace

Tato část popisuje, co očekávat, když jsou svazky Azure NetApp Files nakonfigurované tak, aby používaly replikaci mezi oblastmi a obě oblasti jsou funkční.

  • Směrování provozu mezi oblastmi: Příchozí požadavky se směrují na konkrétní svazek, který se nachází v primární oblasti.

  • Replikace dat mezi oblastmi: Replikace azure NetApp Files mezi oblastmi znamená, že všechny změny zdrojového svazku se asynchronně replikují do cílových svazků. Můžete se rozhodnout, jak často replikace probíhá. Replikace mezi oblastmi podporuje tři plány replikace: každých 10 minut, hodinově a denně.

    Důležité

    10minutový plán replikace se nepodporuje u velkých svazků , které používají replikaci mezi oblastmi.

  • Monitorování stavu replikace: Můžete monitorovat stav vztahu partnerského vztahu a můžete nakonfigurovat výstrahy, které vás upozorní, pokud prodleva replikace překročí očekávanou prahovou hodnotu. Další informace najdete v tématu Zobrazení stavu a monitorování stavu vztahu replikace.

Prostředí pro oblast mimo oblast

Tato část popisuje, co očekávat, když jsou svazky Azure NetApp Files nakonfigurované tak, aby používaly replikaci mezi oblastmi a došlo k výpadku primární oblasti.

  • Detekce a odpověď: Zodpovídáte za zjištění ztráty oblasti a zahájení převzetí služeb při selhání.

    Pokud chcete monitorovat stav svazku Azure NetApp Files, můžete použít metriky služby Azure Monitor. Azure Monitor detekuje všechny anomálie, které označují scénář mimo oblast, prostřednictvím metrik v reálném čase, jako jsou IOPS, latence a využití kapacity. Výstrahy a oznámení můžete nakonfigurovat tak, aby odesílali správcům, aby mohli okamžitě reagovat vyrovnáním sdílených složek nebo zahájením převzetí služeb při selhání nebo jinými protokoly zotavení po havárii.

    Převzetí služeb při selhání je manuální proces. Když potřebujete aktivovat cílový svazek, například když chcete převzít služby při selhání do cílové oblasti, musíte přerušit partnerský vztah replikace a pak připojit cílový svazek. Další informace najdete v tématu automatické přesměrování na cílový svazek při výpadku.

  • Aktivní požadavky: Během události mimo oblast můžou aktivní požadavky zaznamenat přerušení nebo zvýšenou latenci.

  • Očekávaná ztráta dat: Velikost ztráty dat nebo cíle bodu obnovení, které můžete očekávat během převzetí služeb při selhání oblasti, závisí na plánu replikace mezi oblastmi, který nakonfigurujete.

    Plán replikace Typický cíl bodu obnovení
    Každých 10 minut Méně než 20 minut
    Hodinově Méně než dvě hodiny
    Každý den Méně než 48 hodin
  • Očekávaný výpadek: Převzetí služeb při selhání do jiné oblasti vyžaduje, abyste přerušili vztah partnerského vztahu, aby se aktivoval cílový svazek a poskytoval přístup k datům pro čtení a zápis v druhé lokalitě. Po aktivaci partnerského vztahu, který se přeruší, můžete očekávat, že se převzetí služeb při selhání dokončí během jedné minuty.

    Celková doba výpadku neboli RTO, kterou můžete očekávat během převzetí služeb při selhání zóny, ale závisí na několika faktorech, včetně doby, po kterou trvá, než systémy nebo procesy zjistí ztrátu zóny a zahájí procesy převzetí služeb při selhání. Je také důležité se rozhodnout, jestli se má automatizovat odpověď nebo jestli se vyžadují ruční kroky. Pro dobře připravené konfigurace obvykle celý proces vyžaduje několik minut až hodinu, než se dokončí.

  • Přesměrování provozu: Zodpovídáte za přesměrování provozu aplikace pro připojení k nově aktivnímu cílovému svazku. Další informace najdete v tématu automatické přesměrování na cílový svazek při výpadku.

Obnovení oblasti

cs-CZ: Po obnovení primární oblasti zodpovídáte za přepnutí zpět. Navrácení služeb po obnovení je ruční proces, který vyžaduje provedení operace opětovné synchronizace, obnovení replikace a opětovné připojení zdrojového svazku, ke kterému má klient přístup. Další informace najdete v tématu Správa zotavení po havárii pomocí služby Azure NetApp Files.

Testování poruch v oblasti

Konfiguraci replikace mezi oblastmi můžete bezpečně otestovat pomocí snímků svazku. Další informace o přístupu vysoké úrovně k otestování konfigurace replikace mezi oblastmi najdete v tématu Testování zotavení po havárii pro Azure NetApp Files.

Zálohy

Zálohování služby Azure NetApp Files rozšiřuje možnosti ochrany dat služby Azure NetApp Files tím, že poskytuje plně spravované řešení zálohování pro dlouhodobé obnovení, archivaci a dodržování předpisů. Zálohy, které služba vytvoří, se ukládají v úložišti Azure nezávisle na snímcích svazků, které jsou k dispozici pro krátkodobé obnovení nebo klonování. Zálohy, které služba převezme, je možné obnovit do nových svazků Azure NetApp Files v rámci oblasti. Zálohování Azure NetApp Files podporuje zálohování založené na zásadách (naplánované) i ruční zálohování (na vyžádání).

Snímky Služby Azure NetApp Files pro další zabezpečení přidávají stabilitu, škálovatelnost a rychlou obnovitelnost, aniž by to mělo vliv na výkon. Poskytují základ pro další řešení redundance, včetně zálohování, replikace mezi oblastmi a replikace mezi zónami.

U většiny řešení byste se neměli spoléhat výhradně na zálohy. Místo toho využijte další funkce popsané v tomto průvodci k podpoře vašich požadavků na odolnost. Zálohy ale chrání před některými riziky, která jiné přístupy nechrání. Další informace najdete v tématu Co jsou redundance, replikace a zálohování?.

Smlouva o úrovni služeb

Smlouva o úrovni služeb (SLA) pro služby Azure popisuje očekávanou dostupnost každé služby a podmínky, které musí vaše řešení splnit, aby bylo dosaženo očekávané dostupnosti. Další informace najdete v tématu Smlouvy SLA pro online služby.