Pokyny ke standardním provozním hodnotám pro Azure Red Hat OpenShift

Článek
07/11/2023

Azure Red Hat OpenShift poskytuje vysoce škálovatelné a plně spravované clustery OpenShift na vyžádání. Správným návrhem řešení s ohledem na správu a monitorování můžete dosáhnout efektivity provozu a úspěchu zákazníků.

Na co dát pozor při navrhování

Vezměte v úvahu následující faktory:

Projděte si matici odpovědnosti azure Red Hat OpenShift a zjistěte, jak se odpovědnosti za clustery sdílejí mezi Microsoftem, Red Hatem a zákazníky.
Mějte na paměti limity virtuálních počítačů Azure a podporované oblasti. Ujistěte se, že je k dispozici kapacita pro nasazení prostředků.
Mějte na paměti způsoby, jak logicky izolovat úlohy v rámci clusteru a fyzicky v samostatných clusterech.
Mějte na paměti způsoby, jak kubernetes pochopit stav vašich úloh.
Mějte na paměti různé velikosti virtuálních počítačů a účinek použití jednoho nebo druhého počítače.
Mějte na paměti způsoby, jak monitorovat a protokolovat Azure Red Hat OpenShift, abyste získali přehled o stavu vašich prostředků a předvídali potenciální problémy. Cluster i aplikace spuštěné nahoře můžou generovat mnoho událostí. Pomocí upozornění můžete rozlišovat mezi položkami protokolu pro historické účely a položkami, které vyžadují okamžitou akci.
Mějte na paměti důležité aktualizace systému a upgrady. Důležité aktualizace oprav na clustery automaticky aplikují technici spolehlivosti lokality Azure Red Hat OpenShift (SRE). Zákazníci, kteří si chtějí aktualizace oprav nainstalovat předem, to mohou udělat.
Mějte na paměti omezení prostředků clusteru a jednotlivých úloh.
Mějte na paměti rozdíly mezi horizontálním automatickým škálováním podů a automatickým škálováním clusteru.
Projděte si životní cyklus podpory a seznamte se se zásadami podpory verzí. Azure Red Hat OpenShift podporuje pouze aktuální a předchozí obecně dostupné podverze platformy Red Hat OpenShift Container Platform. Žádosti o podporu vyžadují, aby cluster byl v podporované verzi.
Projděte si požadavky na konfiguraci clusteru , abyste zachovali podporu clusteru.
Zkontrolujte sítě mezi obory názvů a zabezpečte provoz v rámci clusteru pomocí zásad sítě.

Doporučení k návrhu

Azure Red Hat OpenShift má bohatý ekosystém operátorů a měl by se používat k provádění a automatizaci provozních aktivit s efektivitou a přesností.
Přidejte do podů sondy stavu pro monitorování stavu aplikace. Ujistěte se, že pody obsahují livenessProbe a readinessProbe. Pomocí spouštěcích sond určete bod, ve kterém se aplikace spustila.
Používejte virtuální počítače, které jsou dostatečně velké na to, aby obsahovaly více instancí kontejneru, abyste získali výhody zvýšené hustoty, ale ne tak velké, aby váš cluster nezvládl úlohy neúspěšného uzlu.
Regulujte funkce clusteru pomocí modulů plug-in pro přístup, které se běžně používají k vynucení zásad zabezpečení, omezení prostředků nebo požadavků na konfiguraci.
Požadavky na pody a omezení použijte ke správě výpočetních prostředků v clusteru. Požadavky a omezení podů informují plánovač Kubernetes, který přiřadí výpočetní prostředky podu. Omezení spotřeby zdrojů v projektu pomocí rozsahů omezení
Optimalizujte hodnoty požadavků procesoru a paměti a maximalizujte efektivitu prostředků clusteru pomocí vertikálního automatického škálování podů.
Webová konzola OpenShift obsahuje všechny metriky na úrovni uzlu. Vytvořte proces monitorování pomocí integrované integrace Prometheus nebo Container Insights.
- Prometheus je předinstalovaný a nakonfigurovaný pro clustery Azure Red Hat OpenShift 4.x.
- Container Insights je možné povolit onboardingem clusteru do Kubernetes s podporou Azure Arc.
- Protokolování OpenShift nasadí agregátory protokolů, úložiště a komponenty vizualizace.
Automatizujte proces doručování aplikací prostřednictvím postupů DevOps a řešení CI/CD, jako jsou Pipelines/GitOps poskytované platformou OpenShift Container Platform.
Definujte ClusterAutoScaler a MachineAutoScaler pro škálování počítačů, když clusteru dojdou prostředky, aby bylo podporováno více nasazení.
Nasaďte kontroly stavu počítače, které automaticky opraví poškozené počítače ve fondu počítačů.
Škálujte pody tak, aby vyhovovaly poptávce, pomocí horizontálního automatického škálování podů.
K poskytování oznámení v případě, že je potřeba provést přímou akci, použijte systém upozornění: upozornění na metriky Container Insights nebo integrované uživatelské rozhraní pro upozorňování.

Provozní kontinuita a zotavení po havárii (BCDR)

Vaše organizace potřebuje navrhnout vhodné funkce na úrovni platformy Azure Red Hat OpenShift, aby splňovaly její specifické požadavky. Tyto aplikační služby mají požadavky související s cílem doby obnovení (RTO) a cílem bodu obnovení (RPO). Pro zotavení po havárii je potřeba vzít v úvahu několik aspektů. Prvním krokem je definování smlouvy o úrovni služeb (SLA) pro vaši infrastrukturu a aplikaci. Přečtěte si o smlouvě SLA pro Azure Red Hat OpenShift. Informace o výpočtech měsíční doby provozu najdete v části Podrobnosti o smlouvě SLA .

Aspekty návrhu pro BCDR

Vezměte v úvahu následující faktory:

Cluster Azure Red Hat OpenShift by měl k zajištění minimální úrovně dostupnosti vaší aplikace používat několik sad počítačů.
Nastavte požadavky a limity podů. Nastavení těchto limitů umožní Kubernetes:
- Efektivně přiřaďte podům prostředky procesoru a paměti.
- Mají vyšší hustotu kontejneru na uzlu.
- Zvyšte spolehlivost díky nižším nákladům díky lepšímu využití hardwaru.
Rozprostřete uzly napříč všemi dostupnými zónami pro zajištění vyšší dostupnosti.
- Zvolte oblast, která podporuje Zóny dostupnosti.
- Pro kompletní zónovou výhodu musí všechny závislosti služby podporovat také zóny. Pokud závislá služba nepodporuje zóny, je možné, že selhání zóny může způsobit selhání této služby. Projděte si typy disků, které se používají při rozložení úloh mezi zóny.
- Pro zajištění vyšší dostupnosti nad rámec toho, čeho Zóny dostupnosti dosáhnout, spusťte několik clusterů v různých spárovaných oblastech. Pokud prostředek Azure podporuje geografickou redundanci, zadejte umístění, ve kterém bude mít redundantní služba svou sekundární oblast.
Konzistentně vytvářet zálohy aplikací a dat.
- Nestavovou službu je možné efektivně replikovat.
- Pokud potřebujete uložit stav v clusteru, zálohujte data často ve spárované oblasti.
Upgradujte a spravujte clustery.
- Vždy udržujte cluster v aktualizovaném stavu. Zkontrolujte upgrady clusteru.
- Mějte na paměti proces vydání a vyřazení.
- Umožňuje řídit upgrady prostřednictvím plánů.
- Zkontrolujte, jestli je potřeba zavést aktualizaci kanárů pro kritické úlohy.
Pokud dojde k převzetí služeb při selhání, připojení k síti:
- Pokud potřebujete distribuovat provoz mezi oblasti, zvažte použití služby Azure Front Door.
Pro plánovaná a neplánovaná převzetí služeb při selhání:
- Při nastavování jednotlivých služeb Azure zvolte funkce, které podporují zotavení po havárii. Pokud je například vybrána Azure Container Registry, povolte ji pro geografickou replikaci. Pokud oblast přestane fungovat, můžete z replikované oblasti stále stahovat image.
Udržujte technické funkce DevOps, abyste dosáhli cílů na úrovni služeb.

Doporučení návrhu pro BCDR

Níže jsou uvedené osvědčené postupy pro váš návrh:

Clustery Azure Red Hat OpenShift se zřizují se třemi uzly řídicí roviny a třemi nebo více pracovními uzly. Ujistěte se, že je cluster vytvořený v oblasti, která podporuje Zóny dostupnosti, aby uzly byly rozložené napříč zónami.
Pro zajištění vysoké dostupnosti nasaďte tyto uzly do různých Zóny dostupnosti. Vzhledem k tomu, že pro každou zónu dostupnosti potřebujete různé sady počítačů, vytvořte alespoň tři sady počítačů.
Nespouštět další úlohy na uzlech řídicí roviny. I když je možné je naplánovat na uzlech řídicí roviny, způsobí to další problémy s využitím prostředků a stabilitou, které můžou ovlivnit celý cluster.
Vytvořte sady počítačů infrastruktury, které budou obsahovat součásti infrastruktury. Na tyto počítače použijte konkrétní popisky Kubernetes a pak aktualizujte komponenty infrastruktury tak, aby běžely jenom na těchto počítačích.
Kdykoli je to možné, odeberte stav služby z kontejnerů. Místo toho použijte platformu Azure jako službu (PaaS), která podporuje replikaci ve více oblastech.
Nasazení by měla určovat požadavky na prostředky podu. Plánovač pak může odpovídajícím způsobem naplánovat pod. Spolehlivost výrazně odepisuje, když nejsou naplánované pody.
Nastavte v nasazení několik replik, které budou řešit výpadky, jako jsou selhání hardwaru. U plánovaných událostí, jako jsou aktualizace a upgrady, může rozpočet přerušení zajistit, že existuje požadovaný počet replik podů pro zpracování očekávaného zatížení aplikace.
Omezení topologie podů použijte k automatickému plánování podů na uzlech v celém clusteru.
Vaše aplikace můžou pro svá data používat úložiště a v případě potřeby by měly zajistit dostupnost napříč oblastmi:
- Použití úložiště RWX s vloženou třídou úložiště Azure Files.
- Použití ovladačů CSI pro zřizování úložiště
Vytvořte zálohu aplikace a naplánujte obnovení:
- Do zálohy zahrňte trvalé svazky .
Odhad omezení prostředků podů Otestujte a vytvořte směrný plán. Začněte se stejnými hodnotami pro požadavky a limity. Pak tyto hodnoty postupně vylaďte, dokud nenastavíte prahovou hodnotu, která může způsobit nestabilitu v clusteru. Omezení podů je možné zadat v manifestech nasazení. Vertikální automatické škálování podů optimalizuje hodnoty požadavků procesoru a paměti a může maximalizovat efektivitu prostředků clusteru.
- Integrované funkce můžou zpracovávat selhání a přerušení architektury služeb. Tyto konfigurace pomáhají zjednodušit automatizaci návrhu i nasazení. Když organizace definuje standard pro smlouvu SLA, RTO a RPO, může k dosažení obchodních cílů používat služby integrované do Kubernetes a Azure.
Zvažte modrozelené nebo kanárské strategie pro nasazení nových verzí aplikací.
Nastavte rozpočty priority podů nebo přerušení podů, abyste omezili počet replik podů, které může cluster převzít pro operace údržby, a tím zajistit dostupnost.
Vynucujte kvóty prostředků pro obory názvů služeb. Kvóta prostředků v oboru názvů zajistí správné nastavení požadavků a limitů podů pro nasazení.
- Nastavení kvót prostředků na úrovni clusteru může způsobit problémy při nasazování partnerských služeb, které nemají správné požadavky a limity.
Uložte image kontejneru do Azure Container Registry a geograficky replikujte registr do každé oblasti.
Pro připojení Azure ExpressRoute použijte více oblastí a umístění partnerského vztahu. Pokud dojde k výpadku, který ovlivňuje oblast Azure nebo umístění poskytovatele partnerského vztahu, může redundantní hybridní síťová architektura pomoct zajistit nepřerušované připojení mezi různými místy.
Propojení oblastí s globálním peeringem virtuálních sítí Pokud spolu clustery potřebují komunikovat, je možné vzájemně propojit obě virtuální sítě prostřednictvím partnerského vztahu virtuálních sítí. Tato technologie vzájemně propojuje virtuální sítě a poskytuje tak velkou šířku pásma napříč páteřní sítí Microsoftu, a to i napříč různými geografickými oblastmi.
K rychlému připojení koncových uživatelů k nejbližšímu bodu POP služby Front Door použijte rozdělený protokol anycast založený na protokolu TCP , Azure Front Door. Mezi další funkce služby Azure Front Door patří:
- Ukončení šifrování TLS
- Vlastní doména
- Firewall webových aplikací
- Přepsání adresy URL
- Spřažení relací

Další kroky

Přečtěte si o aspektech návrhu a doporučeních pro automatizaci platforem a DevOps v cílových zónách Azure.

Sdílet prostřednictvím