Příprava cloudového provozu Azure

Správa prostředí Azure není jen o tom, udržovat provoz v chodu. Jde o zachování zásad správného řízení a zabezpečení a zároveň zajištění toho, aby váš cloud zůstal v souladu s obchodními cíli v průběhu času. S rostoucím růstem prostředí je potřeba zabránit posunu konfigurace, zlepšit nasazení prostřednictvím infrastruktury jako kódu a efektivně spravovat změny.

Metodologie správy Cloud Adoption Framework (CAF) představuje metodu RAMP (Ready, Manage, Monitor, Protect), která vám pomůže sestavovat tyto funkce. RAMP poskytuje strukturovaný způsob, jak organizovat týmy, definovat zodpovědnosti a implementovat procesy a nástroje, které zajišťují zabezpečení, dodržování předpisů a odolnost vašich Azure operací. Od každodenní správy po monitorování zdraví systému a ochranu proti narušením vám RAMP pomůže vytvořit silný provozní základ pro dlouhodobému úspěchu.

Diagram znázorňující proces správy CAF: připraveno, spravovat, monitorovat a chránit (RAMP).

Identifikace odpovědností za správu

Efektivní správa Azure zahrnuje dvě vrstvy odpovědnosti: centrální (platforma) zodpovědnosti a workload odpovědnosti. Centrální zodpovědnosti se vztahují na celá cloudová aktiva. Odpovědnost za úlohy se zaměřuje na jednotlivé aplikace nebo služby. Použití tabulky 1 k zajištění, že provozní model pokrývá základní oblasti správy cloudu

Tabulka 1. Primární odpovědnosti za správu cloudu

Oblasti správy cloudu Odpovědnosti centrální platformy Odpovědnosti za pracovní zátěž
Compliance ▪ Definujte provozní postupy.
▪ Vynucujte zásady správného řízení.
Monitorování dodržování předpisů a náprava nebo eskalace podle potřeby
▪ Postupujte podle provozních postupů.
▪ Sladění návrhu se zásadami správného řízení
Zabezpečení ▪ Správa operací zabezpečení na úrovni celé organizace
▪ Správa identit v Microsoft Entra ID
▪ Udělte přístup k předplatným Azure.
▪ Definujte a udržujte standardní hodnoty zabezpečení prostřednictvím Azure Policy a Microsoft Defender for Cloud.
▪ Dohlížet na integraci ochrany před hrozbami a reakce na incidenty s Microsoft Sentinel.
▪ Implementace návrhu zabezpečených úloh
▪ Reagujte na výstrahy zabezpečení a incidenty specifické pro úlohy
▪ Průběžně vyhodnocujte ohrožení zabezpečení v rámci úlohy.
Řízení zdrojů ▪ Definujte a spravujte hierarchii prostředků.
▪ Vytvořte předplatné pro pracovní zátěže dle požadavků.
▪ Definujte strategii pojmenování a označování.
▪ Definujte topologii sítě.
▪ Konfigurace sdílených sítí (peering virtuálních sítí, místní připojení)
▪ Správa napříč úlohami nebo sdílenými prostředky nebo službami
▪ Monitorování limitů předplatného a zpracování žádostí o navýšení kvóty
▪ Správa předplatných specifických pro úlohy (pokud jsou delegovaná)
▪ Správa skupin prostředků a prostředků pro každou úlohu
▪ Dodržujte a použijte standardy pojmenování a označování.
▪ Spravujte využití prostředků na úrovni aplikace a zajistěte, aby prostředky zůstaly v rámci kvót předplatného.
Nasazení ▪ Standardizace a řízení kanálů a nástrojů CI/CD (Azure DevOps, GitHub Actions).
▪ Definujte referenční šablony infrastruktury jako kódu (Bicep, Terraform, šablony ARM).
▪ Poskytuje centrální osvědčené postupy pro zabezpečení pipeline (analýza kódu, správa tajemství).
▪ Pro nasazení úloh použijte centrální architekturu CI/CD a šablony IaC.
▪ Implementujte úlohy nasazení specifické pro úlohy (konfigurace nastavení aplikace, databáze).
▪ Přizpůsobte referenční šablony potřebám úloh při dodržování centrálních pokynů.
Rozvoj ▪ Poskytovat a vynucovat standardizované sady nástrojů a architektury pro urychlení konzistence (standardy kódování, osvědčené postupy DevOps).
▪ Udržujte interní úložiště nebo informační kanály balíčků pro sdílené knihovny nebo moduly.
▪ Přizpůsobte a přizpůsobte standardní sady nástrojů pro vývoj úloh.
▪ Vlastní životní cyklus aplikace a začleňte osvědčené postupy (testování jednotek, testování integrace).
▪ Spravujte průběžné vylepšování základu kódu úlohy.
Monitorování ▪ Plánujte strategii monitorování.
Upozornění na centralizované odpovědnosti
▪ Poskytuje řídicí panely pro běžné provozní metriky v celém prostředí.
▪ Monitorování úloh
▪ Rozšiřte nebo vylaďte centrální výstrahy tak, aby zaznamenávaly podmínky specifické pro úlohy.
▪ Prošetřujte a opravujte incidenty na úrovni úloh na základě výstrah a protokolů.
Náklady ▪ Přidělovat cloudové rozpočty na globální nebo úrovni předplatného
▪ Monitorujte útratu v cloudu pro celou organizaci a vytvářejte sestavy nákladů.
▪ Přidělujte náklady obchodním jednotkám nebo produktům, obvykle pomocí značek nebo vlastních modelů přidělování nákladů.
▪ Použijte strategii označování pro přidělování nákladů.
Návrh pracovní zátěže pro optimalizaci nákladů
▪ Respektovat rozpočtová omezení.
Reliability ▪ Definujte požadavky na spolehlivost (SLO, RPO, RTO) na prioritu úlohy.
▪ Poskytněte pokyny k provozní kontinuitě a zotavení po havárii (BCDR).
▪ Správa centralizovaných řešení zotavení po havárii
▪ Podpora hlavní správy incidentů napříč všemi úlohami
▪ Navrhejte úlohy tak, aby splňovaly požadavky na spolehlivost.
Performance ▪ Monitorujte a udržujte výkon v centralizovaných komponentách (centrální síť, sdílené služby).
▪ Uveďte pokyny pro optimalizaci výkonu a plánování kapacity.
▪ Monitorování využití kvóty
▪ Navrhujte úlohy pro zajištění efektivity výkonu.

Založte své cloudové operace

Pomocí odpovědností uvedených v tabulce 1 vytvořte efektivní provozní základ. Pomocí těchto kroků jasně definujte týmy, standardy a procesy:

  1. Definujte model cloudového provozu. Zvolte centralizovaný, sdílený nebo decentralizovaný cloudový provozní model na základě velikosti a vyspělosti vaší organizace. Pokyny najdete v tématu Volba cloudového provozního modelu.

  2. Přiřaďte odpovědnost za centrální platformu. Vytvořte vyhrazený tým pro zpracování úloh centrální správy. Vytvořte matici dovedností z tabulky 1 , abyste identifikovali požadované odborné znalosti.

  3. Přiřaďte odpovědnosti za úlohy. Nastavte specializované týmy pro úkoly specifické pro danou činnost. Pomocí tabulky 1 identifikujte povinnosti a odpovídajícím způsobem rekrutujte. Využijte Azure Well-Architected Framework a jeho Operational excellence pilíř pro vedení odpovědností za správu úloh.

  4. Přiřaďte odpovědnost. Pojmenujte konkrétní vlastníky pro všechny odpovědnosti za správu cloudu. Ve sdíleném modelu správy by týmy úloh měly mít autonomii pro správu svých předplatných.

Zdokumentujte své cloudové operace.

Jasně zdokumentujte své cloudové operace, abyste umožnili efektivní reakci na krizi a hladké provádění změn. Vytvořte nadlimitní postupy a vytvořte podrobné příručky pro časté a konkrétní úlohy.

Zdokumentovat provozní postupy

Definujte provozní postupy pro správu úloh správy změn, zotavení po havárii a rutinní údržby, které automatizace nedokáže zpracovat. Postupujte následovně:

  1. Definujte postupy správy změn. Změna je hlavní příčinou selhání v cloudu. Vytvořte standardizovaný proces správy změn, abyste se vyhnuli selháním ve vašem cloudovém prostředí. Viz Správa změn.

  2. Definujte postupy nasazení (správa verzí). Pokud chcete zachovat konzistentní konfiguraci, standardizujte nasazení, vydané verze a povýšení prostředí. Viz Správa nasazení.

  3. Definujte postupy zotavení po havárii a provozní kontinuitu. Pro zvládnutí potenciálních selhání připravte standardizovaný plán odezvy. Viz Správa kontinuity provozu a zotavení po havárii.

  4. Definujte další postupy. Zdokumentujte procesy správy žádostí o služby, oprav a správy konfigurace. Jasně zdokumentujte tyto procesy, aby zúčastněné strany věděly, jak zahájit nebo dokončit jednotlivé úkoly.

Zdokumentovat provozní příručky

Vytvořte podrobné návody (runbooky nebo playbooky) pro klíčové provozní úkoly. Tato příprava zajišťuje konzistentní provádění, zlepšuje efektivitu a zkracuje dobu řešení během kritických událostí.

  1. Definujte každodenní úkoly. Připravte si příručky týkající se každodenních zodpovědností, jako jsou žádosti o eskalaci oprávnění a kontroly protokolů. Vytvořte standardní provozní postupy (SOPS) pro monitorování metrik, prahových hodnot výstrah a řídicích panelů pro každý systém.

  2. Vytvořte knihovnu runbooků zaměřených na Azure. Vytvořte runbooky specifické pro Azure, které se zabývají scénáři, například:

    Scenario Example
    Vysoké využití procesoru Správa škálování nahoru v Azure App Service
    Přepnutí při selhání a návrat při obnovení Failover a zpětné obnovení v Azure Site Recovery
    Modrá/zelená nasazení Modré/zelené nasazení v Azure Front Door
    Obnovení zálohy Obnovení zálohy v Azure Blob Storage a Azure Cosmos DB
  3. Tyto runbooky uložte do centrálního úložiště. Udržujte runbooky v centrálním úložišti přístupném technikům na volání pro okamžité použití během incidentů.

  4. Implementujte operace programově. Integrujte infrastrukturu jako kód do runbooků a nasaďte tak běžné prostředky konzistentně a přesně pokaždé.

  5. Zkontrolujte a aktualizujte. Pravidelně kontrolujte a revidujte dokumentaci tak, aby odrážela provozní úpravy a aktualizace cloudových služeb.

Nástroje a řešení dokumentů

Jasná dokumentace zajišťuje konzistenci, snižuje provozní rizika a zvyšuje efektivitu týmu. Vytvářejte a udržujte komplexní dokumentaci pro cloudové nástroje. Pravidelně aktualizujte dokumentaci tak, aby odrážela aktuální postupy a zajistila snadnou přístupnost pro všechny členy týmu.

Area Příklady výhod
Integration Standardizace zjednodušuje integraci sloučením protokolů a úložišť kódu.
Automation Opakovaně používejte šablony IaC napříč týmy, automatizačními skripty a osvědčenými postupy napříč projekty.
Správa incidentů Zachyťte problémy a vygenerujte nápravné akce, které se integrují do cyklů vydaných verzí.

Správa cloudových operací

Efektivní správa cloudu optimalizuje provozní efektivitu, snižuje výpadky a objasňuje role a odpovědnosti. Standardizujte cloudové operace prostřednictvím procesů automatizace a strukturované podpory. Postupujte podle těchto provozních pokynů:

  • Poskytovat nepřetržitou cloudovou podporu. Vytvořte pokrytí podpory 24/7 prostřednictvím globálních týmů, které přijímají model následování slunce nebo strukturované pohotovostní služby. Jasně definujte povinnosti, abyste zajistili včasnou reakci a řešení kritických incidentů. Nakonfigurujte automatizovaná upozornění , která okamžitě upozorní určené pracovníky podpory.

  • Automatizujte opakující se úkoly. Využijte funkcionality automatizace Azure ke snížení ručních procesů a provozní režie. Automatizujte rutinní aktivity, které eliminují chyby, zjednodušují pracovní postupy a umožňují týmům soustředit se na strategické priority.

    Případ použití Examples
    Automation Automatizujte pracovní postupy v systému Azure Boards nebo ITSM. Šablony pro pracovní položky "Žádost o změnu" a "Incident".
    Reakce na incidenty Chcete-li automaticky generovat incidentní lístky s vyplněnými standardními poli, integrujte Azure Monitor a Azure Service Health se systémem hlášení.
    Správa změn Pomocí Azure Logic Apps můžete automaticky schvalovat změny s nízkým rizikem nebo automaticky opravovat určité incidenty.
    Compliance Pomocí Azure Policy vynucujte a monitorujte dodržování předpisů v cloudu.
    Zabezpečení Pomocí Microsoft Defender for Cloud a Microsoft Sentinel automatizujte detekci a reakci na bezpečnostní hrozby. Pomocí Microsoft Entra ID Governance zkontrolujte oprávnění a automatizujte správu oprávnění.

Vylepšení operací

Optimalizujte své Azure cloudové prostředí tím, že podporujete průběžné vylepšování. Pravidelně vyhodnocovat operace a určovat prioritu probíhajícího učení a zpětné vazby. Postupujte následovně:

  1. Zkontrolujte operace, které se mají zlepšit. Při monitorování stavu, dodržování předpisů, zabezpečení, nákladů, dat a cloudových prostředků postupujte podle osvědčených postupů. Proveďte týdenní provozní kontroly a diskutujte o klíčových metrikách, nedávných incidentech, nasazených změnách a očekávaných rizicích. Aktivně řešte neřízené rozrůstání zdrojů a technický dluh.

  2. Trénování pro operace. Podpora průběžného rozvoje dovedností stanovením priority základních výukových zdrojů Udržujte dynamické cloudové operace prostřednictvím praktických trénovacích prostředí. Následující tabulka obsahuje zdroje pro trénování operací.

    Provozní trénování Description
    Získání přihlašovacích údajů Nastavte cíle pro Microsoft certifikace, jako jsou aplikované dovednosti a Microsoft certifikace, abyste si vybudovali odborné znalosti.
    Použití provozních prostředků Viz zdroje pro správu Azure.
    Použití dokumentace k produktu V Microsoft Learn najdete pokyny ke službám Azure.
    Získejte praktické zkušenosti Povzbuďte praktické cvičení v sandboxových neprodukčních prostředích.

prostředky pro správu Azure

Kategorie Prostředek pro správu Description
Compliance Řízení CAF architektura zásad správného řízení v cloudu Microsoft
Zabezpečení Správa operací zabezpečení Pokyny ke správě operací zabezpečení
Zabezpečení nástroj zabezpečení Microsoft Seznam nástrojů zabezpečení Microsoft a Azure
Zabezpečení Zabezpečení úloh Pokyny k úlohám pro zabezpečení
Řízení zdrojů Strategie pojmenování a označování Doporučení pro pojmenování a označování pro správu prostředků
Řízení zdrojů zkratka Azure Seznam zkratek pro Azure zdroje
Řízení zdrojů Azure Advisor Digitální asistent, který je v souladu s Azure osvědčenými postupy.
Řízení zdrojů pravidla pojmenování Azure Pravidla pojmenování pro všechny prostředky Azure
Řízení zdrojů Průvodce službami Azure Pokyny k rozhodování o konfiguraci služeb
Rozvoj Vývoj softwaru pro úlohy Pokyny k úlohám pro vývoj softwaru
Rozvoj Centrum architektury Azure Architektury a příručky pro různé případy použití
Rozvoj Centrum prostředků pro vývojáře Centrum pro vývojářské nástroje a prostředky
Nasazení Bicep, Terraform a šablony ARM Šablony IaC pro každý prostředek Azure
Nasazení páry oblastí Azure Seznam spárovaných oblastí Azure
Nasazení Adresář Azure Cloudových služeb Adresář všech služeb Azure
Nasazení Nasazení úloh Pokyny k úlohám pro kontinuální integraci
Monitorování Monitorujte vaše Azure cloudové prostředí Komplexní pokyny k monitorování Azure
Monitorování Monitorování úloh Pokyny k úlohám pro monitorování
Náklady Správa nákladů Doprovodné materiály ke správě nákladů
Náklady Optimalizace nákladů na úlohy Pokyny k úlohám pro optimalizaci nákladů
Reliability Správa spolehlivosti dat Pokyny pro zachování spolehlivosti dat
Reliability Správa spolehlivosti cloudových prostředků Pokyny k zajištění spolehlivosti prostředků
Reliability Správa incidentů zabezpečení Doporučení pro reakci na incidenty zabezpečení
Performance Efektivita výkonu úloh Pokyny k úlohám pro efektivitu výkonu

Další kroky