Úvod do analýzy škálování cloudu

Analýzy škálování cloudu vycházejí z cílových zón Azure pro snadné nasazení a zásady správného řízení. Hlavním účelem cílové zóny Azure je zajistit, aby v případě, že aplikace nebo úloha přistane do Azure, už byla požadovaná infrastruktura zavedená. Než nasadíte cílovou zónu analýzy škálování cloudu, musíte už mít vytvořenou jednu nebo více cílových zón Azure. Microsoft poskytuje ukázkové šablony, které vám pomůžou začít, které můžete použít pro nasazení data lakehouse a datové sítě . Tyto šablony poskytují flexibilitu a jsou v souladu s požadavky na zabezpečení a zásady správného řízení.

Vyhodnocení analýzy v cloudovém měřítku

Firma často hledá jasné nebo normativní pokyny předtím, než začne vydělovat technické podrobnosti pro konkrétní případ použití, projekt nebo komplexní analýzy cloudového škálování. Vzhledem k tomu, že firma formuluje svou celkovou datovou strategii, může být náročné zajistit, aby zvažuje všechny strategické a požadované principy v rozsahu současného použití.

Aby microsoft urychlil poskytování této ucelené cesty k přehledům a současně s ohledem na tyto výzvy, vyvinul normativní scénář pro analýzy v cloudovém měřítku. Je v souladu s klíčovými tématy probíranými v tématu Vývoj plánu pro analýzy v cloudovém měřítku.

Analýzy v cloudovém měřítku se staví na Cloud Adoption Framework Microsoftu a současně používají architekturu Microsoft Azure Well-Architected Framework. Microsoft Cloud Adoption Framework poskytuje doporučené pokyny a osvědčené postupy týkající se cloudových provozních modelů, referenční architektury a šablon platforem. Je založená na reálných učeních z některých z našich nejnáročnějších, sofistikovaných a nejsložitějších prostředí.

Analýzy škálování na cloud dláždí zákazníkům cestu k vytváření a zprovoznění cílových zón pro hostování a spouštění analytických úloh. Cílové zóny vytváříte na základech zabezpečení, zásad správného řízení a dodržování předpisů. Jsou škálovatelné a modulární a zároveň podporují autonomii a inovace.

Historie architektury dat

Na konci roku 1980 byla zavedena generace 1 datového skladu, která kombinovala různorodé zdroje dat z celého podniku. Na konci roku 2000 přišla generace 2 se zavedením ekosystémů velkých objemů dat, jako je Hadoop a Data Lake. Polovina roku 2010 přinesla cloudovou datovou platformu. Byl podobný předchozím generacím, ale se zavedením streamování příjmu dat, jako jsou architektury kappa nebo lambda. Na počátku roku 2020 byly představeny koncepty datového lakehouse, datové sítě, datových prostředků infrastruktury a provozních vzorů orientovaných na data.

I přes tento pokrok mnoho organizací stále používá centralizovanou monolitickou platformu 1. generace. Tento systém funguje až do určité míry dobře. K kritickým bodům však může dojít kvůli vzájemně závislým procesům, úzce propojeným komponentám a hyperspecializovaným týmům. Úlohy extrakce, transformace a načítání (ETL) se můžou stát výraznými a zpomalovat časové osy doručení.

Datový sklad a data lake jsou stále cenné a hrají důležitou roli v celkové architektuře. V následující dokumentaci jsme zdůraznili některé výzvy, ke kterým může dojít při použití těchto tradičních postupů ke škálování. Tyto výzvy jsou obzvláště důležité ve složité organizaci, kde se mění zdroje dat, požadavky, týmy a výstupy.

Přechod na analýzy škálování na cloud

Vaše aktuální architektura analytických dat a provozní model můžou zahrnovat struktury datového skladu, data lake a data lakehouse nebo dokonce vznikající model, jako jsou datové prostředky infrastruktury nebo datová síť.

Každý datový model má své vlastní výhody a výzvy. Analýzy škálování cloudu vám pomůžou pracovat od aktuálního nastavení a přesunout přístup ke správě dat tak, aby se mohl vyvíjet s vaší infrastrukturou.

Můžete podporovat jakoukoli datovou platformu a scénář a vytvořit tak komplexní architekturu cloudové analýzy, která slouží jako základ a umožňuje škálování.

Moderní datová platforma a požadované výsledky

Jednou z prvních oblastí zájmu je aktivovat datovou strategii, která bude řešit vaše výzvy, a to iterativním vytvářením škálovatelné a agilní moderní datové platformy.

Moderní datová platforma vám místo toho, abyste byli zahlceni lístky služeb a snažili se vyhovět konkurenčním obchodním potřebám, umožňuje vám sehrát konzultnější roli tím, že vám uvolní čas soustředit se na hodnotnější práci. Poskytujete obory podnikání s platformou a systémy pro samoobslužné potřeby dat a analýzy.

Doporučené oblasti počátečního zaměření jsou:

  • Zlepšete kvalitu dat, usnadnit důvěru a získat přehled o obchodních rozhodnutích řízených daty.

  • Bezproblémová implementace holistických dat, správy a analýz ve velkém měřítku v rámci vaší organizace.

  • Zajistěte robustní zásady správného řízení dat, které umožní samoobslužné a flexibilní obchodní činnosti.

  • Udržujte zabezpečení a dodržování právních předpisů v plně integrovaném prostředí.

  • Rychle vytvořte základ pokročilých analytických funkcí s předefinovaným řešením s dobře navrženými, opakovatelnými a modulárními vzory.

Řízení analytického majetku

Druhým aspektem je určit, jak organizace implementuje zásady správného řízení dat.

Zásady správného řízení dat zajišťují, aby data, která používáte ve svých obchodních operacích, sestavách a analýze, byla zjistitelná, přesná, důvěryhodná a chráněná.

U mnoha společností se očekává, že data a AI budou mít konkurenční výhodu. V důsledku toho jsou vedoucí pracovníci dychtiví sponzorovat iniciativy umělé inteligence v jejich odhodlání stát se řízenými daty. Aby se ale AI stala efektivní, musí být data, která používá, důvěryhodná. V opačném případě může dojít k ohrožení přesnosti rozhodování, zpoždění rozhodnutí nebo chybět akce, což může mít vliv na dolní řádek. Společnosti nechtějí, aby kvalita jejich dat byla vyhoděná a vyhoděná. Zpočátku se může zdát jednoduché opravit kvalitu dat, dokud se nepodíte na dopad digitální transformace na data.

S daty rozloženými napříč hybridním multicloudem a distribuovanými daty se organizace obtížně snaží najít, kde se jejich data nacházejí, a řídit je. Neschovaná data můžou mít značný vliv na firmu. Špatná kvalita dat má vliv na obchodní provoz, protože chyby dat způsobují chyby procesů a zpoždění. Nízká kvalita dat má také vliv na obchodní rozhodování a schopnost dodržovat předpisy. Často se upřednostňuje zajištění kvality dat ve zdroji, protože oprava problémů s kvalitou v analytickém systému může být složitější a nákladnější než použití pravidel kvality dat v rané fázi příjmu dat. Pokud chcete usnadnit sledování a řízení datových aktivit, musí zásady správného řízení dat zahrnovat:

  • Zjišťování dat
  • Kvalita dat
  • Vytvoření zásad
  • Sdílení údajů
  • Metadata

Zabezpečení analytického majetku

Dalším důležitým faktorem zásad správného řízení dat je ochrana dat. Ochrana dat vám může pomoct s dodržováním právních předpisů a může zabránit úniku dat. Ochrana osobních údajů a rostoucí počet úniků dat učinila ochranu dat nejvyšší prioritou v řídící síni. Tato porušení zabezpečení zvýrazňují riziko pro citlivá data, jako jsou identifikovatelná zákaznická data. Porušení ochrany osobních údajů nebo narušení zabezpečení dat má mnoho a může zahrnovat:

  • Ztráta nebo vážné poškození image značky

  • Ztráta důvěry zákazníků a tržního podílu

  • Pokles ceny akcií, který ovlivňuje návratnost investic a platy vedoucích pracovníků

  • Závažné finanční sankce za selhání auditu nebo dodržování předpisů

  • Právní kroky

  • Dominový účinek porušení, například zákazníci se mohou stát obětí krádeže identity.

Ve většině případů musí veřejně kótované společnosti tato porušení deklarovat. Pokud dojde k porušení zabezpečení, je pravděpodobnější, že zákazníci budou vinit společnost jako první, a ne hackera. Zákazník může společnost několik měsíců bojkotovat nebo se nemusí nikdy vrátit.

Nedodržení právních předpisů týkajících se ochrany osobních údajů může vést k významným finančním sankcím. Řízení dat vám pomůže vyhnout se takovým rizikům.

Provozní model a výhody

Přechod na moderní platformu pro strategii dat nezmění jenom technologii, kterou vaše organizace používá, ale také způsob, jakým funguje.

Analýzy škálování cloudu poskytují předepsané pokyny, které vám pomůžou zvážit, jak uspořádat a zručnost vašich lidí a týmů, včetně následujících:

  • Definice osob, rolí a odpovědnosti
  • Navrhované struktury pro agilní, vertikální a mezidoménové týmy
  • Zdroje dovedností, včetně certifikací dat Azure a AI prostřednictvím Microsoft Learn

Je také důležité zapojit koncové uživatele během procesu modernizace a s tím, jak budete dál vyvíjet svoji platformu a zapojovat nové případy použití.

Architektury

Cílové zóny Azure představují strategickou cestu návrhu a cílový technický stav vašeho prostředí. Umožňují snadné nasazení a zásady správného řízení a poskytují větší flexibilitu a dodržování předpisů. Cílové zóny Azure také zajišťují, že když do vašeho prostředí přistane nová aplikace nebo úloha, bude už zavedená správná infrastruktura. Správa dat Azure a cílové zóny dat jsou navrženy s ohledem na tyto základní principy a v kombinaci s dalšími prvky analýzy škálování cloudu vám můžou pomoct:

  • Samoobsluha
  • Škálovatelnost
  • Rychlé spuštění
  • Zabezpečení
  • Ochrana osobních údajů
  • Optimalizované operace

Cílová zóna správy dat

Cílová zóna správy dat je základem centralizovaného řízení a správy dat vaší platformy v rámci vaší organizace. Usnadňuje také komunikaci s ingestováním dat z celého digitálního majetku, včetně vícecloudové a hybridní infrastruktury.

Cílová zóna správy dat podporuje řadu dalších funkcí správy a zásad správného řízení dat, jako jsou:

  • Katalog dat
  • Klasifikace dat
  • Rodokmen dat
  • Správa kvality dat
  • Úložiště modelování dat
  • Katalog rozhraní API
  • Sdílení dat a kontrakty

Cílové zóny dat

Cílové zóny dat přibližují data uživatelům a umožňují samoobslužné služby při zachování společné správy a zásad správného řízení prostřednictvím připojení k cílové zóně správy dat.

Hostují standardní služby, jako jsou sítě, monitorování, příjem a zpracování dat, a také přizpůsobení, jako jsou datové produkty a vizualizace.

Cílové zóny dat jsou klíčem k zajištění škálovatelnosti vaší platformy. V závislosti na velikosti a potřebách vaší organizace můžete začít s jednou nebo několika cílovými zónami.

Při rozhodování mezi jednou a více cílovými zónami zvažte regionální závislosti a požadavky na rezidenci dat. Existují například místní zákony nebo předpisy, které vyžadují, aby data zůstala na určitém místě?

Bez ohledu na vaše počáteční rozhodnutí můžete podle potřeby přidávat nebo odebírat cílové zóny dat. Pokud začínáte s jednou cílovou zónou, doporučujeme naplánovat rozšíření na několik cílových zón, abyste se v budoucnu vyhnuli migraci.

Další informace o cílových zónách najdete v tématu Cílové zóny Azure pro analýzy škálování cloudu.

Závěr

Po přečtení této sady dokumentace, zejména částí zásad správného řízení, zabezpečení, provozu a osvědčených postupů, doporučujeme nastavit prostředí pro testování konceptu pomocí šablon nasazení. Tyto šablony spolu s pokyny k architektuře poskytují praktické zkušenosti s některými technologiemi Azure. Další informace najdete v kontrolním seznamu Začínáme.

Další kroky

Integrace analýz škálování na cloud do strategie přechodu na cloud