Architektura pokročilé analýzy

Analysis Services
Blob Storage
Azure Cosmos DB
Synapse Analytics
Power BI

Nápady na řešení

Tento článek je nápadem na řešení. Pokud chcete, abychom obsah rozšířili o další informace, jako jsou potenciální případy použití, alternativní služby, aspekty implementace nebo pokyny k cenám, dejte nám vědět prostřednictvím zpětné vazby na GitHubu.

Tato architektura umožňuje kombinovat jakákoli data v libovolném měřítku s vlastním strojovým učením a získat analýzy dat téměř v reálném čase ve streamovacích službách.

Architektura

Diagram architektury pokročilých analýz využívající Azure Synapse Analytics s Azure Data Lake Storage Gen2, Azure Analysis Services, Azure Cosmos DB a Power BI

Stáhněte si soubor aplikace Visio s touto architekturou.

Tok dat

  1. Spojte všechna strukturovaná, nestrukturovaná a částečně strukturovaná data (protokoly, soubory a média) pomocí synapse Pipelines k Azure Data Lake Storage.
  2. Pomocí fondů Apache Sparku můžete vyčistit a transformovat datové sady bez struktury a kombinovat je se strukturovanými daty z provozních databází nebo datových skladů.
  3. Využijte škálovatelné techniky strojového/hlubokého učení, abyste z těchto dat získali hlubší přehledy pomocí Pythonu, Scaly nebo .NET a prostředí poznámkových bloků ve fondu Apache Spark.
  4. Použití fondu Apache Sparku a kanálů Synapse v Azure Synapse Analytics pro přístup k datům a jejich přesun ve velkém měřítku
  5. Dotazování a generování sestav dat v Power BI
  6. Převezměte přehledy z fondů Apache Sparku do služby Azure Cosmos DB a zpřístupněte je prostřednictvím webových a mobilních aplikací.

Pracovní postup

  • Azure Synapse Analytics je rychlý, flexibilní a důvěryhodný cloudový datový sklad, který umožňuje škálovat, počítat a ukládat elasticky a nezávisle s architekturou masivně paralelního zpracování.
  • Dokumentace ke službě Synapse Pipelines umožňuje vytvářet, plánovat a orchestrovat pracovní postupy ETL/ELT.
  • Azure Blob Storage je široce škálovatelné úložiště objektů pro jakýkoli typ nestrukturovaných obrázků dat, videí, zvuku, dokumentů a snadněji a cenově výhodněji.
  • Fondy Sparku pro Azure Synapse Analytics jsou rychlá, snadná analytická platforma založená na Apache Sparku a spolupráce.
  • Azure Cosmos DB je globálně distribuovaná databázová služba pro více modelů. Zjistěte, jak replikovat data do libovolného počtu oblastí Azure a škálovat propustnost nezávisle na vašem úložišti.
  • Azure Synapse Link pro Azure Cosmos DB umožňuje spouštět analýzy provozních dat ve službě Azure Cosmos DB téměř v reálném čase bez jakéhokoli dopadu na výkon nebo náklady na transakční úlohy, a to pomocí dvou analytických modulů, které jsou k dispozici ve vašem pracovním prostoru Azure Synapse: bezserverového SYSTÉMU SQL a fondů sparků.
  • Azure Analysis Services je analýza na podnikové úrovni jako služba, která umožňuje řídit, nasazovat, testovat a dodávat řešení BI s jistotou.
  • Power BI je sada nástrojů pro obchodní analýzu, které poskytují přehledy v celé organizaci. Připojte se ke stovkám zdrojů dat, zjednodušte přípravu dat a využijte neplánovanou analýzu. Vytvořte krásné sestavy a pak je publikujte, aby je vaše organizace využívala na webu a na mobilních zařízeních.

Alternativy

  • Synapse Link je upřednostňovaným řešením Microsoftu pro analýzy nad rámec dat služby Azure Cosmos DB.

Podrobnosti scénáře

Transformujte svá data na užitečné přehledy pomocí nejlepších nástrojů strojového učení ve své třídě. Toto řešení umožňuje kombinovat veškerá data v libovolném měřítku a vytvářet a nasazovat vlastní modely strojového učení ve velkém měřítku. Informace o tom, jak jsou datové platformy na podnikové úrovni navrženy jako součást podnikové cílové zóny, najdete v dokumentaci k cílové zóně dat Cloud Adoption Framework.

Potenciální případy použití

Organizace mají možnost přistupovat k více datům než kdy dřív. Pokročilé analýzy pomáhají využívat přehledy dat. Mezi tyto oblasti patří:

  • Služby zákazníkům.
  • Prediktivní údržba:
  • Doporučování produktů nebo služeb.
  • Systémová optimalizace všeho od dodavatelských řetězců až po provoz datových center.
  • Vývoj produktů a služeb.

Požadavky

Optimalizace nákladů

Optimalizace nákladů spočívá v hledání způsobů, jak snížit zbytečné výdaje a zlepšit provozní efektivitu. Další informace najdete v tématu Přehled pilíře optimalizace nákladů.

Další kroky

Informace o službách uvedených v této architektuře najdete v následující dokumentaci: