Architektura pokročilé analýzy

Azure Analysis Services
Azure Blob Storage
Azure Cosmos DB
Azure Synapse Analytics
Power BI

Návrhy řešení

Tento článek je nápadem na řešení. Pokud chcete, abychom obsah rozšířili o další informace, jako jsou potenciální případy použití, alternativní služby, aspekty implementace nebo pokyny k cenám, dejte nám vědět tím, že nám poskytnete zpětnou vazbu na GitHubu.

Tato architektura umožňuje kombinovat jakákoli data v libovolném měřítku s vlastním strojovém učením a získat analýzu dat téměř v reálném čase ve streamovacích službách.

Architektura

Diagram architektury pokročilé analýzy využívající Azure Synapse Analytics s Azure Data Lake Storage, Azure Analysis Services, Azure Cosmos DB a Power BI

Stáhněte si soubor aplikace Visio s touto architekturou.

Tok dat

  1. Spojte všechna strukturovaná, nestrukturovaná a částečně strukturovaná data (protokoly, soubory a multimédia) pomocí kanálů Synapse k Azure Data Lake Storage.
  2. Pomocí fondů Apache Sparku můžete vyčistit a transformovat datové sady bez struktury a kombinovat je se strukturovanými daty z provozních databází nebo datových skladů.
  3. Pomocí škálovatelných technik strojového učení nebo hlubokého učení můžete z těchto dat získat podrobnější přehledy pomocí Pythonu, Scaly nebo .NET s prostředím poznámkových bloků ve fondu Apache Sparku.
  4. Použití fondu Apache Sparku a kanálů Synapse v Azure Synapse Analytics pro přístup k datům a jejich přesun ve velkém měřítku
  5. Dotazování a generování sestav dat v Power BI
  6. Využijte přehledy z fondů Apache Sparku do služby Azure Cosmos DB a zpřístupněte je prostřednictvím webových a mobilních aplikací.

Pracovní postup

  • Azure Synapse Analytics je rychlý, flexibilní a důvěryhodný cloudový datový sklad, který umožňuje škálovat, provádět výpočty a ukládat elasticky a nezávisle s architekturou masivního paralelního zpracování.
  • Dokumentace ke službě Synapse Pipelines umožňuje vytvářet, plánovat a orchestrovat pracovní postupy ETL/ELT.
  • Azure Blob Storage je masivně škálovatelné úložiště objektů pro jakýkoli typ nestrukturovaných obrázků dat, videí, zvuku, dokumentů a jednodušších a cenově výhodnějších.
  • Azure Synapse analytics fondy Sparku jsou rychlá, snadná a spolupracující analytická platforma založená na Apache Sparku.
  • Azure Cosmos DB je globálně distribuovaná databázová služba s více modely. Zjistěte, jak replikovat data do libovolného počtu oblastí Azure a škálovat propustnost nezávisle na úložišti.
  • Azure Synapse Link pro Azure Cosmos DB umožňuje spouštět analýzy provozních dat ve službě Azure Cosmos DB téměř v reálném čase bez dopadu na výkon nebo náklady na transakční úlohy pomocí dvou analytických modulů, které jsou k dispozici z pracovního prostoru Azure Synapse: bezserverové fondy SQL a fondy Sparku.
  • Azure Analysis Services je analýza na podnikové úrovni jako služba, která umožňuje řídit, nasazovat, testovat a poskytovat řešení BI s jistotou.
  • Power BI je sada nástrojů pro obchodní analýzu, které poskytují přehledy v celé organizaci. Připojte se ke stovkám zdrojů dat, zjednodušte přípravu dat a využijte neplánované analýzy. Vytvořte krásné sestavy a pak je publikujte, aby je vaše organizace využívala na webu a na mobilních zařízeních.

Alternativy

  • Synapse Link je upřednostňovaným řešením Microsoftu pro analýzu dat služby Azure Cosmos DB.

Podrobnosti scénáře

Transformujte data na užitečné přehledy pomocí nejlepších nástrojů strojového učení ve své třídě. Toto řešení umožňuje kombinovat všechna data v libovolném měřítku a vytvářet a nasazovat vlastní modely strojového učení ve velkém měřítku. Informace o tom, jak jsou datové platformy na podnikové úrovni navrženy jako součást cílové zóny podniku, najdete v dokumentaci k cílové zóně Cloud Adoption Framework Data.

Potenciální případy použití

Organizace mají přístup k více datům než kdy dřív. Pokročilé analýzy pomáhají využívat přehledy dat. Mezi oblasti patří:

  • Služby zákazníkům.
  • Prediktivní údržba.
  • Doporučování produktů nebo služeb
  • Optimalizace systému pro všechno od dodavatelských řetězců až po provoz datacentra.
  • Vývoj produktů a služeb.

Požadavky

Optimalizace nákladů

Optimalizace nákladů spočívá v hledání způsobů, jak snížit zbytečné náklady a zlepšit provozní efektivitu. Další informace najdete v tématu Přehled pilíře optimalizace nákladů.

Další kroky

Informace o službách uvedených v této architektuře najdete v následující dokumentaci: