Zaawansowana architektura analizy

Azure Analysis Services
Azure Blob Storage
Azure Cosmos DB
Azure Synapse Analytics
Power BI

Pomysły dotyczące rozwiązań

W tym artykule opisano pomysł rozwiązania. Architekt chmury może użyć tych wskazówek, aby ułatwić wizualizowanie głównych składników dla typowej implementacji tej architektury. Skorzystaj z tego artykułu jako punktu wyjścia, aby zaprojektować dobrze zaprojektowane rozwiązanie zgodne z konkretnymi wymaganiami obciążenia.

Ta architektura umożliwia łączenie dowolnych danych w dowolnej skali z niestandardowym uczeniem maszynowym i uzyskiwanie analizy danych niemal w czasie rzeczywistym w usługach przesyłania strumieniowego.

Architektura

Diagram architektury zaawansowanej analizy przy użyciu usługi Azure Synapse Analytics z usługami Azure Data Lake Storage, Azure Analysis Services, Azure Cosmos DB i Power BI.

Pobierz plik programu Visio z tą architekturą.

Przepływ danych

  1. Połącz wszystkie dane ustrukturyzowane, nieustrukturyzowane i częściowo ustrukturyzowane (dzienniki, pliki i nośniki) przy użyciu usługi Synapse Pipelines do usługi Azure Data Lake Storage.
  2. Pule platformy Apache Spark umożliwiają czyszczenie i przekształcanie bez struktury zestawów danych oraz łączenie ich ze strukturą z operacyjnych baz danych lub magazynów danych.
  3. Użyj skalowalnych technik uczenia maszynowego/uczenia głębokiego, aby uzyskać bardziej szczegółowe informacje na podstawie tych danych przy użyciu języka Python, języka Scala lub platformy .NET z środowiskami notesów w puli platformy Apache Spark.
  4. Stosowanie puli platformy Apache Spark i potoków synapse w usłudze Azure Synapse Analytics w celu uzyskiwania dostępu do danych i przenoszenia ich na dużą skalę.
  5. Wykonywanie zapytań i raportowanie danych w usłudze Power BI.
  6. Skorzystaj ze szczegółowych informacji z pul platformy Apache Spark do usługi Azure Cosmos DB, aby udostępnić je za pośrednictwem aplikacji internetowych i mobilnych.

Przepływ pracy

  • Usługa Azure Synapse Analytics to szybki, elastyczny i zaufany magazyn danych w chmurze, który pozwala skalować, obliczać i przechowywać elastycznie i niezależnie przy użyciu architektury masowego przetwarzania równoległego.
  • Dokumentacja usługi Synapse Pipelines umożliwia tworzenie, planowanie i organizowanie przepływów pracy ETL/ELT.
  • Azure Blob Storage to wysoce skalowalny magazyn obiektów dla dowolnego typu obrazów danych bez struktury, wideo, audio, dokumentów i łatwiejszego i ekonomicznego.
  • Pule platformy Spark usługi Azure Synapse Analytics to szybka, łatwa i wspólna platforma analizy oparta na platformie Apache Spark.
  • Azure Cosmos DB to globalnie rozproszona, wielomodelowa usługa bazy danych. Dowiedz się, jak replikować dane w dowolnej liczbie regionów świadczenia usługi Azure i skalować przepływność niezależnie od magazynu.
  • Usługa Azure Synapse Link dla usługi Azure Cosmos DB umożliwia uruchamianie analizy niemal w czasie rzeczywistym na danych operacyjnych w usłudze Azure Cosmos DB bez wpływu na wydajność i koszt obciążenia transakcyjnego przy użyciu dwóch aparatów analitycznych dostępnych w obszarze roboczym usługi Azure Synapse: SQL Serverless i Spark Pools.
  • Azure Analysis Services to analiza klasy korporacyjnej jako usługa, która umożliwia zarządzanie, wdrażanie, testowanie i dostarczanie rozwiązania analizy biznesowej z pewnością.
  • Usługa Power BI to zestaw narzędzi do analizy biznesowej, które zapewniają wgląd w szczegółowe informacje w całej organizacji. Nawiąż połączenie z setkami źródeł danych, uprość przygotowywanie danych i nieplanowaną analizę. Twórz piękne raporty, a następnie publikuj je, aby inne osoby w organizacji mogły skorzystać z nich w Internecie lub na swoich urządzeniach przenośnych.

Alternatywy

  • Usługa Synapse Link to preferowane przez firmę Microsoft rozwiązanie do analizy danych usługi Azure Cosmos DB.

Szczegóły scenariusza

Przekształcaj dane w szczegółowe informacje wskazujące czynności do wykonania przy użyciu najlepszych w swojej klasie narzędzi do uczenia maszynowego. To rozwiązanie umożliwia łączenie dowolnych danych na dowolnej skali oraz tworzenie i wdrażanie niestandardowych modeli uczenia maszynowego na dużą skalę. Aby dowiedzieć się, w jaki sposób platformy danych w skali przedsiębiorstwa są projektowane w ramach strefy docelowej przedsiębiorstwa, zapoznaj się z dokumentacją dotyczącą strefy docelowej danych przewodnika Cloud Adoption Framework.

Potencjalne przypadki użycia

Organizacje mają możliwość uzyskiwania dostępu do większej ilości danych niż kiedykolwiek wcześniej. Zaawansowana analiza ułatwia korzystanie ze szczegółowych informacji o danych. Obszary obejmują:

  • Obsługa klienta.
  • Konserwacja predykcyjna.
  • Polecanie produktów lub usług.
  • Optymalizacja systemu wszystkich elementów— od łańcuchów dostaw po operacje centrów danych.
  • Opracowywanie produktów i usług.

Kwestie wymagające rozważenia

Optymalizacja kosztów

Optymalizacja kosztów dotyczy sposobów zmniejszenia niepotrzebnych wydatków i poprawy wydajności operacyjnej. Aby uzyskać więcej informacji, zobacz Omówienie filaru optymalizacji kosztów.

Następne kroki

  • Dowiedz się więcej o projekcie platformy danych w skali przedsiębiorstwa
  • Dowiedz się, jak projektować i wdrażać kompleksową platformę analizy danych

Zapoznaj się z następującą dokumentacją dotyczącą usług polecanych w tej architekturze: