Architektura zaawansowanej analizy

Azure Analysis Services
Azure Blob Storage
Azure Cosmos DB
Azure Synapse Analytics
Power BI

Pomysły dotyczące rozwiązań

Ten artykuł jest pomysłem na rozwiązanie. Jeśli chcesz, abyśmy rozszerzyli zawartość o więcej informacji, takich jak potencjalne przypadki użycia, alternatywne usługi, zagadnienia dotyczące implementacji lub wskazówki dotyczące cen, daj nam znać, przekazując opinię w usłudze GitHub.

Ta architektura umożliwia łączenie dowolnych danych na dowolnej skali z niestandardowym uczeniem maszynowym i uzyskiwanie analizy danych niemal w czasie rzeczywistym w usługach przesyłania strumieniowego.

Architektura

Diagram przedstawiający zaawansowaną architekturę analizy przy użyciu usługi Azure Synapse Analytics z usługami Azure Data Lake Storage, Azure Analysis Services, Azure Cosmos DB i Power BI.

Pobierz plik programu Visio z tą architekturą.

Przepływ danych

  1. Połącz wszystkie dane ustrukturyzowane, nieustrukturyzowane i częściowo ustrukturyzowane (dzienniki, pliki i nośniki) przy użyciu potoków usługi Synapse w celu Azure Data Lake Storage.
  2. Używaj pul platformy Apache Spark do czyszczenia i przekształcania bez struktury zestawów danych i łączenia ich ze strukturą z operacyjnych baz danych lub magazynów danych.
  3. Użyj skalowalnych technik uczenia maszynowego/uczenia głębokiego, aby uzyskać szczegółowe informacje na podstawie tych danych przy użyciu języka Python, języka Scala lub platformy .NET z środowiskami notesów w puli platformy Apache Spark.
  4. Zastosuj pulę platformy Apache Spark i potoki usługi Synapse w usłudze Azure Synapse Analytics, aby uzyskać dostęp do danych i przenieść je na dużą skalę.
  5. Wykonywanie zapytań i raportów dotyczących danych w usłudze Power BI.
  6. Zapoznaj się ze szczegółowymi informacjami z pul platformy Apache Spark do usługi Azure Cosmos DB, aby udostępnić je za pośrednictwem aplikacji internetowych i mobilnych.

Przepływ pracy

  • Azure Synapse Analytics to szybki, elastyczny i zaufany magazyn danych w chmurze, który umożliwia elastyczne i niezależne skalowanie, obliczenia i przechowywanie w sposób elastyczny i niezależny dzięki architekturze masowego przetwarzania równoległego.
  • Dokumentacja potoków usługi Synapse umożliwia tworzenie, planowanie i organizowanie przepływów pracy ETL/ELT.
  • Usługa Azure Blob Storage to wysoce skalowalny magazyn obiektów dla dowolnego typu obrazów danych bez struktury, filmów wideo, audio, dokumentów i łatwiejszego i ekonomicznego.
  • Azure Synapse Analytics Spark pule platformy Spark to szybka, łatwa i oparta na współpracy platforma analizy platformy Apache Spark.
  • Azure Cosmos DB to globalnie rozproszona, wielomodelowa usługa bazy danych. Dowiedz się, jak replikować dane w dowolnej liczbie regionów platformy Azure i skalować przepływność niezależnie od magazynu.
  • Azure Synapse Link dla usługi Azure Cosmos DB umożliwia uruchamianie analizy niemal w czasie rzeczywistym na danych operacyjnych w usłudze Azure Cosmos DB bez wpływu na wydajność lub koszt obciążenia transakcyjnego przy użyciu dwóch aparatów analitycznych dostępnych w obszarze roboczym Azure Synapse: SQL Serverless i Spark Pools.
  • Azure Analysis Services to analiza klasy korporacyjnej jako usługa, która umożliwia zarządzanie, wdrażanie, testowanie i dostarczanie rozwiązania analizy biznesowej z ufnością.
  • Usługa Power BI to zestaw narzędzi do analizy biznesowej, które dostarczają szczegółowe informacje w całej organizacji. Nawiąż połączenie z setkami źródeł danych, upraszczaj przygotowywanie danych i nieplanowaną analizę. Tworzenie pięknych raportów, a następnie publikowanie ich w organizacji w celu korzystania z internetu i urządzeń przenośnych.

Alternatywy

  • Synapse Link jest preferowanym rozwiązaniem firmy Microsoft do analizy danych usługi Azure Cosmos DB.

Szczegóły scenariusza

Przekształć dane w szczegółowe informacje umożliwiające podejmowanie działań przy użyciu najlepszych w swojej klasie narzędzi uczenia maszynowego. To rozwiązanie umożliwia łączenie dowolnych danych na dowolnej skali oraz tworzenie i wdrażanie niestandardowych modeli uczenia maszynowego na dużą skalę. Aby dowiedzieć się, jak platformy danych w skali przedsiębiorstwa są zaprojektowane w ramach strefy docelowej przedsiębiorstwa, zapoznaj się z dokumentacją strefy docelowej Cloud Adoption Framework Dane.

Potencjalne przypadki użycia

Organizacje mają możliwość uzyskiwania dostępu do większej ilości danych niż kiedykolwiek wcześniej. Zaawansowana analiza ułatwia korzystanie ze szczegółowych informacji o danych. Obszary obejmują:

  • Obsługa klienta.
  • Konserwacja predykcyjna.
  • Polecanie produktów lub usług.
  • Optymalizacja systemu od łańcuchów dostaw po operacje centrum danych.
  • Opracowywanie produktów i usług.

Zagadnienia do rozważenia

Optymalizacja kosztów

Optymalizacja kosztów dotyczy sposobów zmniejszenia niepotrzebnych wydatków i poprawy wydajności operacyjnej. Aby uzyskać więcej informacji, zobacz Omówienie filaru optymalizacji kosztów.

Następne kroki

Zapoznaj się z następującą dokumentacją dotyczącą usług opisanych w tej architekturze: