Pomysły dotyczące rozwiązań
Ten artykuł jest pomysłem na rozwiązanie. Jeśli chcesz, abyśmy rozszerzyli zawartość o więcej informacji, takich jak potencjalne przypadki użycia, alternatywne usługi, zagadnienia dotyczące implementacji lub wskazówki dotyczące cen, daj nam znać, przekazując opinię w usłudze GitHub.
Ta architektura umożliwia łączenie dowolnych danych na dowolnej skali z niestandardowym uczeniem maszynowym i uzyskiwanie analizy danych niemal w czasie rzeczywistym w usługach przesyłania strumieniowego.
Architektura
Pobierz plik programu Visio z tą architekturą.
Przepływ danych
- Połącz wszystkie dane ustrukturyzowane, nieustrukturyzowane i częściowo ustrukturyzowane (dzienniki, pliki i nośniki) przy użyciu potoków usługi Synapse w celu Azure Data Lake Storage.
- Używaj pul platformy Apache Spark do czyszczenia i przekształcania bez struktury zestawów danych i łączenia ich ze strukturą z operacyjnych baz danych lub magazynów danych.
- Użyj skalowalnych technik uczenia maszynowego/uczenia głębokiego, aby uzyskać szczegółowe informacje na podstawie tych danych przy użyciu języka Python, języka Scala lub platformy .NET z środowiskami notesów w puli platformy Apache Spark.
- Zastosuj pulę platformy Apache Spark i potoki usługi Synapse w usłudze Azure Synapse Analytics, aby uzyskać dostęp do danych i przenieść je na dużą skalę.
- Wykonywanie zapytań i raportów dotyczących danych w usłudze Power BI.
- Zapoznaj się ze szczegółowymi informacjami z pul platformy Apache Spark do usługi Azure Cosmos DB, aby udostępnić je za pośrednictwem aplikacji internetowych i mobilnych.
Przepływ pracy
- Azure Synapse Analytics to szybki, elastyczny i zaufany magazyn danych w chmurze, który umożliwia elastyczne i niezależne skalowanie, obliczenia i przechowywanie w sposób elastyczny i niezależny dzięki architekturze masowego przetwarzania równoległego.
- Dokumentacja potoków usługi Synapse umożliwia tworzenie, planowanie i organizowanie przepływów pracy ETL/ELT.
- Usługa Azure Blob Storage to wysoce skalowalny magazyn obiektów dla dowolnego typu obrazów danych bez struktury, filmów wideo, audio, dokumentów i łatwiejszego i ekonomicznego.
- Azure Synapse Analytics Spark pule platformy Spark to szybka, łatwa i oparta na współpracy platforma analizy platformy Apache Spark.
- Azure Cosmos DB to globalnie rozproszona, wielomodelowa usługa bazy danych. Dowiedz się, jak replikować dane w dowolnej liczbie regionów platformy Azure i skalować przepływność niezależnie od magazynu.
- Azure Synapse Link dla usługi Azure Cosmos DB umożliwia uruchamianie analizy niemal w czasie rzeczywistym na danych operacyjnych w usłudze Azure Cosmos DB bez wpływu na wydajność lub koszt obciążenia transakcyjnego przy użyciu dwóch aparatów analitycznych dostępnych w obszarze roboczym Azure Synapse: SQL Serverless i Spark Pools.
- Azure Analysis Services to analiza klasy korporacyjnej jako usługa, która umożliwia zarządzanie, wdrażanie, testowanie i dostarczanie rozwiązania analizy biznesowej z ufnością.
- Usługa Power BI to zestaw narzędzi do analizy biznesowej, które dostarczają szczegółowe informacje w całej organizacji. Nawiąż połączenie z setkami źródeł danych, upraszczaj przygotowywanie danych i nieplanowaną analizę. Tworzenie pięknych raportów, a następnie publikowanie ich w organizacji w celu korzystania z internetu i urządzeń przenośnych.
Alternatywy
- Synapse Link jest preferowanym rozwiązaniem firmy Microsoft do analizy danych usługi Azure Cosmos DB.
Szczegóły scenariusza
Przekształć dane w szczegółowe informacje umożliwiające podejmowanie działań przy użyciu najlepszych w swojej klasie narzędzi uczenia maszynowego. To rozwiązanie umożliwia łączenie dowolnych danych na dowolnej skali oraz tworzenie i wdrażanie niestandardowych modeli uczenia maszynowego na dużą skalę. Aby dowiedzieć się, jak platformy danych w skali przedsiębiorstwa są zaprojektowane w ramach strefy docelowej przedsiębiorstwa, zapoznaj się z dokumentacją strefy docelowej Cloud Adoption Framework Dane.
Potencjalne przypadki użycia
Organizacje mają możliwość uzyskiwania dostępu do większej ilości danych niż kiedykolwiek wcześniej. Zaawansowana analiza ułatwia korzystanie ze szczegółowych informacji o danych. Obszary obejmują:
- Obsługa klienta.
- Konserwacja predykcyjna.
- Polecanie produktów lub usług.
- Optymalizacja systemu od łańcuchów dostaw po operacje centrum danych.
- Opracowywanie produktów i usług.
Zagadnienia do rozważenia
Optymalizacja kosztów
Optymalizacja kosztów dotyczy sposobów zmniejszenia niepotrzebnych wydatków i poprawy wydajności operacyjnej. Aby uzyskać więcej informacji, zobacz Omówienie filaru optymalizacji kosztów.
Następne kroki
- Dowiedz się więcej o projektowaniu platformy danych w skali przedsiębiorstwa
- Dowiedz się, jak projektować i wdrażać kompleksową platformę analizy danych
Zapoznaj się z następującą dokumentacją dotyczącą usług opisanych w tej architekturze:
- Dokumentacja usługi Synapse Analytics
- Dokumentacja potoków usługi Synapse
- Wprowadzenie do magazynu obiektów na platformie Azure
- pule platformy Spark usługi Azure Synapse Analytics
- Dokumentacja usługi Azure Cosmos DB
- Dokumentacja usług Analysis Services
- Dokumentacja usługi Power BI
Powiązane zasoby
- Zabezpieczanie usługi Data Lakehouse przy użyciu usługi Azure Synapse Analytics
- Analizowanie danych operacyjnych w usłudze MongoDB Atlas przy użyciu usługi Azure Synapse Analytics
- Analiza danych big data z zabezpieczeniami klasy korporacyjnej przy użyciu Azure Synapse
- Analiza danych spaceborne za pomocą usługi Azure Synapse Analytics
- Kompleksowa analiza z Azure Synapse