Azure Cosmos DB: przypadki użycia analizy no-ETL
DOTYCZY: NoSQL MongoDB Gremlin
Usługa Azure Cosmos DB oferuje różne opcje analizy dla analizy bez etL, niemal w czasie rzeczywistym na danych operacyjnych. Analizę danych usługi Azure Cosmos DB można włączyć przy użyciu następujących opcji:
- Dublowanie usługi Azure Cosmos DB w usłudze Microsoft Fabric
- Usługa Azure Synapse Link dla usługi Azure Cosmos DB
Aby dowiedzieć się więcej o tych opcjach, zobacz "Analiza i analiza biznesowej w danych usługi Azure Cosmos DB".
Ważne
Dublowanie usługi Azure Cosmos DB w usłudze Microsoft Fabric jest teraz dostępne w wersji zapoznawczej dla interfejsu API NoSql. Ta funkcja zapewnia wszystkie możliwości usługi Azure Synapse Link z lepszą wydajnością analityczną, możliwość ujednolicenia majątku danych za pomocą usługi Fabric OneLake i otwierania dostępu do danych w usłudze OneLake w formacie Delta Parquet. Jeśli rozważasz usługę Azure Synapse Link, zalecamy wypróbowanie dublowania w celu oceny ogólnego dopasowania organizacji. Aby rozpocząć dublowanie, kliknij tutaj.
Analiza niemal w czasie rzeczywistym nie może otwierać różnych możliwości dla Twoich firm. Oto trzy przykładowe scenariusze:
- Analiza łańcucha dostaw, prognozowanie i raportowanie
- Personalizacja w czasie rzeczywistym
- Konserwacja predykcyjna, wykrywanie anomalii w scenariuszach IOT
Analiza łańcucha dostaw, prognozowanie i raportowanie
Badania naukowe pokazują, że osadzanie analizy danych big data w operacjach łańcucha dostaw prowadzi do ulepszeń w czasie dostarczania w kolejności do cyklu i wydajności łańcucha dostaw.
Producenci dołączają do technologii natywnych dla chmury, aby przełamać ograniczenia starszych systemów planowania zasobów przedsiębiorstwa (ERP) i zarządzania łańcuchem dostaw (SCM). W przypadku łańcuchów dostaw generujących coraz większe ilości danych operacyjnych co minutę (zamówienie, przesyłka, dane transakcji) producenci potrzebują operacyjnej bazy danych. Ta operacyjna baza danych powinna być skalowana w celu obsługi woluminów danych, a także platformy analitycznej, aby uzyskać poziom analizy kontekstowej w czasie rzeczywistym, aby wyprzedzać krzywą.
Poniższa architektura przedstawia możliwości korzystania z usługi Azure Cosmos DB jako natywnej dla chmury operacyjnej bazy danych w analizie łańcucha dostaw:
Na podstawie poprzedniej architektury można uzyskać następujące przypadki użycia:
- Przygotowywanie i trenowanie potoku predykcyjnego: generowanie szczegółowych informacji na temat danych operacyjnych w łańcuchu dostaw przy użyciu tłumaczenia uczenia maszynowego. Dzięki temu można obniżyć koszty zapasów, operacji i skrócić czas realizacji zamówień dla klientów.
Dublowanie i usługa Synapse Link umożliwiają analizowanie zmieniających się danych operacyjnych w usłudze Azure Cosmos DB bez ręcznych procesów ETL. Te oferty pozwalają zaoszczędzić na dodatkowych kosztach, opóźnieniach i złożoności operacyjnej. Umożliwiają inżynierom danych i analitykom danych tworzenie niezawodnych potoków predykcyjnych:
Wykonywanie zapytań dotyczących danych operacyjnych z usługi Azure Cosmos DB przy użyciu natywnej integracji z pulami platformy Apache Spark w usłudze Microsoft Fabric lub Azure Synapse Analytics. Dane można wykonywać w notesie interaktywnym lub zaplanowanych zadaniach zdalnych bez złożonej inżynierii danych.
Tworzenie modeli uczenia maszynowego (ML) przy użyciu algorytmów spark ML i integracji usługi Azure Machine Learning (AML) w usłudze Microsoft Fabric lub Azure Synapse Analytics.
Odnotuj wyniki po wnioskowaniu modelu w usłudze Azure Cosmos DB w celu uzyskania operacyjnego oceniania niemal w czasie rzeczywistym.
Raportowanie operacyjne: zespoły łańcucha dostaw potrzebują elastycznych i niestandardowych raportów w czasie rzeczywistym, dokładnych danych operacyjnych. Te raporty są wymagane do uzyskania migawki widoku skuteczności łańcucha dostaw, rentowności i produktywności. Umożliwia ona analitykom danych i innym kluczowym uczestnikom projektu ciągłe ponowne ocenianie firmy i identyfikowanie obszarów w celu zmniejszenia kosztów operacyjnych.
Dublowanie i usługa Synapse Link dla usługi Azure Cosmos DB umożliwiają zaawansowane scenariusze analizy biznesowej (BI)/raportowania:
Wykonywanie zapytań dotyczących danych operacyjnych z usługi Azure Cosmos DB przy użyciu natywnej integracji z pełną ekspresyjnością języka T-SQL.
Modelowanie i publikowanie automatycznie odświeżanych pulpitów nawigacyjnych analizy biznesowej w usłudze Azure Cosmos DB za pośrednictwem usługi Power BI zintegrowanej z usługą Microsoft Fabric lub Azure Synapse Analytics.
Poniżej przedstawiono wskazówki dotyczące integracji danych dla danych wsadowych i przesyłanych strumieniowo do usługi Azure Cosmos DB:
Integracja i aranżacja danych wsadowych: łańcuchy dostaw coraz bardziej złożone, platformy danych łańcucha dostaw muszą być zintegrowane z różnymi źródłami danych i formatami. Usługi Microsoft Fabric i Azure Synapse są wbudowane z tym samym aparatem integracji danych i środowiskami co usługa Azure Data Factory. Ta integracja umożliwia inżynierom danych tworzenie rozbudowanych potoków danych bez oddzielnego aparatu aranżacji:
Przenoszenie danych z 85+ obsługiwanych źródeł danych do usługi Azure Cosmos DB za pomocą usługi Azure Data Factory.
Pisanie potoków ETL bez kodu w usłudze Azure Cosmos DB, w tym mapowań relacyjnych na hierarchiczne i hierarchiczne z przepływami danych mapowania.
Integracja i przetwarzanie danych przesyłanych strumieniowo: wraz ze wzrostem przemysłowych IoT (czujniki śledzące zasoby z "podłogi do sklepu", połączone floty logistyczne itp.), istnieje eksplozja danych w czasie rzeczywistym generowanych w sposób przesyłania strumieniowego, który musi być zintegrowany z tradycyjnymi wolno poruszającymi się danymi w celu generowania szczegółowych informacji. Usługa Azure Stream Analytics to zalecana usługa do przesyłania strumieniowego etL i przetwarzania na platformie Azure z szeroką gamą scenariuszy. Usługa Azure Stream Analytics obsługuje usługę Azure Cosmos DB jako natywny ujście danych.
Personalizacja w czasie rzeczywistym
Sprzedawcy detaliczni muszą dziś tworzyć bezpieczne i skalowalne rozwiązania do handlu elektronicznego, które spełniają wymagania zarówno klientów, jak i firm. Te rozwiązania do handlu elektronicznego muszą angażować klientów za pośrednictwem dostosowanych produktów i ofert, szybko i bezpiecznie przetwarzać transakcje oraz skupiać się na realizacji i obsłudze klienta. Usługa Azure Cosmos DB wraz z najnowszą wersją usługi Synapse Link dla usługi Azure Cosmos DB umożliwia sprzedawcom detalicznym generowanie spersonalizowanych zaleceń dla klientów w czasie rzeczywistym. Używają ustawień spójności o małych opóźnieniach i dostrajania, aby uzyskać natychmiastowe szczegółowe informacje, jak pokazano w następującej architekturze:
- Przygotowywanie i trenowanie potoku predykcyjnego: możesz wygenerować szczegółowe informacje na temat danych operacyjnych w jednostkach biznesowych lub segmentach klientów przy użyciu modeli usługi Fabric lub Synapse Spark i uczenia maszynowego. Przekłada się to na spersonalizowane dostarczanie do docelowych segmentów klientów, predykcyjne środowiska użytkownika końcowego i ukierunkowanego marketingu w celu dopasowania do wymagań użytkownika końcowego. )
Konserwacja predykcyjna IOT
Innowacje przemysłowe IOT znacząco zmniejszyły przestoje maszyn i zwiększyły ogólną wydajność we wszystkich dziedzinach przemysłu. Jedną z takich innowacji jest analiza konserwacji predykcyjnej maszyn na brzegu chmury.
Poniżej przedstawiono architekturę korzystającą z natywnych funkcji HTAP chmury w konserwacji predykcyjnej IoT:
Przygotowywanie i trenowanie potoku predykcyjnego: historyczne dane operacyjne z czujników urządzeń IoT mogą służyć do trenowania modeli predykcyjnych, takich jak detektory anomalii. Te detektory anomalii są następnie wdrażane z powrotem do krawędzi na potrzeby monitorowania w czasie rzeczywistym. Taka cnotliwa pętla umożliwia ciągłe ponowne trenowanie modeli predykcyjnych.
Raportowanie operacyjne: wraz ze wzrostem inicjatyw cyfrowych reprezentacji bliźniaczych firmy zbierają ogromne ilości danych operacyjnych z dużej liczby czujników w celu utworzenia cyfrowej kopii poszczególnych maszyn. Te dane umożliwiają usłudze BI zrozumienie trendów dotyczących danych historycznych oprócz ostatnich gorących danych.