Udostępnij przez


Tworzenie architektury medaliowej za pomocą zmaterializowanych widoków jeziora

W tym samouczku opisano kroki i zagadnienia dotyczące implementowania architektury medalonu przy użyciu zmaterializowanych widoków jeziora. Po ukończeniu tego samouczka poznasz kluczowe funkcje i możliwości zmaterializowanych widoków typu lake i możesz utworzyć zautomatyzowany przepływ pracy przekształcania danych. Ten samouczek nie jest przeznaczony do stosowania architektury referencyjnej, wyczerpującej listy funkcji i funkcji ani rekomendacji dotyczących konkretnych najlepszych rozwiązań.

Wymagania wstępne

W ramach wymagań wstępnych dla tego samouczka wykonaj następujące czynności:

  1. Zaloguj się do konta usługi Power BI lub jeśli nie masz jeszcze konta, utwórz konto w celu uzyskania bezpłatnej wersji próbnej.
  2. Włącz usługę Microsoft Fabric w dzierżawie. Wybierz domyślną ikonę Power BI w lewym dolnym rogu ekranu i wybierz Fabric.
  3. Utwórz obszar roboczy z obsługą usługi Microsoft Fabric.
  4. Wybierz obszar roboczy na karcie Obszary robocze, a następnie wybierz pozycję + Nowy element, a następnie wybierz pozycję Potok. Podaj nazwę swojego pipeline'u i kliknij Utwórz.
  5. Utwórz usługę Lakehouse z włączonymi schematami . Nadaj jej nazwę SalesLakehouse i załaduj przykładowe pliki danych do usługi Lakehouse. Aby uzyskać więcej informacji, zobacz Samouczek usługi Lakehouse.

Omówienie scenariusza

W tym samouczku przyjrzysz się fikcyjnej organizacji handlu detalicznego Contoso, która używa architektury medaliowej do analizy danych w celu uzyskania praktycznych informacji na temat działań związanych ze sprzedażą detaliczną. Ma ona na celu usprawnienie procesu analizy i wygenerowanie dokładniejszego wglądu w wydajność biznesową przez zorganizowanie danych na trzy warstwy — brąz (nieprzetworzone dane), srebro (oczyszczone i wzbogacone dane) oraz złoto (zagregowane i przeanalizowane dane).

Na poniższym diagramie przedstawiono różne podmioty w każdej warstwie modelu architektury medalu na platformie SalesLakehouse.

Zrzut ekranu przedstawiający architekturę medalionu.

Encje

  1. Zamówienia: ta jednostka zawiera szczegółowe informacje o każdym zamówieniu klienta, takie jak data zamówienia, szczegóły wysyłki, kategoria produktu i podkategoria. Szczegółowe informacje można wyciągnąć, aby zoptymalizować strategie wysyłki, zidentyfikować popularne kategorie produktów i poprawić zarządzanie zamówieniami.

  2. Sprzedaż: analizując dane sprzedaży, firma Contoso może ocenić kluczowe metryki, takie jak całkowity przychód, marże zysku, priorytety zamówień i rabaty. Korelacje między tymi czynnikami zapewniają jaśniejsze zrozumienie zachowań zakupów klientów i wydajność strategii rabatu.

  3. Lokalizacja: umożliwia przechwycenie geograficznego wymiaru sprzedaży i zamówień, w tym miast, stanów, regionów i segmentów klientów. Ułatwia to firmie Contoso identyfikowanie regionów o wysokiej wydajności, rozwiązywanie problemów z obszarami o niskiej wydajności i personalizowanie strategii dla określonych segmentów klientów.

  4. Wydajność agenta: dzięki szczegółowym informacjami na temat agentów zarządzających transakcjami, ich prowizjami i danymi sprzedaży firma Contoso może ocenić wydajność poszczególnych agentów, zachęcić najlepszych wykonawców i zaprojektować efektywne struktury prowizji.

  5. Prowizje agentów: Włączenie danych prowizji zapewnia przejrzystość i umożliwia lepsze zarządzanie kosztami. Zrozumienie korelacji między stawkami prowizji a wydajnością agentów pomaga udoskonalić systemy zachęt.

Przykładowy zestaw danych

Firma Contoso utrzymuje dane pierwotne operacji sprzedaży detalicznej w formacie CSV w usłudze ADLS Gen2. Wykorzystamy te dane do utworzenia warstwy z brązu, a następnie użyjemy warstwy brązowej do utworzenia zmaterializowanych widoków jeziora, które tworzą srebrne i złote warstwy architektury medalonu. Najpierw pobierz przykładowe pliki CSV z repozytorium przykładów usługi Fabric.

Utwórz potok

Ogólne kroki są następujące:

  1. Warstwa brązowa: Pozyskiwanie surowych danych w postaci plików CSV do lakehouse.
  2. Silver Layer: Oczyszczanie danych przy użyciu zmaterializowanych widoków lake.
  3. Warstwa złota: Przygotuj dane do analizy i raportowania, korzystając ze zmaterializowanych widoków jeziora.

Utwórz brązową warstwę architektury medalionu analizy sprzedaży

  1. Załaduj pliki CSV odpowiadające różnym podmiotom z pobranych danych do usługi Lakehouse. W tym celu przejdź do usługi Lakehouse i przekaż pobrane dane do sekcji Pliki w lakehouse. Tworzy folder o nazwie tutorial.

  2. Następnie utwórz skrót do niego z sekcji Tabele . Wybierz pozycję ... obok sekcji Tabele , a następnie wybierz pozycję Nowy skrót schematu , a następnie pozycję Microsoft OneLake. Wybierz pozycję SalesLakehouse z typów źródeł danych. Rozwiń sekcję Pliki i wybierz folder tutorial , a następnie wybierz pozycję Utwórz. Możesz również użyć innych alternatywnych opcji, aby pobrać dane do usługi Lakehouse.

    Zrzut ekranu przedstawiający sposób tworzenia skrótu w celu pobrania danych do tabel.

  3. W sekcji Tabele zmień nazwę folderu tutorial na brązowy.

    Zrzut ekranu przedstawiający tworzenie warstwy z brązu.

Tworzenie srebrnych i złotych warstw architektury medalonu

  1. Prześlij pobrany plik notesu do obszaru roboczego.

    Zrzut ekranu przedstawiający utworzenie zmaterializowanego srebrnego widoku jeziora.

  2. Otwórz Notatnik z Lakehouse. Aby uzyskać więcej informacji, zobacz Eksplorowanie danych lakehouse w notebooku.

  3. Uruchom wszystkie komórki notesu za pomocą Spark SQL, aby utworzyć zmaterializowane widoki jeziora z ograniczeniami jakości danych. Po pomyślnym wykonaniu wszystkich komórek odśwież źródło SalesLakehouse, w celu wyświetlenia nowo utworzonych zmaterializowanych widoków jeziora dla schematów srebra i złota.

    Zrzut ekranu przedstawiający uruchamianie notesu.

Zaplanuj przepływ pracy

  1. Po utworzeniu zmaterializowanych widoków jeziora dla warstw srebra i złota przejdź do lakehouse i wybierz pozycję Zarządzany zmaterializowany widok jeziora, aby wyświetlić widok pochodzenia. Jest automatycznie generowany na podstawie zależności, a każdy zależny zmaterializowany widok jeziora tworzy węzły linii pochodzenia.

    Zrzut ekranu przedstawiający zmaterializowany widok jeziora.

    Zrzut ekranu przedstawiający tworzenie rodowodu.

  2. Wybierz pozycję Harmonogram na wstążce nawigacji. Włącz odświeżanie i skonfiguruj harmonogram.

    Zrzut ekranu przedstawiający harmonogram uruchamiania zmaterializowanych widoków jeziora.

Monitorowanie i rozwiązywanie problemów

  1. Menu rozwijane zawiera listę bieżących i historycznych przebiegów.

    Zrzut ekranu przedstawiający wykonywanie harmonogramu.

  2. Po wybraniu dowolnego przebiegu można znaleźć szczegóły zmaterializowanego widoku jeziora na panelu po prawej stronie. Dolny panel aktywności zapewnia wysokopoziomowy przegląd statusu wykonywania węzła.

    Zrzut ekranu przedstawiający szczegóły wykonania.

  3. Wybierz dowolny węzeł z rodowodu, aby wyświetlić szczegóły wykonywania węzła i sprawdzić szczegółowe dzienniki. Jeśli stan węzła to Niepowodzenie, zostanie również wyświetlony komunikat o błędzie.

    Zrzut ekranu przedstawiający dzienniki szczegółów wykonywania.

  4. Wybranie linku Szczegółowe dzienniki spowoduje przekierowanie do centrum monitorowania , z którego można uzyskać dostęp do dzienników błędów platformy Spark w celu dalszego rozwiązywania problemów.

    Zrzut ekranu przedstawiający dzienniki platformy Spark.

  5. Wybierz przycisk Raport o jakości danych na wstążce strony zmaterializowanych widoków jeziora, aby utworzyć lub wyświetlić automatycznie wygenerowany raport o jakości danych.