Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować się zalogować lub zmienić katalog.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
W tym samouczku opisano kroki i zagadnienia dotyczące implementowania architektury medalonu przy użyciu zmaterializowanych widoków jeziora. Po ukończeniu tego samouczka poznasz kluczowe funkcje i możliwości zmaterializowanych widoków typu lake i możesz utworzyć zautomatyzowany przepływ pracy przekształcania danych. Ten samouczek nie jest przeznaczony do stosowania architektury referencyjnej, wyczerpującej listy funkcji i funkcji ani rekomendacji dotyczących konkretnych najlepszych rozwiązań.
Wymagania wstępne
W ramach wymagań wstępnych dla tego samouczka wykonaj następujące czynności:
- Zaloguj się do konta usługi Power BI lub jeśli nie masz jeszcze konta, utwórz konto w celu uzyskania bezpłatnej wersji próbnej.
- Włącz usługę Microsoft Fabric w dzierżawie. Wybierz domyślną ikonę Power BI w lewym dolnym rogu ekranu i wybierz Fabric.
- Utwórz obszar roboczy z obsługą usługi Microsoft Fabric.
- Wybierz obszar roboczy na karcie Obszary robocze, a następnie wybierz pozycję + Nowy element, a następnie wybierz pozycję Potok. Podaj nazwę swojego pipeline'u i kliknij Utwórz.
- Utwórz usługę Lakehouse z włączonymi schematami . Nadaj jej nazwę SalesLakehouse i załaduj przykładowe pliki danych do usługi Lakehouse. Aby uzyskać więcej informacji, zobacz Samouczek usługi Lakehouse.
Omówienie scenariusza
W tym samouczku przyjrzysz się fikcyjnej organizacji handlu detalicznego Contoso, która używa architektury medaliowej do analizy danych w celu uzyskania praktycznych informacji na temat działań związanych ze sprzedażą detaliczną. Ma ona na celu usprawnienie procesu analizy i wygenerowanie dokładniejszego wglądu w wydajność biznesową przez zorganizowanie danych na trzy warstwy — brąz (nieprzetworzone dane), srebro (oczyszczone i wzbogacone dane) oraz złoto (zagregowane i przeanalizowane dane).
Na poniższym diagramie przedstawiono różne podmioty w każdej warstwie modelu architektury medalu na platformie SalesLakehouse.
Encje
Zamówienia: ta jednostka zawiera szczegółowe informacje o każdym zamówieniu klienta, takie jak data zamówienia, szczegóły wysyłki, kategoria produktu i podkategoria. Szczegółowe informacje można wyciągnąć, aby zoptymalizować strategie wysyłki, zidentyfikować popularne kategorie produktów i poprawić zarządzanie zamówieniami.
Sprzedaż: analizując dane sprzedaży, firma Contoso może ocenić kluczowe metryki, takie jak całkowity przychód, marże zysku, priorytety zamówień i rabaty. Korelacje między tymi czynnikami zapewniają jaśniejsze zrozumienie zachowań zakupów klientów i wydajność strategii rabatu.
Lokalizacja: umożliwia przechwycenie geograficznego wymiaru sprzedaży i zamówień, w tym miast, stanów, regionów i segmentów klientów. Ułatwia to firmie Contoso identyfikowanie regionów o wysokiej wydajności, rozwiązywanie problemów z obszarami o niskiej wydajności i personalizowanie strategii dla określonych segmentów klientów.
Wydajność agenta: dzięki szczegółowym informacjami na temat agentów zarządzających transakcjami, ich prowizjami i danymi sprzedaży firma Contoso może ocenić wydajność poszczególnych agentów, zachęcić najlepszych wykonawców i zaprojektować efektywne struktury prowizji.
Prowizje agentów: Włączenie danych prowizji zapewnia przejrzystość i umożliwia lepsze zarządzanie kosztami. Zrozumienie korelacji między stawkami prowizji a wydajnością agentów pomaga udoskonalić systemy zachęt.
Przykładowy zestaw danych
Firma Contoso utrzymuje dane pierwotne operacji sprzedaży detalicznej w formacie CSV w usłudze ADLS Gen2. Wykorzystamy te dane do utworzenia warstwy z brązu, a następnie użyjemy warstwy brązowej do utworzenia zmaterializowanych widoków jeziora, które tworzą srebrne i złote warstwy architektury medalonu. Najpierw pobierz przykładowe pliki CSV z repozytorium przykładów usługi Fabric.
Utwórz potok
Ogólne kroki są następujące:
- Warstwa brązowa: Pozyskiwanie surowych danych w postaci plików CSV do lakehouse.
- Silver Layer: Oczyszczanie danych przy użyciu zmaterializowanych widoków lake.
- Warstwa złota: Przygotuj dane do analizy i raportowania, korzystając ze zmaterializowanych widoków jeziora.
Utwórz brązową warstwę architektury medalionu analizy sprzedaży
Załaduj pliki CSV odpowiadające różnym podmiotom z pobranych danych do usługi Lakehouse. W tym celu przejdź do usługi Lakehouse i przekaż pobrane dane do sekcji Pliki w lakehouse. Tworzy folder o nazwie tutorial.
Następnie utwórz skrót do niego z sekcji Tabele . Wybierz pozycję ... obok sekcji Tabele , a następnie wybierz pozycję Nowy skrót schematu , a następnie pozycję Microsoft OneLake. Wybierz pozycję SalesLakehouse z typów źródeł danych. Rozwiń sekcję Pliki i wybierz folder tutorial , a następnie wybierz pozycję Utwórz. Możesz również użyć innych alternatywnych opcji, aby pobrać dane do usługi Lakehouse.
W sekcji Tabele zmień nazwę folderu tutorial na brązowy.
Tworzenie srebrnych i złotych warstw architektury medalonu
Prześlij pobrany plik notesu do obszaru roboczego.
Otwórz Notatnik z Lakehouse. Aby uzyskać więcej informacji, zobacz Eksplorowanie danych lakehouse w notebooku.
Uruchom wszystkie komórki notesu za pomocą Spark SQL, aby utworzyć zmaterializowane widoki jeziora z ograniczeniami jakości danych. Po pomyślnym wykonaniu wszystkich komórek odśwież źródło SalesLakehouse, w celu wyświetlenia nowo utworzonych zmaterializowanych widoków jeziora dla schematów srebra i złota.
Zaplanuj przepływ pracy
Po utworzeniu zmaterializowanych widoków jeziora dla warstw srebra i złota przejdź do lakehouse i wybierz pozycję Zarządzany zmaterializowany widok jeziora, aby wyświetlić widok pochodzenia. Jest automatycznie generowany na podstawie zależności, a każdy zależny zmaterializowany widok jeziora tworzy węzły linii pochodzenia.
Wybierz pozycję Harmonogram na wstążce nawigacji. Włącz odświeżanie i skonfiguruj harmonogram.
Monitorowanie i rozwiązywanie problemów
Menu rozwijane zawiera listę bieżących i historycznych przebiegów.
Po wybraniu dowolnego przebiegu można znaleźć szczegóły zmaterializowanego widoku jeziora na panelu po prawej stronie. Dolny panel aktywności zapewnia wysokopoziomowy przegląd statusu wykonywania węzła.
Wybierz dowolny węzeł z rodowodu, aby wyświetlić szczegóły wykonywania węzła i sprawdzić szczegółowe dzienniki. Jeśli stan węzła to Niepowodzenie, zostanie również wyświetlony komunikat o błędzie.
Wybranie linku Szczegółowe dzienniki spowoduje przekierowanie do centrum monitorowania , z którego można uzyskać dostęp do dzienników błędów platformy Spark w celu dalszego rozwiązywania problemów.
Wybierz przycisk Raport o jakości danych na wstążce strony zmaterializowanych widoków jeziora, aby utworzyć lub wyświetlić automatycznie wygenerowany raport o jakości danych.