Udostępnij za pośrednictwem


Samouczek lakehouse: tworzenie magazynu lakehouse, pozyskiwanie przykładowych danych i tworzenie raportu

W tym samouczku utworzysz usługę Lakehouse, pozyskujesz przykładowe dane w tabeli delty, zastosuj transformację tam, gdzie jest to wymagane, a następnie utworzysz raporty.

Wymagania wstępne

Tworzenie jeziora

  1. W usłudze Power BI wybierz pozycję Obszary robocze z menu po lewej stronie.

  2. Aby otworzyć obszar roboczy, wprowadź jego nazwę w polu tekstowym wyszukiwania znajdującym się u góry i wybierz go z wyników wyszukiwania.

  3. Z przełącznika znajdującego się w lewym dolnym rogu wybierz pozycję inżynierowie danych.

    Zrzut ekranu przedstawiający miejsce wybierania przełącznika i inżynierowie danych.

  4. Na ekranie inżynierowie danych wybierz pozycję Lakehouse, aby utworzyć jezioro.

  5. W oknie dialogowym New lakehouse wprowadź wwilakehousew polu Nazwa.

    Zrzut ekranu przedstawiający okno dialogowe New lakehouse.

  6. Wybierz pozycję Utwórz , aby utworzyć i otworzyć nowy magazyn lakehouse.

Pozyskiwanie przykładowych danych

Uwaga

Jeśli nie masz skonfigurowanej usługi OneDrive, utwórz konto bezpłatnej wersji próbnej platformy Microsoft 365: Bezpłatna wersja próbna — wypróbuj platformę Microsoft 365 przez miesiąc.

  1. Pobierz plik dimension_customer.csv z repozytorium przykładów usługi Fabric.

  2. Na karcie Narzędzia główne w obszarze Pobieranie danych w usłudze Lakehouse zobaczysz opcje ładowania danych do magazynu lakehouse. Wybierz pozycję Nowy przepływ danych Gen2.

    Zrzut ekranu przedstawiający, gdzie wybrać opcję Nowy przepływ danych Gen2, aby załadować dane do usługi Lakehouse.

  3. Na ekranie nowego przepływu danych wybierz pozycję Importuj z pliku tekstowego/CSV.

  4. Na ekranie Łączenie ze źródłem danych wybierz przycisk radiowy Przekaż plik . Przeciągnij i upuść pobrany w kroku 1 plik dimension_customer.csv . Po przekazaniu pliku wybierz pozycję Dalej.

    Zrzut ekranu przedstawiający miejsce wybrania pozycji Przekaż plik i miejsce przeciągania pobranego wcześniej pliku.

  5. Na stronie Podgląd danych pliku wyświetl podgląd danych i wybierz pozycję Utwórz, aby kontynuować i wrócić do kanwy przepływu danych.

  6. W okienku Ustawienia zapytania zaktualizuj pole Nazwa , aby dimension_customer.

    Uwaga

    Sieć szkieletowa domyślnie dodaje spację i liczbę na końcu nazwy tabeli. Nazwy tabel muszą mieć małe litery i nie mogą zawierać spacji. Zmień jego nazwę odpowiednio i usuń wszystkie spacje z nazwy tabeli.

    Zrzut ekranu przedstawiający okienko ustawień zapytania pokazujące, gdzie wprowadzić nazwę i wybrać miejsce docelowe danych.

  7. W tym samouczku skojarzyliśmy dane klienta z usługą Lakehouse. Jeśli masz inne elementy danych, które chcesz skojarzyć z usługą Lakehouse, możesz je dodać:

    1. W elementach menu wybierz pozycję Dodaj miejsce docelowe danych i wybierz pozycję Lakehouse. Na ekranie Połącz z miejscem docelowym danych zaloguj się do swojego konta, jeśli to konieczne, a następnie wybierz pozycję Dalej.

    2. Przejdź do obszaru roboczego wwilakehouse .

    3. Jeśli tabela dimension_customer nie istnieje, wybierz ustawienie Nowa tabela i wprowadź nazwę tabeli dimension_customer. Jeśli tabela już istnieje, wybierz ustawienie Istniejąca tabela i wybierz dimension_customer z listy tabel w Eksploratorze obiektów. Wybierz Dalej.

      Zrzut ekranu przedstawiający sposób wybierania tabeli docelowej.

    4. W okienku Wybieranie ustawień docelowych wybierz pozycję Zamień jako metodę aktualizacji. Wybierz pozycję Zapisz ustawienia , aby powrócić do kanwy przepływu danych.

  8. Na kanwie przepływu danych można łatwo przekształcić dane na podstawie wymagań biznesowych. Dla uproszczenia nie wprowadzamy żadnych zmian w tym samouczku. Aby kontynuować, wybierz pozycję Publikuj w prawym dolnym rogu ekranu.

    Zrzut ekranu przedstawiający okienko Ustawienia zapytania zawierające przycisk Publikuj.

  9. Koło wirujące obok nazwy przepływu danych wskazuje, że publikowanie jest w toku w widoku elementu. Po zakończeniu publikowania wybierz pozycję ... i wybierz pozycję Właściwości. Zmień nazwę przepływu danych na Load Lakehouse Table i wybierz pozycję Zapisz.

  10. Wybierz opcję Odśwież teraz obok nazwy przepływu danych, aby odświeżyć przepływ danych. Ta opcja uruchamia przepływ danych i przenosi dane z pliku źródłowego do tabeli lakehouse. Gdy jest w toku, w widoku elementu zobaczysz koło wirujące w obszarze Odświeżona kolumna.

    Zrzut ekranu przedstawiający miejsce znalezienia ikony Odśwież teraz.

  11. Po odświeżeniu przepływu danych wybierz nowy magazyn lakehouse na pasku nawigacyjnym po lewej stronie, aby wyświetlić tabelę dimension_customer delta.

    Zrzut ekranu przedstawiający panel nawigacyjny, z którego jest otwarty lakehouse.

  12. Wybierz tabelę, aby wyświetlić podgląd danych. Możesz również użyć punktu końcowego analizy SQL usługi Lakehouse do wykonywania zapytań dotyczących danych za pomocą instrukcji SQL. Wybierz pozycję Punkt końcowy analizy SQL z menu rozwijanego Lakehouse w prawym górnym rogu ekranu.

    Zrzut ekranu przedstawiający tabelę delty pokazującą, gdzie wybrać punkt końcowy analizy SQL.

  13. Wybierz tabelę dimension_customer, aby wyświetlić podgląd danych, lub wybierz pozycję Nowe zapytanie SQL w celu zapisania instrukcji SQL.

    Zrzut ekranu przedstawiający ekran punktu końcowego analizy SQL pokazujący, gdzie wybrać pozycję Nowe zapytanie SQL.

  14. Poniższe przykładowe zapytanie agreguje liczbę wierszy na podstawie kolumny BuyingGroup tabeli dimension_customer. Pliki zapytań SQL są zapisywane automatycznie w celu uzyskania przyszłego odwołania i można zmienić nazwę lub usunąć te pliki w zależności od potrzeb.

    Aby uruchomić skrypt, wybierz ikonę Uruchom w górnej części pliku skryptu.

    SELECT BuyingGroup, Count(*) AS Total
    FROM dimension_customer
    GROUP BY BuyingGroup
    

Tworzenie raportu

  1. Wcześniej wszystkie tabele i widoki lakehouse zostały automatycznie dodane do modelu semantycznego. W przypadku najnowszych aktualizacji w przypadku nowych magazynów typu lakehouse należy ręcznie dodać tabele do modelu semantycznego. Na karcie Raportowanie typu lakehouse wybierz pozycję Zarządzaj domyślnym modelem semantycznym i wybierz tabele, które chcesz dodać do modelu semantycznego. W takim przypadku wybierz tabelę dimension_customer .

    Zrzut ekranu przedstawiający, w którym można wybrać tabele, które mają zostać dodane do modelu semantycznego.

  2. Aby upewnić się, że tabele w modelu semantycznym są zawsze zsynchronizowane, przejdź do widoku punktu końcowego analizy SQL i otwórz okienko ustawień usługi Lakehouse. Wybierz pozycję Domyślny model semantyczny usługi Power BI i włącz opcję Synchronizuj domyślny model semantyczny usługi Power BI. Aby uzyskać więcej informacji, zobacz Domyślne modele semantyczne usługi Power BI.

    Zrzut ekranu przedstawiający sposób włączania synchronizacji danych z domyślnym modelem semantycznym

  3. Po dodaniu tabeli usługa Fabric tworzy semantyczny model o takiej samej nazwie jak lakehouse.

    Zrzut ekranu przedstawiający domyślny model semantyczny utworzony podczas tworzenia nowego magazynu typu lakehouse.

  4. W okienku semantycznego modelu można wyświetlić wszystkie tabele. Dostępne są opcje tworzenia raportów od podstaw, raportów podzielonych na strony lub automatycznego tworzenia raportu na podstawie danych przez usługę Power BI. Na potrzeby tego samouczka w obszarze Eksploruj te dane wybierz pozycję Automatycznie utwórz raport. W następnym samouczku utworzymy raport od podstaw.

    Zrzut ekranu przedstawiający stronę szczegółów modelu semantycznego pokazującą, gdzie wybrać pozycję Utwórz raport.

  5. Ponieważ tabela jest wymiarem i nie ma w niej żadnych miar, usługa Power BI tworzy miarę dla liczby wierszy i agreguje ją w różnych kolumnach i tworzy różne wykresy, jak pokazano na poniższej ilustracji. Ten raport można zapisać w przyszłości, wybierając pozycję Zapisz na górnej wstążce. Aby spełnić wymagania, możesz wprowadzić więcej zmian w tym raporcie, włączając lub wykluczając inne tabele lub kolumny.

    Zrzut ekranu przedstawiający stronę Szybkie podsumowanie z czterema różnymi wykresami słupkowymi.

Następny krok