Udostępnij za pośrednictwem


Samouczek: analizowanie danych za pomocą notesu

Dotyczy: punkt końcowy analizy SQL i magazyn w usłudze Microsoft Fabric

W tym samouczku dowiesz się, jak można zapisywać dane raz, a następnie używać ich z wieloma innymi usługami. Skróty można również tworzyć do danych przechowywanych w usługach Azure Data Lake Storage i S3, aby umożliwić bezpośredni dostęp do tabel różnicowych z systemów zewnętrznych.

Tworzenie jeziora

Najpierw tworzymy nowy lakehouse. Aby utworzyć nowy magazyn lakehouse w obszarze roboczym usługi Microsoft Fabric:

  1. Data Warehouse Tutorial Wybierz obszar roboczy w menu nawigacji.

  2. Wybierz pozycję + New>Lakehouse.

    Zrzut ekranu z portalu sieci szkieletowej przedstawiający menu + Nowy. Lakehouse jest w pudełku na czerwono.

  3. W polu Nazwa wprowadź ciąg ShortcutExercise, a następnie wybierz pozycję Utwórz.

    Zrzut ekranu z portalu sieci szkieletowej przedstawiający pole nazwy dla nowego magazynu lakehouse. Podana nazwa to ShortcutExercise.

  4. Zostanie załadowany nowy magazyn lakehouse i zostanie otwarty widok Eksploratora z menu Pobierz dane w usłudze Lakehouse . W obszarze Załaduj dane w usłudze Lakehouse wybierz przycisk Nowy skrót .

    Zrzut ekranu z portalu sieci szkieletowej przedstawiający menu Ładowanie danych w menu lakehouse na stronie docelowej. Przycisk Nowy skrót jest w kolorze czerwonym.

  5. W oknie Nowy skrót wybierz przycisk Microsoft OneLake.

    Zrzut ekranu z portalu sieci szkieletowej przedstawiający okno Nowy skrót. Przycisk Microsoft OneLake jest w polu czerwonym.

  6. W oknie Wybierz typ źródła danych przewiń listę do momentu znalezienia wcześniej WideWorldImporters utworzonego magazynu. Wybierz ją, a następnie wybierz pozycję Dalej.

  7. W przeglądarce obiektów OneLake rozwiń węzeł Tabele, rozwiń dbo schemat, a następnie wybierz przycisk radiowy obok pozycji dimension_customer. Zaznacz przycisk Utwórz.

    Zrzut ekranu z portalu sieci szkieletowej przedstawiający przeglądarkę obiektów OneLake. W obszarze WideWorldImporters, Tables, dbo, dimension_customer jest w polu czerwonym.

  8. Jeśli zobaczysz folder o nazwie Unidentified w obszarze Tabele, wybierz ikonę Odśwież na pasku menu poziomego.

    Zrzut ekranu z portalu Sieć szkieletowa przedstawiający przycisk odświeżania na pasku menu poziomego i niezidentyfikowane tabele w obszarze ShortcutExercise w eksploratorze usługi Lakehouse.

  9. Wybierz pozycję na dimension_customer liście Tabela , aby wyświetlić podgląd danych. Usługa Lakehouse wyświetla dane z dimension_customer tabeli z magazynu!

    Zrzut ekranu z portalu sieci szkieletowej przedstawiający podgląd danych tabeli dimension_customer.

  10. Następnie utwórz nowy notes, aby wysłać zapytanie do dimension_customer tabeli. Na wstążce Narzędzia główne wybierz listę rozwijaną Otwórz notes i wybierz pozycję Nowy notes.

    Zrzut ekranu z portalu Sieci szkieletowej przedstawiający naciśnięty przycisk Otwórz notes i wybraną opcję Nowy notes.

  11. Wybierz, a następnie przeciągnij element dimension_customer z listy Tabele do otwartej komórki notesu. Zobaczysz, że zapytanie PySpark zostało napisane, aby wykonać zapytanie dotyczące wszystkich danych z witryny ShortcutExercise.dimension_customer. To środowisko notesu jest podobne do środowiska notesu Jupyter programu Visual Studio Code. Możesz również otworzyć notes w programie VS Code.

    Zrzut ekranu przedstawiający widok notesu portalu sieci szkieletowej. Strzałka wskazuje ścieżkę do wybrania dimension_customer, a następnie przeciągnij ją i upuść w otwartej komórce notesu.

  12. Na wstążce Narzędzia główne wybierz przycisk Uruchom wszystko. Po zakończeniu zapytania zobaczysz, że możesz łatwo użyć narzędzia PySpark do wykonywania zapytań dotyczących tabel magazynu.

    Zrzut ekranu z portalu sieci szkieletowej przedstawiający wyniki uruchamiania notesu w celu wyświetlenia danych z dimension_customer.

Następny krok