Notatka
Dostęp do tej strony wymaga autoryzacji. Może spróbować zalogować się lub zmienić katalogi.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
OneLake to jedyne, zunifikowane jezioro danych w Microsoft Fabric. Każde obciążenie Fabric odczytuje i zapisuje dane za pośrednictwem usługi OneLake, więc wystarczy załadować dane tylko raz, aby używać ich wszędzie. Dane można przenieść do usługi OneLake na kilka sposobów:
- Przekaż pliki bezpośrednio do magazynu lub lakehouse.
- Pozyskuj dane przy użyciu potoków, przepływów danych lub funkcji przesyłania strumieniowego.
- Nawiąż połączenie z danymi zewnętrznymi przy użyciu skrótów lub dublowania.
W tym przewodniku Szybki start dodasz dane do usługi OneLake na dwa sposoby: prześlesz plik CSV do lakehouse i utworzysz skrót OneLake z drugiego lakehouse, który prowadzi do tych samych danych bez ich kopiowania. Po zakończeniu masz tabelę Delta, którą można odpytywać, oraz skrót — oba dostępne dla wszystkich silników Fabric za pośrednictwem usługi OneLake.
Wymagania wstępne
- Licencja Fabric. Możesz też utworzyć bezpłatne konto Fabric wersji próbnej.
- Obszar roboczy usługi Fabric.
Utwórz dom nad jeziorem
Podczas tworzenia elementu Fabric, takiego jak lakehouse, warehouse lub eventhouse, dla tego elementu jest aprowizowana przestrzeń magazynowa w usłudze OneLake w twoim imieniu. W tym przewodniku Szybki start utworzysz magazyn typu lakehouse, który zapewnia zarówno obszar plików (Pliki) dla danych bez struktury, jak i częściowo ustrukturyzowanych danych oraz obszar tabeli delty (Tabele) dla danych ze strukturą, do których można wykonywać zapytania. Wszystko, co umieścisz w dowolnym z tych obszarów, jest przechowywane w usłudze OneLake i natychmiast dostępne dla innych obciążeń platformy Fabric.
Zaloguj się do portalu Fabric i wybierz swój obszar roboczy.
Wybierz pozycję Nowy element.
W okienku Nowy element wyszukaj i wybierz pozycję Lakehouse.
Wprowadź nazwę, taką jak
DataLakehouse, a następnie wybierz pozycję Utwórz.Lakehouse otwiera się w widoku Explorer, w którym są widoczne puste sekcje Tabele i Pliki. Obie sekcje są już obsługiwane przez usługę OneLake i są gotowe na zawartość.
Przekazywanie przykładowych danych
W tym przewodniku skorzystasz z Dim_Products.csv z publicznie dostępnego przykładowego zestawu danych usługi Fabric. Jest to mała tabela informacji o produkcie od przykładowego sprzedawcy kawy.
- Otwórz przeglądarkę i przejdź pod adres https://fabrictutorialdata.blob.core.windows.net/sampledata/Coffee/Dim_Products.csv.
- Po wyświetleniu monitu zapisz plik jako
Dim_Products.csvw folderze na komputerze.
W tej sekcji przesyłasz Dim_Products.csv do Pliki, aby surowe dane źródłowe znajdowały się w usłudze OneLake. Obszar Pliki w lakehouse jest obszarem magazynowania ogólnego przeznaczenia w OneLake. Potraktuj to jako obszar docelowy dla surowych danych, niezależnie od formatu, w jakim napływają. Możesz dodać pliki CSV, JSON, Parquet, obrazy, logi lub cokolwiek innego bez konieczności wcześniejszego definiowania schematu.
W eksploratorze lakehouse umieść kursor na pozycji Pliki, wybierz menu Więcej opcji (...), a następnie wybierz pozycję Przekaż>pliki.
W okienku Przekazywanie plików wybierz ikonę folderu i przejdź do
Dim_Products.csvna komputerze.Wybierz pozycję Przekaż, a następnie zamknij okienko przekazywania.
Wybierz folder Pliki , aby wyświetlić jego zawartość i potwierdzić, że
Dim_Products.csvjest wyświetlany.Wybierz
Dim_Products.csv, aby wyświetlić swoje dane.
Plik znajduje się teraz w usłudze OneLake, ale jako surowy plik CSV nie jest jeszcze czymś, co można odpytywać z poziomu SQL lub Sparka jako tabelę.
Ładowanie pliku do tabeli delty
Fabric wykorzystuje standard Delta Lake jako format tabel w usłudze OneLake. Podczas ładowania pliku do obszaru Tables Fabric odczytuje plik źródłowy, wywnioskuje schemat i zapisuje dane jako tabelę delty. Od tego momentu każdy aparat Fabric może wykonywać zapytania dotyczące tej samej tabeli bez konieczności ponownego kopiowania lub konwertowania danych.
W eksploratorze lakehouse otwórz folder Pliki .
Najedź kursorem na plik
Dim_Products.csvi wybierz menu więcej opcji (...), a następnie wybierz Załaduj do tabel>Nowa tabela.W oknie dialogowym Ładowanie do tabeli wprowadź
dim_productsnazwę tabeli, zachowaj wartości domyślne i wybierz pozycję Załaduj.Po zakończeniu wczytywania rozwiń sekcję Tabele i wybierz
dim_products, aby wyświetlić podgląd wierszy. Surowy plik CSV w Files pozostaje bez zmian, adim_productsto nowa tabela Delta utworzona na jego podstawie.
dim_productsZatrzymaj wskaźnik myszy i wybierz menu więcej opcji (...), a następnie wybierz pozycję Właściwości.Ekran Properties wyświetla różne szczegóły dotyczące tabeli, w tym adres URL i ścieżkę w systemie plików obiektów blob platformy Azure (ABFS), których można użyć, aby odwoływać się do tej tabeli w innych silnikach.
Ponowne użycie danych przy użyciu skrótu z innego lakehouse
Przesyłanie i ładowanie to jeden ze sposobów na wprowadzanie danych do usługi OneLake. Innym kluczowym wzorcem jest odwołanie do danych, które już istnieją gdzie indziej, bez ich duplikowania. To właśnie jest skrót: wskaźnik w usłudze OneLake, który odwołuje się do danych przechowywanych w innym elemencie lakehouse, w innym obszarze roboczym platformy Fabric lub w obsługiwanych źródłach poza platformą Fabric, takich jak Azure Data Lake Storage czy Amazon S3. Dane nie są kopiowane; pozostaje w lokalizacji źródłowej, ale można ją odczytać za pośrednictwem usługi OneLake tak, jakby była lokalna. Wszystkie aktualizacje źródła są natychmiast widoczne za pomocą skrótu, więc nie trzeba utrzymywać kopii danych.
W tej sekcji utworzysz drugi lakehouse i dodasz z niego skrót do tabeli dim_products w swoim pierwszym lakehouse. Odzwierciedla to sposób, w jaki zespoły zwykle pracują, gdzie jeden zespół jest właścicielem wyselekcjonowanych danych, a inne zespoły lub projekty używają ich za pomocą skrótów we własnych obszarach roboczych.
- W obszarze roboczym wybierz pozycję Nowy element.
- W okienku Nowy element wyszukaj i wybierz pozycję Lakehouse.
- Wprowadź nazwę, taką jak
ShortcutLakehouse, a następnie wybierz pozycję Utwórz. - W Eksploratorze nowego lakehouse umieść kursor nad tabelami, wybierz menu Więcej opcji (...), a następnie wybierz pozycję Nowy skrót.
- Na stronie Nowy skrót w obszarze Internal sources wybierz Microsoft OneLake.
- W przeglądarce źródła danych wybierz pierwszy obiekt lakehouse utworzony na potrzeby tego przewodnika Szybki start, a następnie wybierz pozycję Dalej.
- Rozwiń element Tabele, wybierz tabelę
dim_products, a następnie wybierz Dalej. - Przejrzyj zaznaczenie i wybierz pozycję Utwórz.
- Rozwiń Tabele w
ShortcutLakehousei upewnij się, żedim_productspojawia się z ikoną skrótu (małą ikoną łącza na ikonie tabeli). Wybierz go, aby wyświetlić podgląd wierszy. Tabela jest taka sama jak w oryginalnym lakehouse, ale żadne dane nie zostały skopiowane. - Umieść kursor nad tabelą
dim_products, wybierz pozycję Więcej opcji (...), a następnie wybierz pozycję Zarządzaj skrótem. W okienku Zarządzanie skrótami można wyświetlić szczegóły skrótu, w tym miejsce docelowe skrótu, w którym są przechowywane oryginalne dane.
Uprzątnij zasoby
Jeśli nie planujesz przejść do pozostałych przewodników Szybki start usługi OneLake, usuń obiekty lakehouse, aby uniknąć opłat za magazynowanie w usłudze OneLake naliczanych względem pojemności Fabric.
- W obszarze roboczym najedź kursorem na lakehouse, który chcesz usunąć.
- Wybierz menu Więcej opcji (...) obok elementu lakehouse, wybierz pozycję Usuń i potwierdź usunięcie.
Usunięcie elementów Lakehouse powoduje również usunięcie zawartości w nich: przesłanego pliku, tabeli dim_products Delta i skrótu.