Eksplorowanie usługi Microsoft Fabric Lakehouse

Ukończone

Usługa Lakehouse przedstawia się jako bazę danych i jest oparta na usłudze Data Lake przy użyciu tabel formatu delta. Usługa Lakehouse łączy możliwości analityczne oparte na języku SQL magazynu danych relacyjnych oraz elastyczność i skalowalność magazynu danych typu data lake. Usługa Lakehouses przechowuje wszystkie formaty danych i może być używana z różnymi narzędziami analitycznymi i językami programowania. Jako rozwiązania oparte na chmurze usługi Lakehouse mogą być skalowane automatycznie i zapewniać wysoką dostępność i odzyskiwanie po awarii.

Diagram przedstawiający strukturę folderów typu data lake i możliwości relacyjne magazynu danych.

Niektóre zalety jeziora to:

  • Usługa Lakehouses używa aparatów Spark i SQL do przetwarzania danych na dużą skalę i obsługi uczenia maszynowego lub analizy modelowania predykcyjnego.
  • Dane usługi Lakehouse są zorganizowane w formacie schema-on-read, co oznacza, że schemat jest definiowany zgodnie z potrzebami, a nie ze wstępnie zdefiniowanym schematem.
  • Usługa Lakehouses obsługuje transakcje ACID (niepodzielność, spójność, izolacja, trwałość) za pośrednictwem tabel sformatowanych przez usługę Delta Lake w celu zapewnienia spójności i integralności danych.
  • Lakehouses to jedna lokalizacja, w przypadku których inżynierowie danych, analitycy danych i analitycy danych mogą uzyskiwać dostęp do danych i korzystać z nich.

Usługa Lakehouse jest doskonałym rozwiązaniem, jeśli chcesz skalowalne rozwiązanie analityczne, które zapewnia spójność danych. Ważne jest, aby ocenić konkretne wymagania, aby określić, które rozwiązanie jest najlepsze.

Magazyny lakehouse usługi Microsoft Fabric

W usłudze Microsoft Fabric możesz utworzyć magazyn lakehouse w dowolnym obszarze roboczym warstwy Premium . Po utworzeniu magazynu typu lakehouse można załadować dane — w dowolnym wspólnym formacie — z różnych źródeł; w tym pliki lokalne, bazy danych lub interfejsy API. Pozyskiwanie danych można również zautomatyzować przy użyciu potoków usługi Data Factory lub przepływów danych (Gen2) w usłudze Microsoft Fabric. Ponadto można tworzyć skróty sieci szkieletowej do danych w zewnętrznych źródłach, takich jak usługa Azure Data Lake Store Gen2 lub lokalizacja usługi Microsoft OneLake poza magazynem typu lakehouse. Eksplorator usługi Lakehouse umożliwia przeglądanie plików, folderów, skrótów i tabel; i wyświetlić ich zawartość na platformie Fabric.

Po pozyskaniu danych do usługi Lakehouse możesz użyć notesów lub przepływów danych (Gen2), aby je eksplorować i przekształcać.

Uwaga

Przepływy danych (Gen2) są oparte na dodatku Power Query — znanym narzędziu dla analityków danych korzystających z programu Excel lub usługi Power BI, które zapewnia wizualną reprezentację przekształceń jako alternatywę dla tradycyjnego programowania.

Potoki usługi Data Factory mogą służyć do organizowania platformy Spark, przepływu danych i innych działań; umożliwia implementowanie złożonych procesów przekształcania danych.

Po przekształceniu danych możesz wykonywać zapytania za pomocą języka SQL, używać ich do trenowania modeli uczenia maszynowego, wykonywania analizy w czasie rzeczywistym lub tworzenia raportów w usłudze Power BI.

Możesz również zastosować zasady ładu danych do usługi Lakehouse, takie jak klasyfikacja danych i kontrola dostępu.