Co to jest lakehouse w usłudze Microsoft Fabric?

Microsoft Fabric Lakehouse to platforma architektury danych do przechowywania danych, zarządzania nimi i analizowania danych ustrukturyzowanych i nieustrukturyzowanych w jednej lokalizacji. Jest to elastyczne i skalowalne rozwiązanie, które umożliwia organizacjom obsługę dużych ilości danych przy użyciu różnych narzędzi i struktur do przetwarzania i analizowania tych danych. Integruje się z innymi narzędziami do zarządzania danymi i analizy w celu zapewnienia kompleksowego rozwiązania do inżynierii danych i analizy.

Gif of overall lakehouse experience.

Punkt końcowy analizy SQL usługi Lakehouse

Usługa Lakehouse tworzy warstwę obsługi, automatycznie generując punkt końcowy analizy SQL i domyślny model semantyczny podczas tworzenia. Ta nowa funkcja przeglądania umożliwia użytkownikowi pracę bezpośrednio nad tabelami delta w jeziorze w celu zapewnienia bezproblemowego i wydajnego środowiska od pozyskiwania danych do raportowania.

Należy pamiętać, że punkt końcowy analizy SQL jest środowiskiem tylko do odczytu i nie obsługuje pełnego obszaru powierzchni języka T-SQL transakcyjnego magazynu danych.

Uwaga

Tylko tabele w formacie delta są dostępne w punkcie końcowym analizy SQL. Nie można wykonywać zapytań względem parquet, CSV i innych formatów przy użyciu punktu końcowego analizy SQL. Jeśli tabela nie jest widoczna, musisz przekonwertować ją na format delta.

Automatyczne odnajdywanie i rejestrowanie tabel

Automatyczne odnajdywanie i rejestrowanie tabel to funkcja usługi Lakehouse, która udostępnia w pełni zarządzany plik do obsługi tabel dla inżynierów danych i analityków danych. Plik można usunąć w zarządzanym obszarze lakehouse, a system automatycznie weryfikuje go pod kątem obsługiwanych formatów strukturalnych i rejestruje w magazynie metadanych z wymaganymi metadanymi, takimi jak nazwy kolumn, formaty, kompresja i inne. (Obecnie jedynym obsługiwanym formatem jest tabela delty). Następnie możesz odwołać się do pliku jako tabeli i użyć składni SparkSQL do interakcji z danymi.

Interakcja z elementem Lakehouse

Inżynier danych może wchodzić w interakcje z usługą Lakehouse i danymi w usłudze Lakehouse na kilka sposobów:

  • Eksplorator lakehouse: Eksplorator jest główną stroną interakcji lakehouse. Możesz załadować dane w usłudze Lakehouse, eksplorować dane w usłudze Lakehouse przy użyciu eksploratora obiektów, ustawić etykiety MIP i różne inne elementy. Dowiedz się więcej o środowisku eksploratora: Nawigowanie po eksploratorze usługi Fabric Lakehouse.

  • Notesy: inżynierowie danych mogą używać notesu do pisania kodu w celu odczytywania, przekształcania i zapisywania bezpośrednio w usłudze Lakehouse jako tabel i/lub folderów. Aby dowiedzieć się więcej na temat używania notesów dla usługi Lakehouse: Eksplorowanie danych w usłudze Lakehouse za pomocą notesu i Jak za pomocą notesu załadować dane do usługi Lakehouse.

  • Potoki: inżynierowie danych mogą używać narzędzi do integracji danych, takich jak narzędzie do kopiowania potoków, aby ściągać dane z innych źródeł i lądować do usługi Lakehouse. Dowiedz się więcej na temat korzystania z działania kopiowania: Jak kopiować dane przy użyciu działania kopiowania.

  • Definicje zadań platformy Apache Spark: Inżynierowie danych mogą tworzyć niezawodne aplikacje i organizować wykonywanie skompilowanych zadań platformy Spark w językach Java, Scala i Python. Dowiedz się więcej o zadaniach platformy Spark: Co to jest definicja zadania platformy Apache Spark?

  • Przepływy danych Gen 2: Inżynierowie danych mogą pozyskiwać i przygotowywać swoje dane przy użyciu przepływów danych 2. generacji. Dowiedz się więcej na temat ładowania danych przy użyciu przepływów danych: Tworzenie pierwszego przepływu danych w celu pobierania i przekształcania danych.

Dowiedz się więcej o różnych sposobach ładowania danych do usługi Lakehouse: Opcje pobierania danych do usługi Fabric Lakehouse.

Wielozadaniowość z lakehouse

Środowisko wielozadaniowości udostępnia projekt karty przeglądarki, który umożliwia bezproblemowe otwieranie i przełączanie się między wieloma elementami, dzięki czemu można wydajniej zarządzać usługą Data Lakehouse niż kiedykolwiek wcześniej. Nie ma więcej żonglowania między różnymi oknami lub utratą śledzenia zadań. Usługa Lakehouse zapewnia ulepszone środowisko wielozadaniowości, które pozwala na jak najbardziej wydajne i przyjazne dla użytkownika środowisko zarządzania danymi dzięki następującym funkcjom:

  • Zachowaj uruchomione operacje: możesz przekazać lub uruchomić operację ładowania danych na jednej karcie i sprawdzić inne zadanie na innej karcie. W przypadku rozszerzonego wielodaniowego uruchamiania operacji nie są anulowane podczas nawigowania między kartami. Możesz skupić się na pracy bez przerw.

  • Zachowaj kontekst: wybrane obiekty, tabele danych lub pliki pozostają otwarte i łatwo dostępne podczas przełączania się między kartami. Kontekst usługi Data Lakehouse jest zawsze na wyciągnięcie ręki.

  • Ponowne ładowanie listy nieblokujących: nieblokujący mechanizm ponownego ładowania plików i tabel. Możesz kontynuować pracę podczas odświeżania listy w tle. Zapewnia to, że masz najnowsze dane, zapewniając bezproblemowe i nieprzerwane działanie.

  • Jasno zdefiniowane powiadomienia: wyskakujące powiadomienia określają, z którego lakehouse pochodzą, co ułatwia śledzenie zmian i aktualizacji w środowisku wielozadaniowym.

Projekt dostępnego jeziora

Ułatwienia dostępu zawsze były priorytetem, aby zapewnić, że usługa Lakehouse jest inkluzywna i przyjazna dla wszystkich użytkowników. Poniżej przedstawiono najważniejsze inicjatywy, które wdrożyliśmy do tej pory w celu wspierania ułatwień dostępu:

  • Zgodność czytnika zawartości ekranu: możesz bezproblemowo pracować z popularnymi czytnikami zawartości ekranu, umożliwiając użytkownikom niedowidzącym efektywne nawigowanie po naszej platformie i interakcję z nią.

  • Projekt dynamicznego przepływu tekstu, który dostosowuje się do różnych rozmiarów i orientacji ekranu. Dynamiczne przepływy tekstu i zawartości ułatwiają użytkownikom wyświetlanie i interakcję z naszą aplikacją na różnych urządzeniach.

  • Nawigacja za pomocą klawiatury: Ulepszona nawigacja za pomocą klawiatury umożliwiająca użytkownikom poruszanie się po jeziorze bez polegania na myszce, zwiększając środowisko dla osób niepełnosprawnych ruchowo.

  • Tekst alternatywny dla obrazów: wszystkie obrazy zawierają teraz opisowy tekst alternatywny, dzięki czemu czytniki zawartości ekranu mogą przekazywać istotne informacje.

  • Pola formularzy i etykiety: wszystkie pola formularza mają skojarzone etykiety, upraszczając wprowadzanie danych dla wszystkich użytkowników, w tym przy użyciu czytników zawartości ekranu.

W tym omówieniu uzyskasz podstawową wiedzę na temat jeziora. Przejdź do następnego artykułu, aby dowiedzieć się, jak tworzyć własne jezioro i korzystać z niego: