Co to jest lakehouse w Microsoft Fabric?

Usługa Lakehouse w Microsoft Fabric łączy skalowalność magazynu danych z możliwościami wykonywania zapytań w magazynie danych. Dane ustrukturyzowane i nieustrukturyzowane można przechowywać w jednej lokalizacji, zarządzać nimi za pomocą usługi Delta Lake i analizować je zarówno przy użyciu platformy Apache Spark, jak i bazy danych SQL — wszystko bez przenoszenia danych między systemami. Dzięki skrótom OneLake i współużytkowaniu danych między dzierżawami można również uzyskiwać dostęp do zarządzanych danych ze źródeł zewnętrznych i innych organizacji bez duplikowania.

Jezioro zapewnia:

Jedna kopia danych dla obciążeń inżynierii danych i analizy
Format Delta Lake dla transakcji ACID, egzekwowania schematu i śledzenia zmian w czasie
Dostęp do platformy Spark i bazy danych SQL , dzięki czemu inżynierowie danych używają notesów, podczas gdy analitycy używają języka T-SQL
Wbudowana integracja z Power BI, potokami, przepływami danych i innymi elementami Fabric

Lakehouse a magazyn danych

Główne różnice między usługą lakehouse a magazynem data w Microsoft Fabric sprowadzają się do preferowanych narzędzi programistycznych, typów danych i wzorców obciążeń. Oba te elementy współużytkują ten sam aparat SQL i przechowują dane w formacie delta w usłudze OneLake, ale są one zaprojektowane pod kątem różnych scenariuszy:

	Lakehouse	Magazyn danych
Podstawowe narzędzie programistyczne	Apache Spark (Python, Scala, SQL, R)	T-SQL
Typy danych	Ustrukturyzowane i nieustrukturyzowane	Dane ustrukturyzowane
Transakcje obejmujące wiele tabel	Nie.	Tak
Pozyskiwanie danych	Notesy, potoki danych, przepływy danych, skróty OneLake (bezpośredni dostęp bez kopiowania)	T-SQL (`COPY INTO`, `INSERT`, `CTAS`), przepływy danych
Najlepsze dla	Inżynieria danych, nauka o danych, architektury medalonu	Raportowanie analizy biznesowej, modelowanie wymiarowe, zespoły oparte na języku SQL

Możesz użyć obu tych elementów w tym samym obszarze roboczym — na przykład załadować i przekształcić dane w Lakehouse przy użyciu platformy Spark, a następnie uwidocznić opracowane zestawy danych w magazynie do raportowania opartego na języku SQL. Aby uzyskać szczegółowe wskazówki, zobacz Wybór między magazynem a usługą Lakehouse.

Praca z danymi Lakehouse

Dane można ładować, przekształcać i wykonywać zapytania w usłudze Lakehouse za pomocą kilku narzędzi Fabric:

Skróty OneLake — dostęp do danych ze źródeł zewnętrznych (w tym innych dzierżaw za pośrednictwem udostępniania danych między dzierżawami) bez kopiowania ich do lakehouse. Skróty zapewniają dynamiczne odwołania tylko do odczytu do danych operacyjnych i analitycznych w usłudze OneLake. Zobacz Skróty OneLake.
Eksplorator usługi Lakehouse — przeglądaj tabele i pliki, ładuj dane i zarządzaj metadanymi bezpośrednio w przeglądarce. Możesz przełączać się między widokiem tabeli a widokiem pliku i dodawać wiele magazynów lakehouse do eksploratora. Zobacz Nawiguj po Fabric Lakehouse explorer.
Notebooks — Pisanie kodu Spark (Python, Scala, SQL, R) w celu odczytywania, przekształcania i zapisywania danych w tabelach i folderach lakehouse. Zobacz Eksplorowanie danych za pomocą notesu i Ładowanie danych za pomocą notesu.
Potoki — skorzystaj z działania kopiowania i innych narzędzi do integracji danych, aby przenieść dane ze źródeł zewnętrznych do Lakehouse'u. Zobacz Kopiowanie danych przy użyciu działania kopiowania.
Definicje zadań — uruchamianie skompilowanych aplikacji Spark w Java, Scala lub Python na potrzeby procesu ETL klasy produkcyjnej. Zobacz Co to jest definicja zadania platformy Apache Spark?.
Przepływy danych Gen 2 — pozyskiwanie i przygotowywanie danych przy użyciu interfejsu wizualnego o niskim kodzie. Zobacz Tworzenie pierwszego przepływu danych.

Aby uzyskać pełne porównanie opcji wprowadzania danych, zobacz Opcje wprowadzania danych do Fabric Lakehouse.

Punkt końcowy analizy SQL usługi Lakehouse

Gdy tworzysz lakehouse, Fabric automatycznie generuje punkt końcowy do analizy SQL. Ten punkt końcowy umożliwia:

Wykonywanie zapytań względem tabel delty przy użyciu języka T-SQL — użyj znanej składni SQL bez konfigurowania oddzielnego magazynu.
Połącz Power BI bezpośrednio — utwórz semantyczny model Power BI do budowania raportów na danych Lakehouse.
Udostępnianie dostępu tylko do odczytu — analitycy i konstruktorzy raportów mogą wykonywać zapytania dotyczące danych bez wpływu na obciążenia platformy Spark.

Notatka

Od 5 września 2025 r. domyślne modele semantyczne nie są już tworzone automatycznie podczas tworzenia magazynu lakehouse. Istniejące domyślne modele semantyczne zostały oddzielone od elementów nadrzędnych do 30 listopada 2025 r. i stały się niezależnymi modelami semantycznymi. Aby uzyskać więcej informacji, zobacz semantyczne modele Power BI w Microsoft Fabric.

Punkt końcowy analizy SQL jest tylko do odczytu i nie obsługuje pełnego zakresu możliwości języka T-SQL magazynu danych. Służy do eksploracji, raportowania i zapytań ad hoc.

Notatka

Tylko tabele delty są wyświetlane w punkcie końcowym analizy SQL. Obejmuje to tabele delty osiągane za pomocą skrótów OneLake, które są widoczne i możliwe do wykonywania zapytań wraz z lokalnie przechowywanymi tabelami. Za pomocą tego punktu końcowego nie można przeprowadzać zapytań w formacie Parquet, CSV i innych. Jeśli tabela nie jest widoczna, przekonwertuj ją na format delta.

Automatyczne odnajdywanie i rejestrowanie tabel

Usługa Lakehouse organizuje dane w dwa foldery najwyższego poziomu: Tabele dla zarządzanych tabel Delta i Pliki dla danych bez struktury lub danych innych niż Delta. Po umieszczeniu pliku w folderze Tables, Fabric automatycznie:

Sprawdza poprawność pliku względem obsługiwanych formatów (obecnie tylko tabele Delta).
Wyodrębnia metadane — nazwy kolumn, typy danych, kompresja i partycjonowanie.
Rejestruje tabelę w magazynie metadanych, aby można było wykonywać zapytania natychmiast za pomocą języka Spark SQL lub T-SQL.

Ta zarządzana funkcja konwersji plików na tabelę oznacza, że nie musisz ręcznie pisać CREATE TABLE instrukcji dla danych, które umieszczasz w obszarze zarządzanym.

Wielozadaniowość z lakehouse

Usługa Lakehouse używa projektu karty przeglądarki, który umożliwia otwieranie i przełączanie się między wieloma elementami bez utraty miejsca:

Zachowaj uruchomione operacje: Ładowanie i przesyłanie danych nadal się odbywa podczas przełączania na inną kartę.
Zachowaj kontekst: Wybrane tabele, pliki i obiekty pozostają otwarte podczas przechodzenia między kartami.
Ponowne ładowanie listy bez blokowania: Pliki i tabele są odświeżane w tle bez przerywania pracy.
Powiadomienia o zasięgu: Wyskakujące powiadomienia identyfikują, z którego lakehouse pochodzą, dzięki czemu można śledzić aktualizacje na kartach.

Projekt dostępnego domku nad jeziorem

Usługa Lakehouse obsługuje technologie pomocnicze i dostępne wzorce interakcji:

Zgodność czytnika zawartości ekranu: Współpracuje z popularnymi czytnikami zawartości ekranu na potrzeby nawigacji i interakcji.
Tekst alternatywny dla obrazów: Wszystkie obrazy zawierają opisowy tekst alternatywny.
Pola formularza z etykietami: Wszystkie pola formularzy mają skojarzone etykiety dla użytkowników czytnika zawartości ekranu i klawiatury.
Przepływ tekstu: Responsywny układ, który dostosowuje się do różnych rozmiarów i orientacji ekranu.
Nawigacja za pomocą klawiatury: Pełna obsługa klawiatury do poruszania się po lakehouse bez myszy.

Opinia

Czy ta strona była pomocna?

Last updated on 2026-04-17