Udostępnij za pośrednictwem


Co to są schematy usługi Lakehouse (wersja zapoznawcza)?

Usługa Lakehouse obsługuje tworzenie schematów niestandardowych. Schematy umożliwiają grupowanie tabel w celu lepszego odnajdywania danych, kontroli dostępu i nie tylko.

Tworzenie schematu lakehouse

Podczas tworzenia Lakehouse, aby włączyć obsługę jego schematów, zaznacz pole wyboru obok Schematy Lakehouse (Publiczna Wersja Zapoznawcza).

Zrzut ekranu przedstawiający nowe okno dialogowe lakehouse.

Ważne

Nazwy obszarów roboczych mogą zawierać tylko znaki alfanumeryczne ze względu na ograniczenia wersji zapoznawczej. Jeśli znaki specjalne są używane w nazwach obszarów roboczych, niektóre funkcje usługi Lakehouse nie będą działać.

Po utworzeniu magazynu typu lakehouse można znaleźć domyślny schemat o nazwie dbo w sekcji Tabele. Ten schemat jest zawsze dostępny i nie można go zmienić ani usunąć. Aby utworzyć nowy schemat, umieść kursor nad tabelami, wybierz pozycję ..., a następnie wybierz pozycję Nowy schemat. Wprowadź nazwę schematu i wybierz pozycję Utwórz. Schemat zostanie wyświetlony w obszarze Tabele w kolejności alfabetycznej.

Zrzut ekranu przedstawiający okno dialogowe nowego schematu Lakehouse.

Przechowywanie tabel w ramach schematów lakehouse

Do przechowywania tabeli w schemacie potrzebna jest nazwa schematu. W przeciwnym razie przechodzi do domyślnego schematu dbo .

df.write.mode("Overwrite").saveAsTable("contoso.sales")

Eksplorator usługi Lakehouse umożliwia rozmieszczenie tabel i przeciąganie i upuszczanie nazw tabel do różnych schematów.

Animacja przenoszenia tabel między schematami.

Uwaga

Jeśli zmodyfikujesz tabelę, musisz również zaktualizować powiązane elementy, takie jak kod notesu lub przepływy danych, aby upewnić się, że są one dopasowane do poprawnego schematu.

Przenieś wiele tabel ze skrótem schematu

Aby odwołać się do wielu tabel różnicowych z innej usługi Fabric Lakehouse lub magazynu zewnętrznego, użyj skrótu schematu, który wyświetla wszystkie tabele w wybranym schemacie lub folderze. Wszelkie zmiany w tabelach w lokalizacji źródłowej również są wyświetlane w schemacie. Aby utworzyć skrót schematu, umieść kursor nad tabelami, wybierz pozycję ..., a następnie wybierz pozycję Nowy skrót schematu. Następnie wybierz schemat w innym magazynie typu lakehouse lub folder z tabelami delty w magazynie zewnętrznym, takimi jak Azure Data Lake Storage (ADLS) Gen2. Spowoduje to utworzenie nowego schematu z przywołynymi tabelami.

Zrzut ekranu przedstawiający skrót nowego schematu lakehouse.

Uzyskiwanie dostępu do schematów usługi Lakehouse na potrzeby raportowania usługi Power BI

Aby utworzyć model semantyczny, wystarczy wybrać tabele, których chcesz użyć. Tabele mogą znajdować się w różnych schematach. Jeśli tabele z różnych schematów mają taką samą nazwę, numery są wyświetlane obok nazw tabel w widoku modelu.

Schematy usługi Lakehouse w notesie

Po zapoznaniu się ze schematem z włączoną usługą Lakehouse w eksploratorze obiektów notesu tabele znajdują się w schematach. Tabelę można przeciągać i upuszczać do komórki kodu i pobierać fragment kodu odwołujący się do schematu, w którym znajduje się tabela. Użyj tego namespace, aby odwołać się do tabel w kodzie: "workspace.lakehouse.schema.table". Jeśli pominiesz którykolwiek z elementów, wykonawca używa ustawienia domyślnego. Jeśli na przykład podasz nazwę tabeli, używa domyślnego schematu (dbo) z domyślnego lakehouse w notesie.

Ważne

Jeśli chcesz używać schematów w swoim kodzie, upewnij się, że domyślny lakehouse dla notesu ma włączoną obsługę schematów.

Zapytania Spark SQL między obszarami roboczymi

Użyj przestrzeni nazw "workspace.lakehouse.schema.table", aby odwołać się do tabel w kodzie. W ten sposób można łączyć tabele z różnych obszarów roboczych, jeśli użytkownik, który uruchamia kod, ma uprawnienia dostępu do tabel.

SELECT * 
    FROM operations.hr.hrm.employees as employees 
    INNER JOIN global.corporate.company.departments as departments
    ON employees.deptno = departments.deptno;

Ważne

Upewnij się, że tabele są przyłączane tylko z magazynów lakehouse, które mają włączone schematy. Łączenie tabel z magazynów danych lakehouse, które nie mają aktywowanych schematów, nie będzie działać.

Ograniczenia publicznej wersji zapoznawczej

Poniżej wymieniono nieobsługiwane funkcje/funkcjonalności dla bieżącej wersji zapoznawczej. Zostaną one rozwiązane w nadchodzących wersjach przed ogólną dostępnością.

Nieobsługiwane cechy/funkcjonalność Uwagi
Wspólny dom nad jeziorem Używanie środowiska roboczego w przestrzeni nazw dla wspólnych magazynów typu lakehouse nie będzie działać, np. workspace.sharedlakehouse.schema.table. Aby użytkownik mógł używać obszaru roboczego w przestrzeni namaspace, musi mieć rolę w obszarze roboczym.
Schemat tabeli innej niż delta, schemat tabeli zarządzanej Pobieranie schematu dla tabel zarządzanych, które nie mają formatu Delta (na przykład CSV), nie jest obsługiwane. Rozwijanie tych tabel w eksploratorze lakehouse nie pokazuje żadnych informacji o schemacie w interfejsie użytkownika.
Zewnętrzne tabele Spark Zewnętrzne operacje tabel platformy Spark (na przykład odnajdywanie, pobieranie schematu itp.) nie są obsługiwane. Te tabele są niezidentyfikowane w środowisku użytkownika.
Publiczny interfejs API Publiczne interfejsy API (wykazy tabel, ładowanie tabeli, udostępnianie własności rozszerzonej domyślnego schematu itp.) nie są obsługiwane w przypadku Lakehouse z włączonymi schematami. Istniejące publiczne interfejsy API wywoływane w schemacie z włączonym Lakehouse powodują wystąpienie błędu.
Aktualizowanie właściwości tabeli Nieobsługiwane.
Nazwa obszaru roboczego zawierająca znaki specjalne Przestrzeń robocza ze znakami specjalnymi (na przykład spacją, ukośnikami) nie jest obsługiwana. Zostanie wyświetlony błąd użytkownika.
Widoki Spark Nieobsługiwane.
Funkcje specyficzne dla programu Hive Nieobsługiwane.
Spark.catalog API Nieobsługiwane. Zamiast tego użyj usługi Spark SQL.
USE <schemaName> Nie działa między obszarami roboczymi, ale jest obsługiwany w tym samym obszarze roboczym.
Migracja Migracja istniejących Lakehouse, które nie są oparte na schemacie, do Lakehouse opartych na schemacie nie jest obsługiwana.
Przepływ danych Gen2 Nieobsługiwane.