Udostępnij przez


Tabele usługi Azure Databricks

Usługa Azure Databricks udostępnia wiele typów tabel i formatów magazynu w celu spełnienia różnych potrzeb związanych z zarządzaniem danymi. W tej sekcji omówiono tabele zarządzane, zewnętrzne i obce oraz formaty magazynu Usługi Delta Lake i Apache Iceberg, które zapewniają zaawansowane funkcje, takie jak niepodzielność, spójność, izolacja i trwałość (ACID) oraz podróże czasowe.

Podstawowe pojęcia

Poznaj podstawy typów tabel, formatów magazynu i integracji wykazu aparatu Unity.

Temat Description
Pojęcia dotyczące tabel Podstawowe pojęcia i podstawowe informacje o typach tabel, formatach magazynu i integracji wykazu aparatu Unity.

Typy tabel

Poznaj różne typy tabel i ich możliwości w różnych scenariuszach zarządzania danymi.

Typ tabeli Description
Tabele zarządzane Tabele, w których usługa Azure Databricks zarządza zarówno metadanymi, jak i plikami danych. Zalecane w przypadku nowych tabel ze zoptymalizowaną wydajnością i magazynem.
tabele zewnętrzne Tabele odwołujące się do danych przechowywanych w zewnętrznych systemach magazynowania podczas zarządzania metadanymi w wykazie aparatu Unity.
Tabele obce Tabele tylko do odczytu reprezentujące dane w systemach zewnętrznych połączonych za pośrednictwem federacji lakehouse.

Formaty magazynu

Praca z otwartymi formatami tabel, które zapewniają zaawansowane możliwości zarządzania danymi.

Format Description
Delta Lake Domyślny format magazynu zapewniający transakcje ACID, podróż w czasie i wymuszanie schematu dla tabel zarządzanych i zewnętrznych.
Apache Iceberg Otwórz format tabeli na potrzeby integracji z ekosystemem Góry Lodowej, obsługującym zaawansowane zarządzanie metadanymi.

Zarządzanie tabelami

Konfigurowanie i optymalizowanie zachowania tabeli, struktury i wydajności.

Funkcja Description
Ograniczenia tabeli Definiowanie i wymuszanie reguł jakości danych przy użyciu ograniczeń sprawdzania, a nie ograniczeń null.
Wymuszanie schematu Określ, jak usługa Azure Databricks obsługuje zmiany schematu i wymuszanie typu danych podczas zapisu.
Partycjonowanie tabel Organizowanie danych według kluczy partycji w celu zwiększenia wydajności zapytań i zarządzania danymi.
Monitorowanie rozmiaru tabeli Monitorowanie i analizowanie użycia i wzorców wzrostu magazynu tabel.
Konwertowanie zewnętrzne na zarządzane Migrowanie tabel zewnętrznych do zarządzanych tabel w celu zwiększenia wydajności i zarządzania.
Odnajdywanie partycji zewnętrznych Automatyczne odnajdywanie i rejestrowanie partycji w tabelach zewnętrznych przechowywanych w magazynie w chmurze.