Udostępnij przez


Tabele usługi Azure Databricks

Usługa Azure Databricks udostępnia wiele typów tabel i formatów magazynu w celu spełnienia różnych potrzeb związanych z zarządzaniem danymi. W tej sekcji omówiono tabele zarządzane, zewnętrzne i obce oraz formaty magazynu Usługi Delta Lake i Apache Iceberg, które zapewniają zaawansowane funkcje, takie jak niepodzielność, spójność, izolacja i trwałość (ACID) oraz podróże czasowe.

Podstawowe pojęcia

Poznaj podstawy typów tabel, formatów magazynu i integracji wykazu aparatu Unity.

Temat Description
Pojęcia dotyczące tabel Podstawowe pojęcia i podstawowe informacje o typach tabel, formatach magazynu i integracji wykazu aparatu Unity.

Typy tabel

Poznaj różne typy tabel i ich możliwości w różnych scenariuszach zarządzania danymi.

Typ tabeli Description
Zarządzane przez Unity Catalog tabele w Azure Databricks dla Delta Lake i Apache Iceberg Usługa Azure Databricks zarządza plikami metadanych i danych. Służy do nowych tabel wymagających zoptymalizowanej wydajności.
Tabele tymczasowe Tablice zarządzane przez katalog Unity o zakresie sesji dla danych pośrednich. Tylko magazyny SQL.
praca z tabelami zewnętrznymi Dane przechowywane w systemach zewnętrznych. Unity Catalog zarządza jedynie metadanymi.
Praca z tabelami obcymi Dostęp tylko do odczytu danych w systemach zewnętrznych połączonych za pośrednictwem Lakehouse Federation.

Formaty magazynu

Praca z otwartymi formatami tabel, które zapewniają zaawansowane możliwości zarządzania danymi.

Format Description
Delta Lake Domyślny format magazynu zapewniający transakcje ACID, podróż w czasie i wymuszanie schematu dla tabel zarządzanych i zewnętrznych.
Apache Iceberg Otwórz format tabeli na potrzeby integracji z ekosystemem Góry Lodowej, obsługującym zaawansowane zarządzanie metadanymi.

Zarządzanie tabelami

Konfigurowanie i optymalizowanie zachowania tabeli, struktury i wydajności.

Funkcja Description
Ograniczenia tabeli Definiowanie i wymuszanie reguł jakości danych przy użyciu ograniczeń sprawdzania, a nie ograniczeń null.
Wymuszanie schematu Określ, jak usługa Azure Databricks obsługuje zmiany schematu i wymuszanie typu danych podczas zapisu.
Partycjonowanie tabel Organizowanie danych według kluczy partycji w celu zwiększenia wydajności zapytań i zarządzania danymi.
Monitorowanie rozmiaru tabeli Monitorowanie i analizowanie użycia i wzorców wzrostu magazynu tabel.
Konwertowanie zewnętrzne na zarządzane Migrowanie tabel zewnętrznych do zarządzanych tabel w celu zwiększenia wydajności i zarządzania.
Odnajdywanie partycji zewnętrznych Automatyczne odnajdywanie i rejestrowanie partycji w tabelach zewnętrznych przechowywanych w magazynie w chmurze.