Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować się zalogować lub zmienić katalog.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Usługa Azure Databricks udostępnia wiele typów tabel i formatów magazynu w celu spełnienia różnych potrzeb związanych z zarządzaniem danymi. W tej sekcji omówiono tabele zarządzane, zewnętrzne i obce oraz formaty magazynu Usługi Delta Lake i Apache Iceberg, które zapewniają zaawansowane funkcje, takie jak niepodzielność, spójność, izolacja i trwałość (ACID) oraz podróże czasowe.
Podstawowe pojęcia
Poznaj podstawy typów tabel, formatów magazynu i integracji wykazu aparatu Unity.
| Temat | Description |
|---|---|
| Pojęcia dotyczące tabel | Podstawowe pojęcia i podstawowe informacje o typach tabel, formatach magazynu i integracji wykazu aparatu Unity. |
Typy tabel
Poznaj różne typy tabel i ich możliwości w różnych scenariuszach zarządzania danymi.
| Typ tabeli | Description |
|---|---|
| Tabele zarządzane | Tabele, w których usługa Azure Databricks zarządza zarówno metadanymi, jak i plikami danych. Zalecane w przypadku nowych tabel ze zoptymalizowaną wydajnością i magazynem. |
| tabele zewnętrzne | Tabele odwołujące się do danych przechowywanych w zewnętrznych systemach magazynowania podczas zarządzania metadanymi w wykazie aparatu Unity. |
| Tabele obce | Tabele tylko do odczytu reprezentujące dane w systemach zewnętrznych połączonych za pośrednictwem federacji lakehouse. |
Formaty magazynu
Praca z otwartymi formatami tabel, które zapewniają zaawansowane możliwości zarządzania danymi.
| Format | Description |
|---|---|
| Delta Lake | Domyślny format magazynu zapewniający transakcje ACID, podróż w czasie i wymuszanie schematu dla tabel zarządzanych i zewnętrznych. |
| Apache Iceberg | Otwórz format tabeli na potrzeby integracji z ekosystemem Góry Lodowej, obsługującym zaawansowane zarządzanie metadanymi. |
Zarządzanie tabelami
Konfigurowanie i optymalizowanie zachowania tabeli, struktury i wydajności.
| Funkcja | Description |
|---|---|
| Ograniczenia tabeli | Definiowanie i wymuszanie reguł jakości danych przy użyciu ograniczeń sprawdzania, a nie ograniczeń null. |
| Wymuszanie schematu | Określ, jak usługa Azure Databricks obsługuje zmiany schematu i wymuszanie typu danych podczas zapisu. |
| Partycjonowanie tabel | Organizowanie danych według kluczy partycji w celu zwiększenia wydajności zapytań i zarządzania danymi. |
| Monitorowanie rozmiaru tabeli | Monitorowanie i analizowanie użycia i wzorców wzrostu magazynu tabel. |
| Konwertowanie zewnętrzne na zarządzane | Migrowanie tabel zewnętrznych do zarządzanych tabel w celu zwiększenia wydajności i zarządzania. |
| Odnajdywanie partycji zewnętrznych | Automatyczne odnajdywanie i rejestrowanie partycji w tabelach zewnętrznych przechowywanych w magazynie w chmurze. |