Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować się zalogować lub zmienić katalog.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Usługa Azure Databricks udostępnia wiele typów tabel i formatów magazynu w celu spełnienia różnych potrzeb związanych z zarządzaniem danymi. W tej sekcji omówiono tabele zarządzane, zewnętrzne i obce oraz formaty magazynu Usługi Delta Lake i Apache Iceberg, które zapewniają zaawansowane funkcje, takie jak niepodzielność, spójność, izolacja i trwałość (ACID) oraz podróże czasowe.
Podstawowe pojęcia
Poznaj podstawy typów tabel, formatów magazynu i integracji wykazu aparatu Unity.
| Temat | Description |
|---|---|
| Pojęcia dotyczące tabel | Podstawowe pojęcia i podstawowe informacje o typach tabel, formatach magazynu i integracji wykazu aparatu Unity. |
Typy tabel
Poznaj różne typy tabel i ich możliwości w różnych scenariuszach zarządzania danymi.
| Typ tabeli | Description |
|---|---|
| Zarządzane przez Unity Catalog tabele w Azure Databricks dla Delta Lake i Apache Iceberg | Usługa Azure Databricks zarządza plikami metadanych i danych. Służy do nowych tabel wymagających zoptymalizowanej wydajności. |
| Tabele tymczasowe | Tablice zarządzane przez katalog Unity o zakresie sesji dla danych pośrednich. Tylko magazyny SQL. |
| praca z tabelami zewnętrznymi | Dane przechowywane w systemach zewnętrznych. Unity Catalog zarządza jedynie metadanymi. |
| Praca z tabelami obcymi | Dostęp tylko do odczytu danych w systemach zewnętrznych połączonych za pośrednictwem Lakehouse Federation. |
Formaty magazynu
Praca z otwartymi formatami tabel, które zapewniają zaawansowane możliwości zarządzania danymi.
| Format | Description |
|---|---|
| Delta Lake | Domyślny format magazynu zapewniający transakcje ACID, podróż w czasie i wymuszanie schematu dla tabel zarządzanych i zewnętrznych. |
| Apache Iceberg | Otwórz format tabeli na potrzeby integracji z ekosystemem Góry Lodowej, obsługującym zaawansowane zarządzanie metadanymi. |
Zarządzanie tabelami
Konfigurowanie i optymalizowanie zachowania tabeli, struktury i wydajności.
| Funkcja | Description |
|---|---|
| Ograniczenia tabeli | Definiowanie i wymuszanie reguł jakości danych przy użyciu ograniczeń sprawdzania, a nie ograniczeń null. |
| Wymuszanie schematu | Określ, jak usługa Azure Databricks obsługuje zmiany schematu i wymuszanie typu danych podczas zapisu. |
| Partycjonowanie tabel | Organizowanie danych według kluczy partycji w celu zwiększenia wydajności zapytań i zarządzania danymi. |
| Monitorowanie rozmiaru tabeli | Monitorowanie i analizowanie użycia i wzorców wzrostu magazynu tabel. |
| Konwertowanie zewnętrzne na zarządzane | Migrowanie tabel zewnętrznych do zarządzanych tabel w celu zwiększenia wydajności i zarządzania. |
| Odnajdywanie partycji zewnętrznych | Automatyczne odnajdywanie i rejestrowanie partycji w tabelach zewnętrznych przechowywanych w magazynie w chmurze. |