Uwaga
Dostęp do tej strony wymaga autoryzacji. Może spróbować zalogować się lub zmienić katalogi.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Tabela znajduje się w schemacie i zawiera wiersze danych. Domyślny typ tabeli utworzony w Azure Databricks to tabela zarządzana przez Unity Catalog.
Podstawowym czynnikiem różnicującym typy tabel w usłudze Azure Databricks jest katalog właściciela, zgodnie z opisem w poniższej tabeli.
Typ tabeli | Zarządzanie wykazem | Obsługa odczytu/zapisu | Optymalizacja wydajności | Optymalizacja kosztów magazynu |
---|---|---|---|---|
Zarządzane | Katalog Unity | Tak | Tak | Tak |
Zewnętrzne | Brak (tylko pliki) | Tak | Tylko ręczne | Tylko ręczne |
Zagraniczny | Zewnętrzna usługa systemu lub katalogu | Tylko do odczytu | Nie. | Nie. |
W poniższym przykładzie przedstawiono tabelę o nazwie prod.people_ops_employees
zawierającą dane o pięciu pracownikach. Metadane są rejestrowane w Unity Catalog, a dane są przechowywane w magazynie w chmurze.
Formaty magazynu: Delta Lake i Apache Iceberg
Typy tabel w usłudze Azure Databricks definiują sposób, w jaki dane są własnością i do których uzyskiwany jest dostęp. Osobno, format przechowywania definiuje, jak dane są fizycznie ustrukturyzowane i śledzone na dysku.
Usługa Azure Databricks obsługuje dwa podstawowe formaty otwartych tabel: Delta Lake i Apache Iceberg. Te formaty danych dodają transakcyjną warstwę przechowywania danych, która śledzi metadane i umożliwia zgodność z ACID, podróżowanie w czasie oraz inne funkcje.
- Usługa Delta Lake jest domyślnym formatem magazynu dla tabel zarządzanych i zewnętrznych w usłudze Azure Databricks.
- Platforma Apache Iceberg jest obsługiwana w tabelach zarządzanych i obcych w usłudze Azure Databricks. Ten format jest przydatny podczas integracji z ekosystemem Góry Lodowej.
Tabele zarządzane
Tabele zarządzane obejmują zarządzanie bazowymi plikami danych i rejestracjami w metadanych. Usługa Databricks zaleca używanie tabel zarządzanych za każdym razem, gdy tworzysz nową tabelę. Tabele zarządzane w katalogu Unity są domyślną opcją podczas tworzenia tabel w Azure Databricks. Zobacz Tabele zarządzane przez katalog Unity w usłudze Azure Databricks dla Delta Lake i Apache Iceberg.
Tabele zewnętrzne
Tabele zewnętrzne, czasami nazywane tabelami niezarządzanych, odwołują się do danych przechowywanych poza usługą Databricks w zewnętrznym systemie magazynu, takim jak magazyn obiektów w chmurze. Rozdzielają zarządzanie źródłowymi plikami danych od rejestracji katalogu metadanych. Katalog Unity obsługuje tabele zewnętrzne w kilku formatach, w tym Delta Lake. Tabele zewnętrzne Unity Catalog mogą przechowywać pliki danych przy użyciu typowych formatów czytelnych przez systemy zewnętrzne. Zobacz Praca z tabelami zewnętrznymi.
Tabele zewnętrzne
Tabele obce reprezentują dane przechowywane w systemach zewnętrznych połączonych z usługą Azure Databricks za pośrednictwem usługi Lakehouse Federation. Tabele obce są tylko do odczytu w usłudze Azure Databricks. Zobacz Praca z tabelami obcymi.
Tabele w katalogu Unity
W katalogu Unity tabele znajdują się na trzecim poziomie trzypoziomowej przestrzeni nazw (catalog.schema.table
), jak pokazano na następującym diagramie.
Podstawowe uprawnienia tabeli
Większość operacji tabel wymaga uprawnień USE CATALOG
i USE SCHEMA
w wykazie i schemacie zawierającym tabelę.
Poniższa tabela zawiera podsumowanie dodatkowych uprawnień wymaganych do powszechnych operacji na tabelach w Unity Catalog.
Operacja | Uprawnienia |
---|---|
Tworzenie tabeli |
CREATE TABLE w schemacie zawierającym |
Wykonywanie zapytań względem tabeli |
SELECT na stole |
Aktualizowanie, usuwanie, scalanie lub wstawianie danych do tabeli |
SELECT i MODIFY na stole |
Usuń tabelę |
MANAGE na stole |
Zastąp tabelę |
MANAGE na tabeli, CREATE TABLE w schemacie zawierającym |
Aby uzyskać więcej informacji na temat uprawnień w Unity Catalog, zobacz Zarządzanie uprawnieniami w Unity Catalog.