Udostępnij za pośrednictwem


Wprowadzenie do tabel usługi Azure Databricks

Tabela znajduje się w schemacie i zawiera wiersze danych. Domyślny typ tabeli utworzony w Azure Databricks to tabela zarządzana przez Unity Catalog.

Podstawowym czynnikiem różnicującym typy tabel w usłudze Azure Databricks jest katalog właściciela, zgodnie z opisem w poniższej tabeli.

Typ tabeli Zarządzanie wykazem Obsługa odczytu/zapisu Optymalizacja wydajności Optymalizacja kosztów magazynu
Zarządzane Katalog Unity Tak Tak Tak
Zewnętrzne Brak (tylko pliki) Tak Tylko ręczne Tylko ręczne
Zagraniczny Zewnętrzna usługa systemu lub katalogu Tylko do odczytu Nie. Nie.

W poniższym przykładzie przedstawiono tabelę o nazwie prod.people_ops_employees zawierającą dane o pięciu pracownikach. Metadane są rejestrowane w Unity Catalog, a dane są przechowywane w magazynie w chmurze.

Przykładowa tabela zawierająca dane pracowników

Formaty magazynu: Delta Lake i Apache Iceberg

Typy tabel w usłudze Azure Databricks definiują sposób, w jaki dane są własnością i do których uzyskiwany jest dostęp. Osobno, format przechowywania definiuje, jak dane są fizycznie ustrukturyzowane i śledzone na dysku.

Usługa Azure Databricks obsługuje dwa podstawowe formaty otwartych tabel: Delta Lake i Apache Iceberg. Te formaty danych dodają transakcyjną warstwę przechowywania danych, która śledzi metadane i umożliwia zgodność z ACID, podróżowanie w czasie oraz inne funkcje.

  • Usługa Delta Lake jest domyślnym formatem magazynu dla tabel zarządzanych i zewnętrznych w usłudze Azure Databricks.
  • Platforma Apache Iceberg jest obsługiwana w tabelach zarządzanych i obcych w usłudze Azure Databricks. Ten format jest przydatny podczas integracji z ekosystemem Góry Lodowej.

Tabele zarządzane

Tabele zarządzane obejmują zarządzanie bazowymi plikami danych i rejestracjami w metadanych. Usługa Databricks zaleca używanie tabel zarządzanych za każdym razem, gdy tworzysz nową tabelę. Tabele zarządzane w katalogu Unity są domyślną opcją podczas tworzenia tabel w Azure Databricks. Zobacz Tabele zarządzane przez katalog Unity w usłudze Azure Databricks dla Delta Lake i Apache Iceberg.

Tabele zewnętrzne

Tabele zewnętrzne, czasami nazywane tabelami niezarządzanych, odwołują się do danych przechowywanych poza usługą Databricks w zewnętrznym systemie magazynu, takim jak magazyn obiektów w chmurze. Rozdzielają zarządzanie źródłowymi plikami danych od rejestracji katalogu metadanych. Katalog Unity obsługuje tabele zewnętrzne w kilku formatach, w tym Delta Lake. Tabele zewnętrzne Unity Catalog mogą przechowywać pliki danych przy użyciu typowych formatów czytelnych przez systemy zewnętrzne. Zobacz Praca z tabelami zewnętrznymi.

Tabele zewnętrzne

Tabele obce reprezentują dane przechowywane w systemach zewnętrznych połączonych z usługą Azure Databricks za pośrednictwem usługi Lakehouse Federation. Tabele obce są tylko do odczytu w usłudze Azure Databricks. Zobacz Praca z tabelami obcymi.

Tabele w katalogu Unity

W katalogu Unity tabele znajdują się na trzecim poziomie trzypoziomowej przestrzeni nazw (catalog.schema.table), jak pokazano na następującym diagramie.

diagram modelu obiektów Unity Catalog, z naciskiem na tabelę

Podstawowe uprawnienia tabeli

Większość operacji tabel wymaga uprawnień USE CATALOG i USE SCHEMA w wykazie i schemacie zawierającym tabelę.

Poniższa tabela zawiera podsumowanie dodatkowych uprawnień wymaganych do powszechnych operacji na tabelach w Unity Catalog.

Operacja Uprawnienia
Tworzenie tabeli CREATE TABLE w schemacie zawierającym
Wykonywanie zapytań względem tabeli SELECT na stole
Aktualizowanie, usuwanie, scalanie lub wstawianie danych do tabeli SELECT i MODIFY na stole
Usuń tabelę MANAGE na stole
Zastąp tabelę MANAGE na tabeli, CREATE TABLE w schemacie zawierającym

Aby uzyskać więcej informacji na temat uprawnień w Unity Catalog, zobacz Zarządzanie uprawnieniami w Unity Catalog.