Поделиться через


Работа с управляемыми таблицами

Azure Databricks управляет жизненным циклом и макетом файлов для управляемой таблицы. Управляемые таблицы — это способ создания таблиц по умолчанию.

Databricks рекомендует использовать управляемые таблицы для всех табличных данных, управляемых в Azure Databricks.

Примечание.

В этой статье рассматриваются управляемые таблицы каталога Unity. Управляемые таблицы в устаревшем хранилище метаданных Hive отличаются поведению. См . статью "Объекты базы данных" в устаревшем хранилище метаданных Hive.

Работа с управляемыми таблицами

Вы можете работать с управляемыми таблицами на всех языках и продуктах, поддерживаемых в Azure Databricks. Для создания, обновления, удаления или запроса управляемых таблиц требуются определенные привилегии. См. статью Управление привилегиями в каталоге Unity.

Не следует использовать средства за пределами Azure Databricks для управления файлами в управляемых таблицах напрямую.

Вы должны взаимодействовать только с файлами данных в управляемой таблице с помощью имени таблицы.

Файлы данных для управляемых таблиц хранятся в расположении управляемого хранилища, связанном с содержащей схемой. См. раздел "Указание расположения управляемого хранилища" в каталоге Unity.

Создание управляемой таблицы

По умолчанию при создании таблицы с помощью команд SQL, Spark или других средств в Azure Databricks таблица управляется.

В следующем синтаксисе SQL показано, как создать пустую управляемую таблицу с помощью SQL. Замените значения-заполнители:

  • <catalog-name>: имя каталога, который будет содержать таблицу.
  • <schema-name>: имя схемы, которая будет содержать таблицу.
  • <table-name>: имя таблицы.
  • <column-specification>: имя и тип данных для каждого столбца.
CREATE TABLE <catalog-name>.<schema-name>.<table-name>
(
  <column-specification>
);

Многие пользователи создают управляемые таблицы из результатов запроса или операций записи dataFrame. В следующих статьях демонстрируется несколько шаблонов, которые можно использовать для создания управляемой таблицы в Azure Databricks:

Необходимые разрешения

Чтобы создать управляемую таблицу, необходимо:

  • Разрешение USE SCHEMA для родительской схемы таблицы.
  • Разрешение USE CATALOG родительского каталога таблицы.
  • Разрешение CREATE TABLE для родительской схемы таблицы.

Удаление управляемой таблицы

Чтобы удалить таблицу, необходимо быть владельцем таблицы. Чтобы удалить управляемую таблицу, выполните следующую команду SQL:

DROP TABLE IF EXISTS catalog_name.schema_name.table_name;

При удалении управляемой таблицы ее базовые данные удаляются из облачного клиента в течение 30 дней.