Работа с управляемыми таблицами
Azure Databricks управляет жизненным циклом и макетом файлов для управляемой таблицы. Управляемые таблицы — это способ создания таблиц по умолчанию.
Databricks рекомендует использовать управляемые таблицы для всех табличных данных, управляемых в Azure Databricks.
Примечание.
В этой статье рассматриваются управляемые таблицы каталога Unity. Управляемые таблицы в устаревшем хранилище метаданных Hive отличаются поведению. См . статью "Объекты базы данных" в устаревшем хранилище метаданных Hive.
Работа с управляемыми таблицами
Вы можете работать с управляемыми таблицами на всех языках и продуктах, поддерживаемых в Azure Databricks. Для создания, обновления, удаления или запроса управляемых таблиц требуются определенные привилегии. См. статью Управление привилегиями в каталоге Unity.
Не следует использовать средства за пределами Azure Databricks для управления файлами в управляемых таблицах напрямую.
Вы должны взаимодействовать только с файлами данных в управляемой таблице с помощью имени таблицы.
Файлы данных для управляемых таблиц хранятся в расположении управляемого хранилища, связанном с содержащей схемой. См. раздел "Указание расположения управляемого хранилища" в каталоге Unity.
Создание управляемой таблицы
По умолчанию при создании таблицы с помощью команд SQL, Spark или других средств в Azure Databricks таблица управляется.
В следующем синтаксисе SQL показано, как создать пустую управляемую таблицу с помощью SQL. Замените значения-заполнители:
<catalog-name>
: имя каталога, который будет содержать таблицу.<schema-name>
: имя схемы, которая будет содержать таблицу.<table-name>
: имя таблицы.<column-specification>
: имя и тип данных для каждого столбца.
CREATE TABLE <catalog-name>.<schema-name>.<table-name>
(
<column-specification>
);
Многие пользователи создают управляемые таблицы из результатов запроса или операций записи dataFrame. В следующих статьях демонстрируется несколько шаблонов, которые можно использовать для создания управляемой таблицы в Azure Databricks:
Необходимые разрешения
Чтобы создать управляемую таблицу, необходимо:
- Разрешение
USE SCHEMA
для родительской схемы таблицы. - Разрешение
USE CATALOG
родительского каталога таблицы. - Разрешение
CREATE TABLE
для родительской схемы таблицы.
Удаление управляемой таблицы
Чтобы удалить таблицу, необходимо быть владельцем таблицы. Чтобы удалить управляемую таблицу, выполните следующую команду SQL:
DROP TABLE IF EXISTS catalog_name.schema_name.table_name;
При удалении управляемой таблицы ее базовые данные удаляются из облачного клиента в течение 30 дней.