Поделиться через


Создание схем

В этой статье показано, как создавать схемы в каталоге Unity и устаревшем хранилище метаданных Hive.

Сведения о схемах в Azure Databricks, включая сравнение поведения схемы в каталоге Unity и хранилище метаданных Hive, см. в статье "Что такое схемы в Azure Databricks?".

Подготовка к работе

Чтобы создать схему в каталоге Unity, выполните приведенные действия.

  • У вас должно быть хранилище метаданных каталога Unity, связанное с рабочей областью, в которой создается схема.
  • Необходимо иметь USE CATALOG разрешения на доступ к родительскому каталогу схемы и CREATE SCHEMA данные. Эти разрешения вам может предоставить либо администратор хранилища метаданных, либо владелец каталога. Если вы являетесь администратором хранилища метаданных, вы можете предоставить эти привилегии себе.
  • Чтобы указать необязательное управляемое расположение хранилища для таблиц и томов в схеме, необходимо определить внешнее расположение в каталоге Unity и иметь CREATE MANAGED STORAGE привилегии во внешнем расположении. См. раздел "Указание расположения управляемого хранилища" в каталоге Unity.
  • Кластер, используемый для запуска записной книжки для создания схемы, должен использовать режим доступа, совместимый с каталогом Unity. См . режимы доступа. Хранилища SQL всегда поддерживают каталог Unity.

Чтобы создать схему в хранилище метаданных Hive, выполните следующее:

Создание схемы

Чтобы создать схему в каталоге Unity, можно использовать обозреватель каталогов или команды SQL. Чтобы создать схему в хранилище метаданных Hive, необходимо использовать команды SQL.

Обозреватель каталогов

  1. Войдите в рабочую область, связанную с хранилищем метаданных каталога Unity.
  2. Щелкните Значок каталога каталог.
  3. В области каталога слева щелкните каталог, в который нужно создать схему.
  4. В области сведений нажмите кнопку "Создать схему".
  5. Присвойте схеме имя и добавьте любой комментарий, который поможет пользователям понять назначение схемы.
  6. (Необязательно) Укажите расположение управляемого хранилища. Требуется привилегия CREATE MANAGED STORAGE в целевом внешнем расположении. Сведения о расположении управляемого хранилища см. в каталоге Unity и управляемых расположениях для схем.
  7. Нажмите кнопку Создать.
  8. Предоставьте привилегии в схеме. См. статью Управление привилегиями в каталоге Unity.
  9. Нажмите кнопку Сохранить.

SQL

  1. Выполните следующие команды SQL в записной книжке или редакторе sql-запросов. Элементы в квадратных скобках являются необязательными. Вы можете использовать SCHEMA или DATABASE. Замените значения-заполнители:

    • <catalog-name> — имя родительского каталога для схемы. Если вы создаете схему в хранилище метаданных Hive и находитесь в рабочей области с поддержкой каталога Unity, используйте hive_metastore в качестве имени каталога. Если рабочая область не включена для каталога Unity, не указывайте каталог вообще.
    • <schema-name> — имя схемы.
    • <location-path>: необязательный путь к управляемому расположению хранилища. Используется для MANAGED LOCATION каталога Unity и для LOCATION хранилища метаданных Hive. В каталоге Unity необходимо иметь CREATE MANAGED STORAGE привилегии во внешнем расположении для указанного пути. Сведения о расположении управляемого хранилища см. в каталоге Unity и управляемых расположениях для схем.
    • <comment>: необязательное описание или другое примечание.
    • <property-key> = <property-value> [ , ... ]: необязательный параметр. Свойства и значения Spark SQL, заданные для схемы.

    Дополнительные описания параметров см. в разделе CREATE SCHEMA.

    CREATE { DATABASE | SCHEMA } [ IF NOT EXISTS ] <catalog-name>.<schema-name>
        [ MANAGED LOCATION '<location-path>' | LOCATION '<location-path>']
        [ COMMENT <comment> ]
        [ WITH DBPROPERTIES ( <property-key = property_value [ , ... ]> ) ];
    
  2. Предоставьте привилегии в схеме. Сведения о привилегиях каталога Unity см. в разделе "Управление привилегиями" в каталоге Unity.

Вы также можете создать схему с помощью поставщика Databricks Terraform и databricks_schema. Список идентификаторов схем можно получить с помощью databricks_schemas

Следующие шаги