Пошаговое руководство. Создание пустой базы данных Lake

В этой статье вы узнаете, как создать пустую базу данных Lake в Azure Synapse Analytics с помощью конструктора баз данных. Конструктор баз данных позволяет легко создавать и развертывать базы данных без написания кода.

Предварительные требования

  • Для работы с шаблоном базы данных Lake из коллекции требуются по крайней мере разрешения роли пользователя Synapse.
  • Для создания базы данных Lake необходимы разрешения администратора или участника Synapse либо издателя артефактов Synapse в рабочей области Synapse.
  • Требуются разрешения "Участник для данных BLOB-объектов хранилища" для озера данных при использовании варианта создания таблицы Из озера данных.

Создание базы данных озера из шаблонов баз данных

  1. В Главном концентраторе рабочей области Azure Synapse Analytics откройте вкладку Данные слева. Откроется вкладка Данные, на которой отобразится список баз данных, которые уже существуют в рабочей области.

  2. Наведите указатель мыши на кнопку + и выберите пункт База данных Lake.

    Снимок экрана: создание пустой базы данных озера

  3. Откроется вкладка конструктора баз данных с пустой базой данных.

  4. В конструкторе базы данных справа расположены свойства, которые необходимо настроить.

    • Имя — имя базы данных. Имя невозможно изменить после публикации базы данных, поэтому выбирайте его правильно.
    • Описание — описание базы данных является необязательным, но позволяет пользователям понять назначение базы.
    • Параметры хранилища для базы данных — это раздел, содержащий сведения о хранилище по умолчанию для таблиц в базе данных. Параметры по умолчанию применяются к каждой таблице в базе данных, если она не переопределена в самой таблице.
    • Связанная служба — это связанная служба по умолчанию, используемая для хранения данных в Azure Data Lake Storage. Отобразится служба по умолчанию, связанная с рабочей областью Synapse, но связанную службу можно изменить на любую учетную запись хранения ADLS.
    • Входная папка, используемая для установки контейнера по умолчанию и пути к папке в связанной службе с помощью браузера файлов.
    • Формат данных — базы данных Lake в Azure Synapse поддерживают Parquet и текст с разделителями в качестве форматов хранения данных.

Примечание

Вы всегда можете переопределять параметры хранилища по умолчанию для каждой таблицы по отдельности, а параметры по умолчанию можно настраивать. Если вы не уверены, что выбрать, то сможете задать эти настройки позже.

  1. Чтобы добавить таблицу в базу данных, нажмите кнопку + Таблица.

    • Пользовательский — добавляет новую таблицу на холст.
    • В шаблоне — открывается коллекция, в которой можно выбрать шаблон базы данных для использования при добавлении новой таблицы. Дополнительные сведения см. в разделе Создание базы данных Lake из шаблона базы данных.
    • Из Data Lake позволяет импортировать схему таблицы с помощью данных, уже имеющихся в папке Lake.
  2. Выберите Пользовательский. На холсте появится новая таблица с именем Table_1.

  3. Затем можно настроить Table_1, включая имя таблицы, ее описание, параметры хранилища, столбцы и отношения. Дополнительные сведения см. в разделе Изменение базы данных Lake.

  4. Добавьте новую таблицу из Data Lake, выбрав + Таблица, а затем Из Data Lake.

  5. Появится панель Создание внешней таблицы из Data Lake. Укажите в панели приведенные ниже данные и выберите Продолжить.

    • Имя внешней таблицы — имя, которое нужно присвоить создаваемой таблице.
    • Связанная служба — связанная служба, содержащая расположение файла данных в Azure Data Lake Storage.
    • Входной файл или папка — используйте браузер файлов для перехода к файлу в Lake, с помощью которого нужно создать таблицу, и его выбора. Снимок экрана: параметры создания внешней таблицы из области озера данных
    • На следующем экране можно выполнить предварительный просмотр файла в Azure Synapse и определить схему.
    • Будет выполнен переход на страницу Новая внешняя таблица, где можно обновить все параметры, связанные с форматом данных, и Просмотр данных, чтобы проверить правильность определения файла в Synapse.
    • После установки необходимых параметров нажмите кнопку Создать.
    • На холст будет добавлена новая таблица с выбранным именем, а в разделе Параметры хранилища для таблицы отобразится указанный файл.
  6. Теперь, когда база данных настроена, ее можно опубликовать. Если вы используете интеграцию Git с рабочей областью Synapse, необходимо зафиксировать изменения и объединить их в ветвь совместной работы. Дополнительные сведения об управлении исходным кодом в Azure Synapse. Если вы используете режим Synapse Live, можно выбрать "Опубликовать".

    • Перед публикацией база данных будет проверена на наличие ошибок. Все найденные ошибки отображаются на вкладке уведомлений с инструкциями по их устранению.

      Снимок экрана: панель проверки с ошибками проверки в базе данных

    • При публикации будет создана схема базы данных в Azure Synapse Metastore. После публикации объекты базы данных и таблицы будут видны другим службам Azure и будут обеспечивать передачу метаданных из базы данных в такие приложения, как Power BI и Microsoft Purview.

  7. Теперь вы создали пустую базу данных Lake в Azure Synapse и добавили в нее таблицы с пользовательскими настройками и параметром из Data Lake.

Следующие шаги

Продолжайте изучение возможностей конструктора баз данных, используя приведенные ниже ссылки.