База данных озера

Служба озера Database в Azure Synapse Analytics позволяет клиентам объединять и увязывать между собой структуру баз данных, метаданные о хранящейся информации и описание того, как и где эти данные должны храниться. База данных озера решает проблему современных озер данных, где сложно понять структуру информации.

Общие сведения о базе данных озера

Конструктор баз данных

Новый конструктор баз данных в Synapse Studio позволяет создать модель данных для базы данных озера и добавить в нее дополнительные сведения. Каждую сущность и атрибут можно описать, чтобы предоставить дополнительные сведения о модели, которая содержит не только сущности, но и связи. В частности, неспособность смоделировать связи создавала сложности для взаимодействия в озере данных. Теперь эти сложности устранены благодаря интегрированному конструктору, поддерживающему возможности, которые ранее были доступны в базах данных, но не в озере. Кроме того, возможность добавлять в модель описания и демонстрационные значения позволяет людям, которые будут взаимодействовать с ней, лучше понять данные благодаря контекстной информации.

Хранилище данных

База данных озера использует озеро данных в учетной записи службы хранилища Azure для хранения своего содержимого. Данные могут храниться в формате Parquet, Delta или CSV, а для оптимизации хранилища можно использовать разные параметры. Каждая база данных озера использует связанную службу, которая позволяет определить расположение корневой папки данных. Для каждой сущности в этой папке базы данных в озере данных по умолчанию создаются отдельные папки. По умолчанию все таблицы в базе данных озера используют один формат, но форматы и расположение данных при необходимости можно изменить для каждой отдельной сущности.

Примечание

При публикации базы данных озера не создаются никакие базовые структуры или схемы, необходимые для запроса данных в Spark или SQL. После публикации загрузите данные в базу данных озера с помощью конвейеров, чтобы начать создавать запросы.

В настоящее время поддержка разностного формата для баз данных озера не поддерживается в Synapse Studio.

Синхронизация объектов базы данных озера между хранилищем и Synapse является однонаправленной. Обязательно выполните любое создание или изменение схемы объектов базы данных озера с помощью конструктора баз данных в Synapse Studio. Если вместо этого вы внесете такие изменения из Spark или непосредственно в хранилище, определения баз данных озера будут не синхронизированы. В этом случае в конструкторе баз данных могут отображаться старые определения базы данных озера. Вам потребуется реплицировать и опубликовать такие изменения в конструкторе баз данных, чтобы обеспечить синхронизацию баз данных озера.

Вычислительный ресурс базы данных

База данных озера доступна в бессерверном пуле SQL Synapse SQL и в Apache Spark, предоставляя пользователям возможность отделить хранилище от вычислений. Метаданные, связанные с базой данных озера, позволяют различным механизмам вычислений не только предлагать интегрированный интерфейс, но и использовать дополнительные сведения (например, связи), которые изначально не поддерживались в озере данных.

Следующие шаги

Продолжайте изучение возможностей конструктора баз данных, используя приведенные ниже ссылки.