Сопоставление данных в Azure Synapse Analytics

Что такое средство сопоставления данных?

Средство сопоставления данных — это интерактивный процесс, который помогает пользователям создавать сопоставления ETL и потоки данных для сопоставления из их исходных данных с таблицами базы данных озера Synapse без написания кода. Этот процесс начинается с того, что пользователь выбирает целевые таблицы в базах данных озера Synapse, а затем сопоставляет свои исходные данные с этими таблицами.

Дополнительные сведения о базах данных Synapse Lake см. в статье Обзор шаблонов баз данных Azure Synapse — Azure Synapse Analytics | Документация Майкрософт.

Средство сопоставления данных предоставляет интерактивный интерфейс, с помощью которого пользователь может создать поток данных для сопоставления без необходимости использовать пустой холст. Затем вы можете быстро создать масштабируемый поток данных для сопоставления, выполняемый в конвейерах Synapse.

Начало работы

Средство сопоставления данных запускается в интерфейсе базы данных озера Synapse. Здесь можно выбрать средство сопоставления данных, чтобы начать процесс.

Снимок экрана, показывающий, как открыть данные карты.

Для средства сопоставления данных требуются вычислительные ресурсы, чтобы помочь пользователям выполнить предварительный просмотр данных, а также чтение схемы связанных исходных файлов. При первом использовании данных карты в сеансе необходимо прогреть кластер. Снимок экрана: отладочные кластеры.

Для начала выберите источник данных для сопоставления с таблицами базы данных озера. Сейчас поддерживаются такие источники данных, как базы данных озера Synapse и Azure Data Lake Storage 2-го поколения. Снимок экрана: источники.

Варианты типа файла

При выборе хранилища файлов, например Azure Data Lake Storage 2-го поколения, поддерживаются следующие типы файлов:

  • Модель общих данных
  • Текст с разделителями
  • Parquet

Создание сопоставления данных

Настройте сопоставление данных с выбранным типом источника. Снимок экрана: параметры конфигурации файла данных карты.

Примечание

Вы можете отправить всю папку или один файл. Если выбрать папку, вы сможете сопоставить несколько файлов с таблицами базы данных Lake. Если вы выберете папку, также появится запрос на включение только определенных файлов, если это необходимо.

Назовите сопоставление данных и выберите назначение базы данных озера Synapse. Снимок экрана: именование и назначение.

Сопоставление источника с целевым объектом

Выберите первичную исходную таблицу для сопоставления с целевой таблицей базы данных озера Synapse. Снимок экрана: правила картирования данных.

Новое сопоставление

Используйте кнопку "Создать сопоставление", чтобы добавить метод сопоставления для создания сопоставления или преобразования.

Дополнительный источник

Используйте кнопку "Дополнительный источник", чтобы присоединиться к другому источнику и добавить его в сопоставление.

Просмотр данных

На вкладке Предварительный просмотр данных отображается интерактивный моментальный снимок данных при каждом преобразовании. Дополнительные сведения см. в статье Предварительный просмотр данных в режиме отладки.

Методы сопоставления

Поддерживаются следующие методы сопоставления:

Создание конвейера

Завершив преобразование данных карты, нажмите кнопку Создать конвейер, чтобы создать поток данных сопоставления и конвейер для отладки и запуска преобразования.