Использование Delta Lake в Azure Synapse Analytics

Средний уровень
Инженер по анализу и обработке данных
Azure Synapse Analytics

Delta Lake — это реляционная система хранения с открытым кодом для Spark, на основе которой можно реализовать архитектуру озера данных в Azure Synapse Analytics.

Цели обучения

В этом модуле рассматриваются следующие задачи:

  • Описать основные функции и возможности Delta Lake.
  • Создавать и использовать таблицы Delta Lake в пуле Spark Synapse Analytics.
  • Создавать таблицы каталога Spark для данных Delta Lake.
  • Использовать таблицы Delta Lake для потоковой передачи данных.
  • Запрашивать таблицы Delta Lake из пула SQLSynapse Analytics.

Предварительные требования

Чтобы извлечь максимальную пользу из этого модуля, вам потребуются знания о работе с пулами Spark в Azure Synapse Analytics. Рекомендуем начала пройти модуль Анализ данных с помощью Apache Spark в Azure Synapse Analytics.