Использование Delta Lake в Azure Synapse Analytics
Delta Lake — это реляционная система хранения с открытым кодом для Spark, на основе которой можно реализовать архитектуру озера данных в Azure Synapse Analytics.
Цели обучения
В этом модуле рассматриваются следующие задачи:
- Описать основные функции и возможности Delta Lake.
- Создавать и использовать таблицы Delta Lake в пуле Spark Synapse Analytics.
- Создавать таблицы каталога Spark для данных Delta Lake.
- Использовать таблицы Delta Lake для потоковой передачи данных.
- Запрашивать таблицы Delta Lake из пула SQLSynapse Analytics.
Предварительные требования
Чтобы извлечь максимальную пользу из этого модуля, вам потребуются знания о работе с пулами Spark в Azure Synapse Analytics. Рекомендуем начала пройти модуль Анализ данных с помощью Apache Spark в Azure Synapse Analytics.