Преобразование данных с помощью Spark в Azure Synapse Analytics

Средний уровень
Инженер по анализу и обработке данных
Azure Synapse Analytics

Инженеры данных обычно нуждаются в преобразовании больших объемов данных. Пулы Apache Spark в Azure Synapse Analytics предоставляют распределенную платформу обработки, которую они могут использовать для достижения этой цели.

Цели обучения

В этом модуле вы научитесь выполнять следующие задачи:

  • Использование Apache Spark для изменения и сохранения кадров данных
  • Файлы данных секционирования для повышения производительности и масштабируемости.
  • Преобразование данных с помощью SQL

Предварительные требования

Прежде чем принимать этот модуль, необходимо ознакомиться с пулами Apache Spark в Azure Synapse Analytics. Рекомендуем начала пройти модуль Анализ данных с помощью Apache Spark в Azure Synapse Analytics.