Преобразование данных с помощью Spark в Azure Synapse Analytics
Инженеры данных обычно нуждаются в преобразовании больших объемов данных. Пулы Apache Spark в Azure Synapse Analytics предоставляют распределенную платформу обработки, которую они могут использовать для достижения этой цели.
Цели обучения
В этом модуле вы научитесь выполнять следующие задачи:
- Использование Apache Spark для изменения и сохранения кадров данных
- Файлы данных секционирования для повышения производительности и масштабируемости.
- Преобразование данных с помощью SQL
Предварительные требования
Прежде чем принимать этот модуль, необходимо ознакомиться с пулами Apache Spark в Azure Synapse Analytics. Рекомендуем начала пройти модуль Анализ данных с помощью Apache Spark в Azure Synapse Analytics.