Сводка
Apache Spark — это ключевая технология, используемая в аналитике больших данных, а поддержка пула Spark в Azure Databricks позволяет объединить обработку больших данных в Spark с крупномасштабной аналитикой.
Из этого модуля вы узнали, как выполнять следующие задачи:
- описание ключевых элементов архитектуры Apache Spark;
- создание и настройка кластера Spark;
- описание вариантов использования Spark;
- использование Spark для обработки и анализа хранимых данных в файлах;
- визуализация данных с помощью Spark.