Сводка

1 минута

Apache Spark — это ключевая технология, используемая в аналитике больших данных, а поддержка пула Spark в Azure Databricks позволяет объединить обработку больших данных в Spark с крупномасштабной аналитикой.

Из этого модуля вы узнали, как выполнять следующие задачи:

описание ключевых элементов архитектуры Apache Spark;
создание и настройка кластера Spark;
описание вариантов использования Spark;
использование Spark для обработки и анализа хранимых данных в файлах;
визуализация данных с помощью Spark.

Продолжить

Обратная связь