Сводка

Завершено

Apache Spark — это ключевая технология, используемая в аналитике больших данных, а поддержка пула Spark в Azure Databricks позволяет объединить обработку больших данных в Spark с крупномасштабной аналитикой.

Из этого модуля вы узнали, как выполнять следующие задачи:

  • описание ключевых элементов архитектуры Apache Spark;
  • создание и настройка кластера Spark;
  • описание вариантов использования Spark;
  • использование Spark для обработки и анализа хранимых данных в файлах;
  • визуализация данных с помощью Spark.