Wprowadzenie

Ukończone

Usługa Azure Databricks oferuje wysoce skalowalną platformę do analizy danych i przetwarzania przy użyciu platformy Apache Spark.

Platforma Spark to elastyczna platforma, która obsługuje wiele różnych języków programowania i interfejsów API. Większość zadań przetwarzania i analizy danych można wykonać przy użyciu interfejsu API ramki danych, na którym skupimy się w tym module.

Ten moduł obejmuje następujące zagadnienia:

  • Opisz kluczowe elementy architektury platformy Apache Spark.
  • Tworzenie i konfigurowanie klastra Spark.
  • Opis przypadków użycia platformy Spark.
  • Platforma Spark umożliwia przetwarzanie i analizowanie danych przechowywanych w plikach.
  • Wizualizowanie danych przy użyciu platformy Spark.