Wprowadzenie
Usługa Azure Databricks oferuje wysoce skalowalną platformę do analizy danych i przetwarzania przy użyciu platformy Apache Spark.
Platforma Spark to elastyczna platforma, która obsługuje wiele różnych języków programowania i interfejsów API. Większość zadań przetwarzania i analizy danych można wykonać przy użyciu interfejsu API ramki danych, na którym skupimy się w tym module.
Ten moduł obejmuje następujące zagadnienia:
- Opisz kluczowe elementy architektury platformy Apache Spark.
- Tworzenie i konfigurowanie klastra Spark.
- Opis przypadków użycia platformy Spark.
- Platforma Spark umożliwia przetwarzanie i analizowanie danych przechowywanych w plikach.
- Wizualizowanie danych przy użyciu platformy Spark.