Verwenden von Apache Spark in Microsoft Fabric
Apache Spark ist eine Kerntechnologie für umfassende Datenanalysen. Microsoft Fabric unterstützt Spark-Cluster, sodass Sie selbst große Datenmengen in einem Lakehouse analysieren und verarbeiten können.
Lernziele
In diesem Modul lernen Sie Folgendes:
- Konfigurieren von Spark in einem Microsoft Fabric-Arbeitsbereich
- Geeignete Szenarios für Spark-Notebooks und Spark-Aufträge
- Verwenden von Spark zum Herstellen einer Verbindung mit Datenquellen und Erfassungsdaten
- Verwenden von Spark-Dataframes zum Analysieren und Transformieren von Daten
- Verwenden von Spark SQL zum Abfragen von Daten in Tabellen und Sichten
- Visualisieren von Daten in einem Spark-Notebook
Voraussetzungen
Bevor Sie mit diesem Modul beginnen, sollten Sie sich mit der Microsoft Fabric-Benutzeroberfläche und den Kernkonzepten vertraut machen.