Verwenden von Apache Spark in Microsoft Fabric

Fortgeschrittene Anfänger
Datenanalyst
Datentechniker
Microsoft Fabric

Apache Spark ist eine Kerntechnologie für umfassende Datenanalysen. Microsoft Fabric unterstützt Spark-Cluster, sodass Sie selbst große Datenmengen in einem Lakehouse analysieren und verarbeiten können.

Lernziele

In diesem Modul lernen Sie Folgendes:

  • Konfigurieren von Spark in einem Microsoft Fabric-Arbeitsbereich
  • Geeignete Szenarios für Spark-Notebooks und Spark-Aufträge
  • Verwenden von Spark zum Herstellen einer Verbindung mit Datenquellen und Erfassungsdaten
  • Verwenden von Spark-Dataframes zum Analysieren und Transformieren von Daten
  • Verwenden von Spark SQL zum Abfragen von Daten in Tabellen und Sichten
  • Visualisieren von Daten in einem Spark-Notebook

Voraussetzungen

Bevor Sie mit diesem Modul beginnen, sollten Sie sich mit der Microsoft Fabric-Benutzeroberfläche und den Kernkonzepten vertraut machen.