Episode

Lernen Sie zusammen Microsoft Fabric Ep202: Verwenden von Apache Spark in Microsoft Fabric

durch Heini Ilmarinen, Nikola Ilic, Kay Sauter, Sunoj Kumar

Apache Spark ist eine Kerntechnologie für umfassende Datenanalysen. Microsoft Fabric bietet Unterstützung für Spark-Cluster, sodass Sie Daten in einem Lakehouse im großen Maßstab analysieren und verarbeiten können.

Lernziele

  • Konfigurieren von Spark in einem Microsoft Fabric-Arbeitsbereich
  • Geeignete Szenarios für Spark-Notebooks und Spark-Aufträge
  • Verwenden von Spark-Dataframes zum Analysieren und Transformieren von Daten
  • Verwenden von Spark SQL zum Abfragen von Daten in Tabellen und Sichten
  • Visualisieren von Daten in einem Spark-Notebook

Kapitel

  • 00:00: Einführung
  • 05:12 - Fabric Career Hub
  • 10:10 - Lernziele
  • 15:33 - Vorbereiten der Verwendung von Apache Spark
  • 18:04 - Übersicht über die Spark-Integration
  • 33:47 - Demo - Erstellen eines Seehauses
  • 56:27 - Demo - Speichern eines Datenframes
  • 01:04:12 – Arbeiten mit Daten mithilfe von Spark SQL
  • 01:08:55 - Demo - Verwenden von Spark SQL
  • 01:22:14 - Zusammenfassung

Verbinden

Fortgeschrittene Anfänger
Datenanalyst
Datentechniker
Microsoft Fabric