Apache Spark gebruiken in Microsoft Fabric

Gevorderd
Data Analyst
Data Engineer
Microsoft Fabric

Apache Spark is een kerntechnologie voor grootschalige gegevensanalyse. Microsoft Fabric biedt ondersteuning voor Spark-clusters, zodat u gegevens in een Lakehouse op schaal kunt analyseren en verwerken.

Leerdoelen

In deze module wordt het volgende behandeld:

  • Spark configureren in een Microsoft Fabric-werkruimte
  • Geschikte scenario's identificeren voor Spark-notebooks en Spark-taken
  • Spark-gegevensframes gebruiken om gegevens te analyseren en te transformeren
  • Spark SQL gebruiken om query's uit te voeren op gegevens in tabellen en weergaven
  • Gegevens visualiseren in een Spark-notebook

Vereisten

Voordat u deze module start, moet u bekend zijn met de Microsoft Fabric-interface en de belangrijkste concepten.