Usare Apache Spark in Microsoft Fabric

Intermedio
Analista dati
Data engineer
Microsoft Fabric

Apache Spark è una tecnologia di base per l'analisi dei dati su larga scala. Microsoft Fabric offre supporto per i cluster Spark, consentendo di analizzare ed elaborare i dati in un lakehouse su larga scala.

Obiettivi di apprendimento

Contenuto del modulo:

  • Configurare Spark in un'area di lavoro di Microsoft Fabric
  • Identificare scenari adatti per notebook Spark e processi Spark
  • Usare i dataframe Spark per analizzare e trasformare i dati
  • Usare Spark SQL per eseguire query sui dati in tabelle e viste
  • Visualizzare i dati in un notebook Spark

Prerequisiti

Prima di iniziare questo modulo, è necessario avere familiarità con l'interfaccia e i concetti di base di Microsoft Fabric.