Korzystanie z platformy Apache Spark w usłudze Microsoft Fabric

Średni
Data Analyst
Data Engineer
Microsoft Fabric

Apache Spark to podstawowa technologia do analizy danych na dużą skalę. Usługa Microsoft Fabric zapewnia obsługę klastrów Spark, umożliwiając analizowanie i przetwarzanie danych w usłudze Lakehouse na dużą skalę.

Cele szkolenia

Ten moduł obejmuje następujące zagadnienia:

  • Konfigurowanie platformy Spark w obszarze roboczym usługi Microsoft Fabric
  • Identyfikowanie odpowiednich scenariuszy dla notesów platformy Spark i zadań platformy Spark
  • Analizowanie i przekształcanie danych przy użyciu ramek danych platformy Spark
  • Wykonywanie zapytań dotyczących danych w tabelach i widokach przy użyciu usługi Spark SQL
  • Wizualizowanie danych w notesie platformy Spark

Wymagania wstępne

Przed rozpoczęciem tego modułu należy zapoznać się z interfejsem usługi Microsoft Fabric i podstawowymi pojęciami.