Korzystanie z platformy Apache Spark w usłudze Microsoft Fabric
Apache Spark to podstawowa technologia do analizy danych na dużą skalę. Usługa Microsoft Fabric zapewnia obsługę klastrów Spark, umożliwiając analizowanie i przetwarzanie danych w usłudze Lakehouse na dużą skalę.
Cele szkolenia
Ten moduł obejmuje następujące zagadnienia:
- Konfigurowanie platformy Spark w obszarze roboczym usługi Microsoft Fabric
- Identyfikowanie odpowiednich scenariuszy dla notesów platformy Spark i zadań platformy Spark
- Analizowanie i przekształcanie danych przy użyciu ramek danych platformy Spark
- Wykonywanie zapytań dotyczących danych w tabelach i widokach przy użyciu usługi Spark SQL
- Wizualizowanie danych w notesie platformy Spark
Wymagania wstępne
Przed rozpoczęciem tego modułu należy zapoznać się z interfejsem usługi Microsoft Fabric i podstawowymi pojęciami.