Az Apache Spark használata a Microsoft Fabricben

Haladó
Data Analyst
Data Engineer
Microsoft Fabric

Az Apache Spark a nagy léptékű adatelemzés alapvető technológiája. A Microsoft Fabric támogatja a Spark-fürtöket, így nagy méretekben elemezheti és feldolgozhatja az adatokat egy Lakehouse-ban.

Tanulási célkitűzések

Ebben a modulban a következőket sajátíthatja el:

  • A Spark konfigurálása Microsoft Fabric-munkaterületen
  • Megfelelő forgatókönyvek azonosítása Spark-jegyzetfüzetekhez és Spark-feladatokhoz
  • Spark-adatkeretek használata adatok elemzéséhez és átalakításához
  • Adatok lekérdezése táblákban és nézetekben a Spark SQL használatával
  • Adatok vizualizációja Spark-jegyzetfüzetekben

Előfeltételek

A modul megkezdése előtt ismernie kell a Microsoft Fabric felületét és alapvető fogalmait.