Az Apache Spark használata a Microsoft Fabricben
Az Apache Spark a nagy léptékű adatelemzés alapvető technológiája. A Microsoft Fabric támogatja a Spark-fürtöket, így nagy méretekben elemezheti és feldolgozhatja az adatokat egy Lakehouse-ban.
Tanulási célkitűzések
Ebben a modulban a következőket sajátíthatja el:
- A Spark konfigurálása Microsoft Fabric-munkaterületen
- Megfelelő forgatókönyvek azonosítása Spark-jegyzetfüzetekhez és Spark-feladatokhoz
- Adatszűréshez és adatbetöltéshez való csatlakozás a Spark használatával
- Spark-adatkeretek használata adatok elemzéséhez és átalakításához
- Adatok lekérdezése táblákban és nézetekben a Spark SQL használatával
- Adatok vizualizációja Spark-jegyzetfüzetekben
Előfeltételek
A modul megkezdése előtt ismernie kell a Microsoft Fabric felületét és alapvető fogalmait.