Introducción
Apache Spark es un marco de código abierto para el análisis y el procesamiento de datos a gran escala. Apache Spark se integra en Microsoft Fabric para proporcionar una plataforma de macrodatos para el análisis.
Los clústeres de Fabric Spark proporcionan un marco distribuido eficaz en memoria para el procesamiento de datos a escala. En Microsoft Fabric, Spark se puede usar junto con otros servicios de análisis, como almacenes de lago de datos, cuadernos y canalizaciones de datos.
En este módulo, explorará cómo usar Spark con cuadernos para ingerir, procesar y analizar datos en un almacén de lago de datos de Fabric.