Uso de Apache Spark en Microsoft Fabric
Apache Spark es una de las tecnologías principales para el análisis de datos a gran escala. Microsoft Fabric admite clústeres de Spark, lo que permite analizar y procesar datos de un almacén de lago a gran escala.
Objetivos de aprendizaje
En este módulo aprenderá a:
Configurar Spark en un área de trabajo de Microsoft Fabric.
Identificar escenarios adecuados para cuadernos y trabajos de Spark
Usar DataFrames de Spark para analizar y transformar datos.
Usar Spark SQL para consultar datos en tablas y vistas.
Visualización de datos en un cuaderno de Spark
Requisitos previos
Antes de iniciar este módulo, debe estar familiarizado con la interfaz de Microsoft Fabric y los conceptos básicos.