Uso de Apache Spark en Microsoft Fabric
Apache Spark es una de las tecnologías principales para el análisis de datos a gran escala. Microsoft Fabric proporciona compatibilidad con clústeres de Spark, lo que le permite analizar y procesar datos en un almacén de lago a escala.
Objetivos de aprendizaje
En este módulo aprenderá a:
- Configurar Spark en un área de trabajo de Microsoft Fabric.
- Identificar escenarios adecuados para cuadernos y trabajos de Spark.
- Uso de Spark para conectarse a orígenes de datos e ingerir datos
- Usar DataFrames de Spark para analizar y transformar datos.
- Usar Spark SQL para consultar datos en tablas y vistas.
- Visualizar datos en un cuaderno de Spark.
Requisitos previos
Antes de iniciar este módulo, debe estar familiarizado con la interfaz de Microsoft Fabric y los conceptos básicos.