Uso de Apache Spark en Microsoft Fabric

Intermedio
Analista de datos
Ingeniero de datos
Microsoft Fabric

Apache Spark es una de las tecnologías principales para el análisis de datos a gran escala. Microsoft Fabric admite clústeres de Spark, lo que permite analizar y procesar datos de un almacén de lago a gran escala.

Objetivos de aprendizaje

En este módulo aprenderá a:

  • Configurar Spark en un área de trabajo de Microsoft Fabric.

  • Identificar escenarios adecuados para cuadernos y trabajos de Spark

  • Usar DataFrames de Spark para analizar y transformar datos.

  • Usar Spark SQL para consultar datos en tablas y vistas.

  • Visualización de datos en un cuaderno de Spark

Requisitos previos

Antes de iniciar este módulo, debe estar familiarizado con la interfaz de Microsoft Fabric y los conceptos básicos.