Uso de Apache Spark en Microsoft Fabric

Intermedio
Analista de datos
Ingeniero de datos
Microsoft Fabric

Apache Spark es una de las tecnologías principales para el análisis de datos a gran escala. Microsoft Fabric proporciona compatibilidad con clústeres de Spark, lo que le permite analizar y procesar datos en un almacén de lago a escala.

Objetivos de aprendizaje

En este módulo aprenderá a:

  • Configurar Spark en un área de trabajo de Microsoft Fabric.
  • Identificar escenarios adecuados para cuadernos y trabajos de Spark.
  • Uso de Spark para conectarse a orígenes de datos e ingerir datos
  • Usar DataFrames de Spark para analizar y transformar datos.
  • Usar Spark SQL para consultar datos en tablas y vistas.
  • Visualizar datos en un cuaderno de Spark.

Requisitos previos

Antes de iniciar este módulo, debe estar familiarizado con la interfaz de Microsoft Fabric y los conceptos básicos.