Ingesta de datos con cuadernos de Spark y Microsoft Fabric

Módulo
7 Unidades

Intermedio

Analista de datos

Ingeniero de datos

Científico de datos

Microsoft Fabric

Descubra cómo usar Apache Spark y Python para la ingesta de datos en un almacén de lago de datos de Microsoft Fabric. Los cuadernos de Fabric proporcionan una solución escalable y sistemática.

Objetivos de aprendizaje

Al término de este módulo, podrá hacer lo siguiente:

Ingesta de datos externos en almacenes de lago de datos de Fabric mediante Spark
Configuración de la autenticación y optimización de origen externo
Carga de datos en un almacén de lago de datos como archivos o como tablas Delta

Requisitos previos

Experiencia con Apache Spark y Python
Conocimientos básicos sobre la extracción, transformación y carga de datos

Introducción min
Conexión a datos con Spark min
Escritura de datos en un almacén de lago de datos min
Considere los usos que pueden tener los datos ingeridos min
Ejercicio: Ingesta de datos con cuadernos de Spark y Microsoft Fabric min
Prueba de conocimientos min
Resumen min