Ingesta de datos con cuadernos de Spark y Microsoft Fabric
Descubra cómo usar Apache Spark y Python para la ingesta de datos en un almacén de lago de datos de Microsoft Fabric. Los cuadernos de Fabric proporcionan una solución escalable y sistemática.
Objetivos de aprendizaje
Al término de este módulo, podrá hacer lo siguiente:
Ingesta de datos externos en almacenes de lago de datos de Fabric mediante Spark
Configuración de la autenticación y optimización de origen externo
Carga de datos en un almacén de lago de datos como archivos o como tablas Delta
Requisitos previos
Experiencia con Apache Spark y Python
Conocimientos básicos sobre la extracción, transformación y carga de datos