Usar o Apache Spark no Microsoft Fabric

Intermediário
Analista de Dados
Engenheiro de dados
Microsoft Fabric

O Apache Spark é uma tecnologia fundamental para a análise de dados em larga escala. O Microsoft Fabric fornece suporte para clusters Spark, permitindo a análise e o processamento de dados em escala em um lakehouse.

Objetivos de aprendizagem

Neste módulo, você aprenderá a:

  • Configurar o Spark em um workspace do Microsoft Fabric
  • Identificar cenários adequados para notebooks e trabalhos do Spark
  • Usar o Spark para se conectar a fontes de dados e ingerir dados
  • Usar dataframes do Spark para analisar e transformar dados
  • Usar o Spark SQL para consultar dados em tabelas e exibições
  • Visualizar dados em um notebook Spark

Pré-requisitos

Para iniciar este módulo, você deve estar familiarizado com a interface do Microsoft Fabric e os principais conceitos.