Usar o Apache Spark no Microsoft Fabric

Intermédio
Data Analyst
Data Engineer
Microsoft Fabric

O Apache Spark é uma tecnologia central para análise de dados em larga escala. O Microsoft Fabric fornece suporte para clusters Spark, permitindo que você analise e processe dados em um Lakehouse em escala.

Objetivos de aprendizagem

Neste módulo, irá saber como:

  • Configurar o Spark em um espaço de trabalho do Microsoft Fabric
  • Identificar cenários adequados para blocos de anotações e trabalhos do Spark
  • Usar dataframes do Spark para analisar e transformar dados
  • Usar o Spark SQL para consultar dados em tabelas e exibições
  • Visualizar dados em um bloco de anotações do Spark

Pré-requisitos

Antes de iniciar este módulo, você deve estar familiarizado com a interface do Microsoft Fabric e os conceitos principais.