Usar o Apache Spark no Microsoft Fabric
O Apache Spark é uma tecnologia central para análise de dados em larga escala. O Microsoft Fabric fornece suporte para clusters Spark, permitindo que você analise e processe dados em um Lakehouse em escala.
Objetivos de aprendizagem
Neste módulo, irá saber como:
- Configurar o Spark em um espaço de trabalho do Microsoft Fabric
- Identificar cenários adequados para blocos de anotações e trabalhos do Spark
- Usar dataframes do Spark para analisar e transformar dados
- Usar o Spark SQL para consultar dados em tabelas e exibições
- Visualizar dados em um bloco de anotações do Spark
Pré-requisitos
Antes de iniciar este módulo, você deve estar familiarizado com a interface do Microsoft Fabric e os conceitos principais.