Introdução
O Azure Databricks oferece uma plataforma altamente escalável para análise e processamento de dados usando o Apache Spark.
O Spark é uma plataforma flexível que suporta muitas linguagens de programação e APIs diferentes. A maioria das tarefas de processamento e análise de dados pode ser realizada usando a API Dataframe , que é o que vamos focar neste módulo.
Neste módulo, irá saber como:
- Descreva os principais elementos da arquitetura do Apache Spark.
- Crie e configure um cluster do Spark.
- Descreva casos de uso do Spark.
- Use o Spark para processar e analisar dados armazenados em arquivos.
- Use o Spark para visualizar dados.