Introdução

Concluído

O Azure Databricks oferece uma plataforma altamente escalonável para análise e processamento de dados usando o Apache Spark.

O Spark é uma plataforma flexível que dá suporte a várias linguagens de programação e APIs diferentes. A maioria das tarefas de análise e processamento de dados pode ser realizada usando a API Dataframe, na qual nos concentraremos neste módulo.

Neste módulo, você aprenderá a:

  • Descreva os principais elementos da arquitetura do Apache Spark.
  • Crie e configure um cluster do Spark.
  • Descreva casos de uso do Spark.
  • Use o Spark para processar e analisar dados armazenados em arquivos.
  • Use o Spark para visualizar dados.