Engenharia de dados com o Azure Databricks

Intermédio
Engenheiro de Dados
Databricks

Saiba como tirar partido do Apache Spark e dos clusters avançados na plataforma Azure Databricks para executar grandes cargas de trabalho de engenharia de dados na cloud.

Pré-requisitos

Nenhum

Módulos neste percurso de aprendizagem

Azure Databricks é um serviço de nuvem que fornece uma plataforma escalável para análise de dados usando Apache Spark.

O Azure Databricks é construído em Apache Spark e permite que engenheiros de dados e analistas geram trabalhos de Spark para transformar, analisar e visualizar dados em escala.

Delta Lake é uma área de armazenamento relacional open source para a Spark que você pode usar para implementar uma arquitetura data lakehouse em Azure Databricks.

A Azure Databricks fornece Armazéns SQL que permitem que os analistas de dados trabalhem com dados usando consultas de SQL relacionais familiares.

A utilização de oleodutos em Azure Data Factory para executar cadernos em Azure Databricks permite-lhe automatizar processos de engenharia de dados à escala de nuvens.