Implementar uma solução de análise de dados com o Azure Databricks

Intermédio
Data Engineer
Azure Databricks

Saiba como tirar partido do Apache Spark e dos clusters avançados na plataforma Azure Databricks para executar grandes cargas de trabalho de engenharia de dados na cloud.

Pré-requisitos

Nenhuma

Módulos neste percurso de aprendizagem

O Azure Databricks é um serviço de nuvem que fornece uma plataforma escalável para análise de dados usando o Apache Spark.

O Azure Databricks é baseado no Apache Spark e permite que engenheiros e analistas de dados executem trabalhos do Spark para transformar, analisar e visualizar dados em escala.

O Delta Lake é uma área de armazenamento relacional de código aberto para o Spark que você pode usar para implementar uma arquitetura de data lakehouse no Azure Databricks.

O Azure Databricks fornece SQL Warehouses que permitem que os analistas de dados trabalhem com dados usando consultas SQL relacionais familiares.

Usar pipelines no Azure Data Factory para executar blocos de anotações no Azure Databricks permite automatizar processos de engenharia de dados em escala de nuvem.