Implementar uma solução de análise de dados com o Azure Databricks

Percurso de Aprendizagem
5 Módulos

Intermédio

Data Engineer

Azure Databricks

Saiba como tirar partido do Apache Spark e dos clusters avançados na plataforma Azure Databricks para executar grandes cargas de trabalho de engenharia de dados na cloud.

Pré-requisitos

Nenhuma

Módulos neste percurso de aprendizagem

Explore Azure Databricks

O Azure Databricks é um serviço de nuvem que fornece uma plataforma escalável para análise de dados usando o Apache Spark.

Usar o Apache Spark no Azure Databricks

O Azure Databricks é baseado no Apache Spark e permite que engenheiros e analistas de dados executem trabalhos do Spark para transformar, analisar e visualizar dados em escala.

Usar o Delta Lake no Azure Databricks

O Delta Lake é uma área de armazenamento relacional de código aberto para o Spark que você pode usar para implementar uma arquitetura de data lakehouse no Azure Databricks.

Usar SQL Warehouses no Azure Databricks

O Azure Databricks fornece SQL Warehouses que permitem que os analistas de dados trabalhem com dados usando consultas SQL relacionais familiares.

Executar Blocos de Anotações do Azure Databricks com o Azure Data Factory

Usar pipelines no Azure Data Factory para executar blocos de anotações no Azure Databricks permite automatizar processos de engenharia de dados em escala de nuvem.