Implementar uma solução de engenharia de dados com o Azure Databricks

Intermediário
Engenheiro de dados
Azure Databricks

Aprenda a aproveitar o poder do Apache Spark e clusters poderosos em execução na plataforma Azure Databricks para executar grandes cargas de trabalho de engenharia de dados na nuvem.

Pré-requisitos

Nenhum

Módulos neste roteiro de aprendizagem

Você explora diferentes recursos e ferramentas para ajudá-lo a entender e trabalhar com o processamento incremental com o streaming estruturado do Spark.

Você explora diferentes recursos e ferramentas como auxílio para desenvolver padrões de arquitetura com Delta Live Tables do Azure Databricks.

Saiba como otimizar o desempenho com o Spark e o Delta Live Tables no Azure Databricks.

Saiba como implementar fluxos de trabalho de CI/CD no Azure Databricks para automatizar a integração e a entrega de alterações de código.

Saiba como orquestrar e agendar fluxos de trabalho de dados com trabalhos do Azure Databricks. Defina e monitore pipelines complexos, integre-se a ferramentas como o Azure Data Factory e o Azure DevOps e reduza a intervenção manual, levando a uma melhor eficiência, insights mais rápidos e adaptabilidade às necessidades de negócios.

Neste módulo, você explorará diferentes recursos e abordagens para ajudá-lo a proteger e gerenciar seus dados no Azure Databricks usando ferramentas, como o Catálogo do Unity.

O Azure Databricks fornece SQL Warehouses que permitem que analistas de dados trabalhem com os dados usando consultas SQL relacionais familiares.

O uso de pipelines no Azure Data Factory para executar notebooks no Azure Databricks permite automatizar processos de engenharia de dados em escala de nuvem.