Implementar uma solução de engenharia de dados com o Azure Databricks
Aprenda a aproveitar o poder do Apache Spark e clusters poderosos em execução na plataforma Azure Databricks para executar grandes cargas de trabalho de engenharia de dados na nuvem.
Pré-requisitos
Nenhum
Código de Conquista
Gostaria de solicitar um código de conquista?
Módulos neste roteiro de aprendizagem
Você explora diferentes recursos e ferramentas para ajudá-lo a entender e trabalhar com o processamento incremental com o streaming estruturado do Spark.
Você explora diferentes recursos e ferramentas como auxílio para desenvolver padrões de arquitetura com Delta Live Tables do Azure Databricks.
Saiba como otimizar o desempenho com o Spark e o Delta Live Tables no Azure Databricks.
Saiba como implementar fluxos de trabalho de CI/CD no Azure Databricks para automatizar a integração e a entrega de alterações de código.
Saiba como orquestrar e agendar fluxos de trabalho de dados com trabalhos do Azure Databricks. Defina e monitore pipelines complexos, integre-se a ferramentas como o Azure Data Factory e o Azure DevOps e reduza a intervenção manual, levando a uma melhor eficiência, insights mais rápidos e adaptabilidade às necessidades de negócios.
Neste módulo, você explorará diferentes recursos e abordagens para ajudá-lo a proteger e gerenciar seus dados no Azure Databricks usando ferramentas, como o Catálogo do Unity.
O Azure Databricks fornece SQL Warehouses que permitem que analistas de dados trabalhem com os dados usando consultas SQL relacionais familiares.
O uso de pipelines no Azure Data Factory para executar notebooks no Azure Databricks permite automatizar processos de engenharia de dados em escala de nuvem.