Criar soluções de análise de OSS (software livre) com o Azure HDInsight

Intermediário
Engenheiro de dados
Cientista de Dados
Azure HDInsight

Neste roteiro de aprendizagem, o aluno é apresentado ao HDInsight e como aplicar essa tecnologia para resolver vários desafios do mundo real.

Pré-requisitos

O seguinte pré-requisito deve ser concluído

  • Efetuar, com sucesso, logon no portal do Azure
  • Compreender as opções de armazenamento do Azure
  • Compreender as opções de computação do Azure

Módulos neste roteiro de aprendizagem

No final deste módulo, você aprenderá que o Azure HDInsight é um serviço de nuvem totalmente gerenciado que permite processar com eficiência grandes quantidades de dados usando as estruturas de software livre mais populares.

Neste módulo, você aprenderá as diferentes configurações para garantir o uso ideal do HDInsight de uma perspectiva de desempenho e custo.

Neste módulo, você vai aprender a criar um cluster do HDInsight e a monitorar um cluster, além de se tornar ciente de problemas comuns de provisionamento.

Saiba como o HBase fornece acesso aleatório e coerência forte para grandes quantidades de dados não estruturados e semiestruturados em um banco de dados sem esquema e organizado por famílias de colunas.

Neste módulo, você aprenderá a criar pipelines e aplicativos de análise de dados de streaming em tempo real na nuvem usando o Azure HDInsight com Apache Kafka e Apache Spark.

Ao final deste módulo, você pode executar consultas ad hoc em um conjunto de Big Data. Usar a Interactive Query do HDInsight ajuda a obter latências de consulta inferiores a um segundo.

O Azure HDInsight com outros serviços do Azure fornece uma solução abrangente de segurança de várias camadas e é uma responsabilidade compartilhada entre a Microsoft e o cliente.