Introdução
O ponto de partida para análise de dados usando o HDInsight é criar um cluster do HDInsight. Após a conclusão dessa etapa, você pode executar uma variedade de atividades de leitura de dados para realizar operações analíticas ad hoc. Em seguida, você pode monitorar o desempenho do cluster quando ele estiver operacional e estabelecer o desempenho da linha de base e solucionar problemas. Neste módulo, você vai:
- Criar um cluster do Spark para HDInsight
- Executar consultas em um cluster do Spark para HDInsight
- Monitorar um cluster do Spark para HDInsight
- Aprender a corrigir problemas comuns de provisionamento