Создание решений аналитики с открытым кодом при помощи Azure HDInsight

Средний уровень
Инженер по анализу и обработке данных
Специалист по обработке и анализу данных
Azure HDInsight

В этой схеме обучения учащийся представлен в HDInsight и как применить эту технологию для решения различных реальных проблем.

Предварительные требования

Необходимо выполнить следующие предварительные требования

  • Вход на портал Azure
  • Общее представление о вариантах службы хранилища Azure
  • Общее представление о вариантах вычислений в Azure

Модули, включенные в эту схему обучения

После прохождения этого модуля вы узнаете, что Azure HDInsight — это полностью управляемая облачная служба, которая позволяет эффективно обрабатывать большие объемы данных с помощью самых популярных платформ с открытым кодом.

В этом модуле вы узнаете о различных конфигурациях для обеспечения оптимального использования HDInsight как с точки зрения производительности, так и с точки зрения затрат.

В этом модуле вы узнаете, как создать кластер HDInsight, отслеживать кластер и учитывать распространенные проблемы с подготовкой.

Узнайте о том, как HBase обеспечивает произвольный доступ и строгую согласованность для больших объемов неструктурированных и частично структурированных данных в базе данных, не имеющей схемы, которая упорядочена по семействам столбцов.

В этом модуле вы узнаете, как создавать конвейеры и приложения аналитики данных в режиме реального времени в облаке с помощью Azure HDInsight с Apache Kafka и Apache Spark.

В конце этого модуля можно выполнять нерегламентированные запросы в наборе больших данных. Использование интерактивного запроса HDInsight помогает достичь задержек меньше секунды.

Azure HDInsight с другими службами Azure предоставляют комплексное многоуровневое решение для обеспечения безопасности и является общей ответственностью между корпорацией Майкрософт и клиентом.