Azure HDInsight を使用したオープン ソース ソフトウェア (OSS) 分析ソリューションの構築

中級
データ エンジニア
データ サイエンティスト
Azure HDInsight

このラーニング パスでは、HDInsight を紹介し、このテクノロジを適用して実際のさまざまな課題を解決する方法を説明します。

前提条件

次の前提条件を完了する必要があります

  • Azure portal に正常にログインする
  • Azure のストレージ オプションについて理解する
  • Azure のコンピューティング オプションについて理解する

このラーニング パス内のモジュール

このモジュールの最後に、Azure HDInsight が、最も一般的なオープン ソース フレームワークを使用して大量のデータを効率的に処理できる、フル マネージドのクラウド サービスであることを学習します。

このモジュールでは、パフォーマンスとコストの両方の観点から HDInsight を最適に使用できるようにするためのさまざまな構成を学習します。

このモジュールでは、HDInsight クラスターを作成し、クラスターを監視し、プロビジョニングに関する一般的な問題に注意する方法について説明します。

HBase により、列ファミリで整理されたスキーマなしのデータベースにおいて、大量の非構造化データと半構造化データのランダム アクセスと厳密な整合性が提供される方法について学習します。

このモジュールでは、Azure HDInsight を Apache Kafka と Apache Spark と合わせて使用することで、クラウド上にリアルタイムのストリーミング データ分析パイプラインとアプリケーションを作成する方法を学習します。

このモジュールを完了することで、ビッグデータ セットに対してアドホックなクエリを実行できるようになります。 HDInsight 対話型クエリの使用は、1 秒未満のクエリ待機時間を実現するのに役立ちます。

Azure HDInsight とその他の Azure サービスは、包括的な多層セキュリティ ソリューションを提供し、これは Microsoft とお客様の間の共同責任で成り立ちます。