HDInsight を使用する場合
HDInsight の最大の強みは、サービスで提供されるさまざまな構成の範囲です。 これにより、さまざまなワークロードをサポートできます。 これらのワークロードには、データのバッチ処理、ストリーミング データの処理、データウェアハウスやデータ サイエンス ワークロードの管理などがあります。 この機能により、特にビジネスプロセスに複数のワークロードが含まれている場合に、HDInsight は魅力的な選択肢となります。
たとえば、組織が単に Power BI を使用して履歴レポートを表示するためにデータ ウェアハウスを構築する場合は、Power BI で Azure SQL Data Warehouse を使用することが適切と考えられます。 同様に、組織が単にデータ サイエンス ソリューションを使用して高度な分析を実行する必要がある場合は、Azure Databricks のみを使用することをお勧めします。
ただし、組織のワークロードに、履歴レポートと高度な分析のための取り込みデータが含まれており、分析が必要なストリーミング データがある場合は、HDInsight を使用することをお勧めします。 すべてのデータを Data Lake の 1 つの場所に取り込むことができます。 その後、適切な HDInsight 構成を使用して、バッチ処理、データ ウェアハウジング、データ サイエンス操作、およびストリーミング ワークロードを管理できます。 コンピューティングとストレージが分離されているため、この管理は同じデータの上でシームレスに実行できます。 また、操作が複数ではなく単一のデータ ストアで実行されるため、ストレージのコストを最小限に抑えることができます。
HDInsight の差別化要因
上記のシナリオに加えて、 HDInsight がビッグ データ ワークロードにとって最適なものとなる、主な差別化要因を次に示します。
- 個別にスケーラブルなコンピューティングとストレージ
- ワークロードまたはスケジュールに基づくワーカー ノードの自動スケールする
- マスター ノードの柔軟性とフォールト トレランス
- エンタープライズ セキュリティ
- SDK
コンピューティングとストレージを分離し、ワークロードやスケジュールに応じた自動クラスタースケーリングを使用すると、コストを大幅に最適化できます。 HDInsight のマスター ノードは、障害に対する回復力を備えています。 マスター ノードは、フォールト トレラントな仮想マシンによって支えられており、99.9% の SLA を持つ可用性の高いサービスが実現されます。 Microsoft Entra 統合には、認証と認可のエンタープライズ セキュリティ機能が備わっています。 これらの機能を暗号化および仮想ネットワークのサポートと共に使用することで、データにアクセスできるユーザーをきめ細かく制御できます。 HDInsight はさまざまな SDK によって支えられており、さまざまな IDE においてクラスターの作成と開発を複数の言語で行うことができます。