Azure HDInsight の高可用性ソリューションアーキテクチャのケーススタディ

[アーティクル]
06/08/2023

Azure HDInsight のレプリケーションメカニズムを高可用性ソリューションアーキテクチャに統合できます。この記事では、Contoso Retail の架空のケーススタディを使用して、考えられる高可用性ディザスターリカバリー方法、コストに関する考慮事項、および対応する設計について説明します。

高可用性ディザスターリカバリーの推奨事項には、多数の順列組み合わせが考えられます。各オプションの長所と短所を熟慮した後で、これらのソリューションに到達しています。この記事では、考えられる 1 つのソリューションのみについて説明します。

顧客のアーキテクチャ

次の図は、Contoso Retail のプライマリアーキテクチャを示しています。このアーキテクチャは、ストリーミングワークロード、バッチワークロード、サービスレイヤー、消費レイヤー、ストレージレイヤー、およびバージョン管理で構成されています。

Contoso Retail architecture.

ストリーミングワークロード

デバイスとセンサーによって、メッセージングフレームワークを構成する HDInsight Kafka に送信されるデータが生成されます。 An HDInsight Spark コンシューマーによって、Kafka トピックからの読み取りが行われます。 Spark によって、受信メッセージが変換され、サービスレイヤーの HDInsight HBase クラスターに書き込まれます。

バッチワークロード

Hive と MapReduce 取り込みデータを実行している HDInsight Hadoop クラスターで、オンプレミスのトランザクションシステムからデータが取り込まれます。 Hive と MapReduce によって変換された生データは、Azure Data Lake Storage Gen2 によってバックアップされるデータレイクの論理パーティション上の Hive テーブルに格納されます。 Hive テーブルに格納されたデータは、Spark SQL でも使用可能であり、選別されたデータをサービスのために HBase に格納する前にバッチ変換が行われます。

サービスレイヤー

Apache Phoenix を使用する HDInsight HBase クラスターを使用して、Web アプリケーションと視覚化ダッシュボードにデータが提供されます。内部レポート要件に対応するために、An HDInsight LLAP クラスターが使用されます。

消費レイヤー

Azure API Apps と API Management レイヤーによって、パブリックに公開される Web ページがバックアップされます。内部レポート要件は Power BI によって対応されます。

ストレージレイヤー

エンタープライズデータレイクとして、論理的にパーティション分割された Azure Data Lake Storage Gen2 が使用されます。 Azure SQL DB によって、HDInsight メタストアがバックアップされます。

バージョン管理システム

Azure Pipelines に統合されたバージョン管理システムは、Azure の外部でホストされます。

顧客のビジネス継続性要件

災害が発生した場合に必要とする最小限のビジネス機能を決定することが重要です。

Contoso Retail のビジネス継続性要件

リージョンでの障害またはサービスの正常性の問題から保護される必要がある。
お客様に 404 エラーが表示されないようにする必要がある。パブリックコンテンツを常に提供する必要がある。 (RTO = 0)
ほぼ一年中、5 時間前の古いパブリックコンテンツを表示できる。 (RPO = 5 時間)
ホリデーシーズン中は、パブリックに公開されているコンテンツを常に最新の状態にする必要がある。 (RPO = 0)
ビジネス継続性にとって、社内レポート要件は重要ではないとみなされている。
ビジネス継続性にかかるコストを最適化する。

提案されるソリューション

次の図に、Contoso Retail の高可用性ディザスターリカバリーアーキテクチャを示します。

Contoso solution.

Kafka では、アクティブ/パッシブレプリケーションを使用して、プライマリリージョンからセカンダリリージョンに Kafka トピックがミラー化されます。 Kafka のレプリケーションに対する代替手段として、両方のリージョンに Kafka を生成することができます。

Hive と Spark では、平常時はアクティブプライマリ/オンデマンドセカンダリレプリケーションモデルが使用されます。 Hive レプリケーションプロセスが定期的に実行され、Hive Azure SQL メタストアと Hive ストレージアカウントのレプリケーションが同時に実行されます。 ADF DistCP を使用して、Spark ストレージアカウントが定期的にレプリケートされます。これらのクラスターの一時的な性質は、コストを最適化するのに役立ちます。 RPO に到達するためにレプリケーションは 4 時間ごとにスケジュールされ、5 時間という要件に十分対応します。

HBase レプリケーションでは、平常時はリーダー/フォロワーモデルを使用して、リージョンに関係なくデータが常に確実に提供され、RPO が非常に低くなります。

プライマリリージョンでリージョン障害が発生した場合、ある程度古くなった 5 時間前の Web ページとバックエンドのコンテンツがセカンダリリージョンから提供されます。 Azure サービス正常性ダッシュボードに、5 時間のリカバリ ETA が示されない場合、Contoso Retail では、セカンダリリージョンに Hive および Spark 変換レイヤーを作成した後、すべてのアップストリームデータソースをセカンダリリージョンに向けます。セカンダリリージョンを書き込み可能にすると、プライマリへのレプリケーションを伴うフェールバックプロセスが発生します。

ショッピングシーズンのピーク時は、セカンダリパイプライン全体が常にアクティブになり、実行されます。 Kafka プロデューサーによって、両方のリージョンに対する生成が行われ、HBase レプリケーションはリーダー/フォロワーからリーダー/リーダーに変更され、パブリックに公開されているコンテンツが常に最新の状態になります。

ビジネス継続性にとって重要ではないため、内部レポート用のフェールオーバーソリューションを設計する必要はありません。

次のステップ

この記事で説明した項目の詳細については、次を参照してください。

次の方法で共有

Azure HDInsight の高可用性ソリューションアーキテクチャのケーススタディ

顧客のアーキテクチャ

ストリーミングワークロード

バッチワークロード

サービスレイヤー

消費レイヤー

ストレージレイヤー

バージョン管理システム

顧客のビジネス継続性要件

Contoso Retail のビジネス継続性要件

提案されるソリューション

次のステップ

フィードバック

フィードバック

その他のリソース

次の方法で共有

Azure HDInsight の高可用性ソリューション アーキテクチャのケース スタディ

顧客のアーキテクチャ

ストリーミング ワークロード

バッチ ワークロード

サービス レイヤー

消費レイヤー

ストレージ レイヤー

バージョン管理システム

顧客のビジネス継続性要件

Contoso Retail のビジネス継続性要件

提案されるソリューション

次のステップ

フィードバック

フィードバック

その他のリソース

Azure HDInsight の高可用性ソリューションアーキテクチャのケーススタディ

ストリーミングワークロード

バッチワークロード

サービスレイヤー

ストレージレイヤー