クラウド規模の分析の概要

2025-01-24

クラウド規模の分析は、デプロイとガバナンスを簡素化するために、Azure ランディングゾーンに基づいて構築されます。 Azure ランディングゾーンの主な目的は、アプリケーションまたはワークロードを Azure にデプロイするときに、必要なインフラストラクチャが既に配置されていることを確認することです。クラウド規模の分析ランディングゾーンをデプロイする前に、azure 用のクラウド導入フレームワークを使用して、プラットフォームランディングゾーンを持つ Azure ランディングゾーンアーキテクチャをデプロイする必要があります。

ソブリンワークロードの場合、Microsoft はエンタープライズ規模の Azure ランディングゾーンの一種であるソブリンランディングゾーン (SLZ)を提供します。 SLZ は、高度なソブリン制御を必要とする組織を対象としています。クラウド規模の分析は、この Azure ランディングゾーンバリアントに対してデプロイできます。

クラウド規模の分析には、アプリケーションランディングゾーンへのデプロイが含まれます。通常、これらのゾーンはランディングゾーン管理グループの下に存在します。ポリシーは、Microsoft が提供するサンプルテンプレートに絞り込まれます。

これらのサンプルテンプレートは、data lakehouse とデータメッシュデプロイに使用できます。

クラウド規模の分析の評価

多くの場合、企業は、特定のユースケースやプロジェクト、またはエンドツーエンドのクラウド規模分析の技術的な詳細の定義を開始する前に、明確さや規範的なガイダンスを求めています。ビジネスが全体的なデータ戦略を策定するにつれて、現在の使用の範囲で必要なすべての戦略原則を確実に考慮することは困難な場合があります。

これらの課題を考慮しながら、このエンドツーエンドの分析情報の実装を迅速化するために、Microsoft はクラウド規模の分析の規範的なシナリオを開発しました。これは、クラウド規模の分析の計画を策定するで説明されている主要なテーマと一致します。

クラウド規模の分析は、クラウド導入フレームワークに基づいて構築され、Azure Well-Architected Framework の原則を適用します。クラウド導入フレームワークには、クラウド運用モデル、参照アーキテクチャ、プラットフォームテンプレートに関する規範的なガイダンスとベストプラクティスが用意されています。このガイダンスは、最も困難で洗練された複雑な環境の一部からの実際の経験に基づいています。

クラウド規模の分析は、分析ワークロードをホストおよび実行するためのランディングゾーンの構築と運用化の準備に役立ちます。強化されたセキュリティ、ガバナンス、コンプライアンスの基盤にランディングゾーンを構築します。ランディングゾーンはスケーラブルでモジュール式ですが、自律性とイノベーションをサポートします。

データアーキテクチャの歴史

1980 年代後半に、データウェアハウス第 1 世代が導入されました。このモデルは、企業全体の異なるデータソースを結合します。 2000 年代後半には、第 2 世代が登場し、Hadoop やデータレイクなどのビッグデータエコシステムが導入されました。 2010 年代半ばには、クラウドデータプラットフォームが導入されました。Kappa や Lambda アーキテクチャなどのストリーミングデータインジェストが導入されました。 2020 年代初頭には、データレイクハウス、データメッシュ、データファブリック、データ中心の運用パターンが導入されました。

これらの進歩にもかかわらず、多くの組織では引き続き一元化されたモノリシックプラットフォーム (第 1 世代) を使用しています。このシステムはある程度まで問題なく機能します。ただし、相互に依存するプロセス、緊密に結合されたコンポーネント、極度に専門化が進んだチームが原因でボトルネックが発生する可能性があります。抽出、変換、読み込み (ETL) のジョブが目立つようになり、配信のスケジュールに遅れが出る可能性があります。

データウェアハウスとデータレイクは引き続き価値があり、アーキテクチャ全体で重要な役割を果たします。次のドキュメントでは、これらの従来のスケーリングプラクティスを使用する場合に発生する可能性があるいくつかの課題について説明します。これらの課題は特に、データソース、要件、チーム、出力が変化する複雑な組織に関連しています。

クラウド規模の分析への移行

現在の分析データアーキテクチャと運用モデルに、データウェアハウス、データレイク、データレイクハウス構造、データファブリック、またはデータメッシュを含めることができます。

各データモデルには、独自のメリットと課題があります。クラウド規模の分析を使用すると、現在のアプローチをデータ管理に移行して、インフラストラクチャと共に進化させることができます。

基盤として機能し、スケーリングが実現されるエンドツーエンドのクラウド規模の分析フレームワークを作成するために、どのデータプラットフォームやシナリオでもサポートできます。

分析資産の管理

2 つ目の考慮事項は、組織がデータガバナンスを実装する方法を決定することです。

データガバナンスとは、ビジネス運用、レポート、分析で使用するデータが検出可能で正確で信頼できるデータであり、保護できることを保証するプロセスです。

多くの企業で期待されることは、データと AI によって競争上の優位性を高めることです。その結果、経営幹部は、データ駆動型になるという決意で AI イニシアチブを後援することに熱心に取り組みます。ただし、AI を有効にするには、信頼できるデータを使用する必要があります。そうしないと、意思決定の正確性が損なわれる可能性があり、決定が遅れる可能性があります。または、アクションが見逃され、結果に影響を与える可能性があります。企業は、データの品質が低いことを望んでいません。デジタル変革がデータに与えた影響を確認するまで、データ品質を修正するのは簡単に思えるかもしれません。

ハイブリッドマルチクラウドと分散データランドスケープにデータが分散している組織は、データの場所を見つけて管理することに苦労しています。管理されていないデータは、ビジネスに大きな影響を与える可能性があります。データの品質が低いと、データエラーによってプロセスエラーと遅延が発生するため、ビジネス操作に影響します。また、データ品質が低い場合、ビジネス上の意思決定やコンプライアンスを維持する機能にも影響します。分析システムで品質の問題を修正する方が、インジェストフェーズの早い段階でデータ品質ルールを適用するよりも複雑でコストがかかる可能性があるため、多くの場合、ソースでデータ品質を確保することをお勧めします。です。データアクティビティの追跡と管理を支援するには、データガバナンスに次のものが含まれている必要があります。

データ検出。
データ品質。
ポリシーの作成。
データ共有。
メタデータ。

分析資産のセキュリティ保護

データガバナンスを推進するもう 1 つの大きな要因は、データ保護です。データ保護は、規制に関する法律への準拠を確保し、データ侵害を防ぐのに役立ちます。データのプライバシーと増加するデータ侵害により、データ保護が最優先事項になっています。データ侵害は、個人を特定できる顧客データなどの機密データに対するリスクを強調します。データプライバシー違反またはデータセキュリティ侵害の結果には、次のようなものがあります。

ブランドイメージに深刻なダメージを与えます。
顧客の信頼と市場シェアの損失。
利害関係者の投資収益率と役員給与に影響を与える株価の引き下げ。
監査またはコンプライアンスの失敗による重大な財務上のペナルティ。
法的措置。
たとえば、侵害の二次的な影響は、顧客が個人情報の盗難の被害を受ける可能性があります。

ほとんどの場合、上場企業は侵害を報告する必要があります。侵害が発生した場合、顧客はハッカーではなく会社を非難する可能性があります。顧客は、数か月間会社をボイコットしたり、戻ったりしない可能性があります。

データプライバシーに関する規制法令への準拠に失敗すると、多額の制裁金が発生する可能性があります。データの管理は、これらのリスクを回避するのに役立ちます。

運用モデルと利点

最新のデータ戦略プラットフォームを採用しても、組織が使用するテクノロジが変わるだけではありません。また、組織の運用方法も変更されます。

クラウド規模の分析では、次のような従業員の整理とトレーニングに役立つガイダンスが提供されます。

ペルソナ、ロール、責任の定義。
アジャイル、垂直、クロスドメインの各チームに推奨される構造。
Microsoft Learn を使用した Azure データと AI 認定を含むトレーニングリソース。

また、最新化プロセスを通じてエンドユーザーを引き付け、プラットフォームを進化させ、新しいユースケースをオンボードし続けるのも重要です。

アーキテクチャ

Azure ランディングゾーンは、環境の戦略的設計パスと、技術的に目指している状態を表します。展開とガバナンスが容易になり、機敏性とコンプライアンスを向上させることができます。また、新しいアプリケーションまたはワークロードが環境に追加されたときに、適切なインフラストラクチャが既に配置されていることを確認します。 Microsoft サービスとしてのソフトウェア (SaaS) のガバナンスおよび分析ソリューションと統合された Azure データ管理とデータランディングゾーンは、これらの基本原則を念頭に置いて設計されており、クラウド規模の分析の他の要素と組み合わせると、次のことが可能になります。

セルフサービス。
スケーラビリティ。
早いスタート。
安全。
プライバシー。
最適化された操作。

データ管理ランディングゾーン

データ管理ランディングゾーンでは、組織全体にわたり、プラットフォームの一元化されたデータガバナンスと管理の基盤が提供されます。また、マルチクラウドやハイブリッドインフラストラクチャなど、デジタル資産全体からデータを取り込むための通信も容易になります。

データ管理ランディングゾーンでは、以下のような、データ管理とガバナンスに関するその他の機能が多数サポートされています。

データカタログ。
データ品質管理。
データ分類。
データ系列。
データモデリングリポジトリ。
API カタログ。
データ共有とコントラクト。

ヒント

データカタログ、データ品質管理、またはデータ系列の機能にパートナーソリューションを使用する場合は、データ管理ランディングゾーンに存在する必要があります。または、Microsoft Purview を SaaS ソリューションとしてデプロイし、データ管理ランディングゾーンとデータランディングゾーンの両方に接続することもできます。

データのランディングゾーン

データランディングゾーンは、データ管理ランディングゾーンへの接続を介して共通の管理とガバナンスを維持しながら、データをユーザーに近づけ、セルフサービスを実現します。

データ製品や視覚化などのカスタマイズに加えて、ネットワーク、監視、データの取り込みと処理などの標準サービスをホストします。

データランディングゾーンは、プラットフォームのスケーラビリティを実現する鍵です。組織の規模とニーズに応じて、1 つまたは複数のランディングゾーンから開始できます。

単一のランディングゾーンと複数のランディングゾーンを決定する場合は、リージョンの依存関係とデータ所在地の要件を考慮してください。たとえば、データを特定の場所に留めることが求められる地域の法律や規制が存在するか、などです。

データランディングゾーンは、最初の決定にかかわらず、必要に応じて追加または削除できます。 1 つのランディングゾーンから始める場合は、移行の将来のニーズを回避するために、複数のランディングゾーンに拡張することを計画することをお勧めします。

Note

Microsoft Fabric がデプロイされている場合、データランディングゾーンは、データレイクやその他の Azure データサービスなどの SaaS 以外のソリューションをホストします。

ランディングゾーンの詳細については、「クラウド規模の分析のための Azure ランディングゾーン」を参照してください。

まとめ

このドキュメントセット、特にガバナンス、セキュリティ、運用、ベストプラクティスの各セクションを読んだ後は、デプロイテンプレートを使用して概念実証環境を設定することをお勧めします。これらのテンプレートとアーキテクチャガイダンスを使用すると、Azure および Microsoft SaaS テクノロジの一部を実際に体験できます。詳細については、「作業開始のチェックリスト」を参照してください。

次の手順

クラウド規模の分析をクラウド導入戦略に統合する

次の方法で共有

クラウド規模の分析の概要

クラウド規模の分析の評価

データ アーキテクチャの歴史

クラウド規模の分析への移行

最新のデータ プラットフォームと必要な結果

分析資産の管理

分析資産のセキュリティ保護

運用モデルと利点

アーキテクチャ

データ管理ランディング ゾーン

データのランディング ゾーン

まとめ

次の手順

フィードバック

その他のリソース

データアーキテクチャの歴史

最新のデータプラットフォームと必要な結果

データ管理ランディングゾーン

データのランディングゾーン