クラウド規模の分析をクラウド導入戦略に統合する

Azure のクラウド導入フレームワークの戦略手法を使用して、組織の単一の一元化されたクラウド採用戦略を作成します。 クラウド導入戦略をまだ記録していない場合は、戦略と計画のテンプレートを使用して記録します。

この記事では、より広範な戦略に影響を与えるクラウド規模の分析シナリオに関する考慮事項について説明します。

クラウド規模の分析を実装する前に、データ戦略の計画を立てる必要があります。 1 つのユース ケースで小規模に開始することも、優先順位付けが必要なより大きなユース ケースのセットを使用することもできます。 戦略を立てることは、プロセスを確立し、重視する必要がある柱に関する最初の会話を始めるのに役立ちます。

データ戦略のビジネス結果に優先順位を付ける

成功に導くデータ戦略があると、競争上の優位性が得られます。 データ戦略は、常に目的のビジネス成果に合わせる必要があります。 ほとんどのビジネス成果は、次の 4 つのカテゴリのいずれかに分類できます。

  • 従業員の生産性を高める: 顧客、デバイス、およびコンピューターに関するリアルタイムの知識を従業員に提供します。 この知識により効率的な共同作業が可能となり、顧客やビジネス ニーズに俊敏に対応することができます。

  • 顧客と連携する: ブランドごとに、パーソナライズされて充実した接続エクスペリエンスを提供します。 データと分析情報の力を活用して、顧客体験のすべてのステップに沿って顧客のロイヤルティを強化します。

  • 操作を最適化する: 組織全体で情報のフローを拡大します。 ビジネス プロセスを同期し、データ ドリブンのアプローチを使用して、すべての相互作用を価値のあるものにします。

  • 製品と開発のライフ サイクルを変革する: サービスとオファリングに関するテレメトリ データを収集します。 テレメトリ データを使用して、リリースの優先順位を設定するか、新しい機能を作成し、有効性と導入を継続的に評価します。

ビジネスの結果に優先順位を付けたら、現在のプロジェクトと長期的な戦略的イニシアティブを調べ、それに応じて分類します。 複雑さと影響に基づいて、4 つのカテゴリのビジネス成果をマトリックス形式で組み合わせることを検討します。 また、アーキテクチャの柱を追加して、シナリオをより深く掘り下げることを検討します。

戦略的価値の解放

データ主導型のカルチャを構築することによって、一貫し、前向きで、アジャイルな、情報に基づいた方法でビジネスを推進することには、本質的な複雑さと基になる現実があります。 デプロイ フェーズに入る前に、目的のビジネス成果を達成するのに役立つ一貫性のあるデータ戦略の形成に専念します。

クラウド規模の分析は、イノベーションに重点を置いた動機付けに合わせて行います。 次の一般的な促進要因は、このシナリオをクラウド導入戦略に統合するお客様の動機付けになります。

  • エンタープライズ データ プラットフォームを構築できるスケーラブルな分析フレームワーク
  • データの探索、データ資産の作成、製品開発においてユーザーを支援するセルフサービス
  • 再利用可能なデータ資産、データ コミュニティ、セキュリティで保護されたサードパーティの交換、インプレース共有によるデータ主導のカルチャ
  • ポリシー、共通 ID、機密性、暗号化を用いた、信頼に基づくデータの共有
  • カスタマー エクスペリエンスとエンゲージメントの向上
  • 製品またはサービスの変革
  • 新しい製品またはサービスによる市場の混乱

次の図には、独自の戦略でこれらの動機を実現するのに役立つ重要なテーマが含まれています。 これらのテーマと、それらが一貫性のあるデータ戦略にどのように貢献しているかを慎重に分析してください。 また、それらがどのようにしてデータの戦略的価値を引き出し、一貫したビジネス成長を可能にするかも検討してください。

効率、データの民主化、およびガバナンスを向上させる主要テーマを示す図。

"データ戦略は、データを資産として使用し、ビジネスを推進するための基盤です。 これは、データの問題に対する当座の仕事ではありません。 データの課題を解決するための人、プロセス、テクノロジの配置を定義する、長期的なガイド プランです。"

戦略の作成は 1 つのステップです。 エンタープライズ規模で戦略を実行すると、組織の既存のカルチャ、人、プロセス、テクノロジの選択に大きな課題が発生します。 実行するには、組織のあらゆるレベルで、コミットメントと明確な所有権が必要です。

効率性の向上

クラウドの機敏性により、組織は迅速に適応し、ビジネスのすべての分野で効率を上げる必要があります。 Gartner の新たなリスクに関するレポートによると、組織がデジタル イニシアティブを重視して投資を続けているにもかかわらず、これらの組織の 3 分の 2 は、企業の弱点を露呈し、デジタル イニシアティブを重視して投資を続けているにもかかわらず、期待通りの実績を実現できないことが示されています。

データ管理の運用化

多くの組織は、機敏性を実現するために中央の IT を徐々に分散しています。 組織は、セルフサービス方式で企業全体の統合されたデータにアクセスして困難なビジネス要件を満たすことで、迅速にイノベーションを実現したいと考えています。

企業がデータの可能性を最大限に活用できない理由は多数あります。 企業部門がサイロ化し、各チームがデータ分析にさまざまなツールと標準を使用していることが原因かもしれません。 あるいは、主要業績評価指標をビジネス目標全体に関連付けられていないことが理由になっている可能性があります。

データの民主化は、その価値をビジネスに還元し、ビジネスの成長に向け困難な目標を達成するのに役立ちます。

  • LOB のニーズを理解し、優先順位を付けます。
  • 所有権を有効にし、データをユーザーに近づけるために、ドメイン間でデータを分散します。
  • 分析情報を把握し、ビジネス価値を高めるために、セルフサービス データ製品をデプロイします。

データ ガバナンスの場合、データの民主化による分散化された世界で適切なバランスを取る必要があります。 ガバナンスを厳密に強制しすぎると、イノベーションを妨げる可能性があります。 ただし、少なくともいくつかの主要な原則とプロセスを規定していない場合は、データ サイロが発生する可能性があります。 これらのサイロによって、組織の評判と潜在的な収益が損なわれる可能性があります。 総合的なデータ ガバナンス アプローチは、一貫した方法でデータの戦略的価値を解放するための基礎となります。

よく考えられたデータ戦略がないと、単純に "すぐに始めて"、組織への価値を早く示すことだけが明確なニーズになります。 前述の主要テーマに基づいて行動するか、フレームワークの中で戦略的原則としてそれらのテーマ使用することで、現在のビジネス上の問題に対処します。 それらの主要なテーマを使用すると、検証を繰り返し行いながらもタイムリーな結果を提供する総合的なデータ戦略を作成するのにも役立ちます。 ビジネス リーダーとテクノロジ リーダーは、データから価値を生み出し、簡単な構造化された方法で迅速に拡張するために必要な、考え方と戦略を策定する必要があります。

詳細については、「データ ガバナンスとは」を参照してください。

データ駆動型カルチャの構築

成功するデータ戦略を構築するには、データ駆動型カルチャが必要です。 協調的な参加を促進するオープンなカルチャを開発します。 このようなカルチャにより、従業員全体が組織のビジネス成果について学び、話し合い、改善できるようになります。 データ駆動型カルチャを構築することによりデータによって裏付けられ、各従業員が影響や感化を及ぼす能力も向上します。

道筋の出発点は、組織、業界、成熟度曲線上の現在の位置によって異なります。 次の図は、組織の AI 使用の成熟度レベルを示す成熟度モデルの例を示しています。

組織の成熟度の進化の図。

レベル 0

データの利用にプログラムが使用されておらず一貫性がありません。 社内でのデータの焦点が、アプリケーション開発の観点から見られています。

レベル 0 では、多くの場合、計画されていない分析プロジェクトが組織に存在します。 各アプリケーションは、固有のデータと利害関係者のニーズに高度に分化しています。 さらに、それぞれのアプリケーションにかなりのコード ベースとエンジニアリング チームが対応し、多くが IT 部門の外部でもエンジニアリングされています。 ユース ケースの使用可能性と分析はサイロ化されています。

[レベル 1]

レベル 1 では、チームの形成や戦略の作成が行われますが、分析はまだ部門ごとに細分化されています。 組織は、従来のデータ キャプチャと分析では優れている傾向があります。 クラウド規模のアプローチにある程度取り組もうとしている可能性があります。 たとえば、クラウドからのデータに既にアクセスしている場合があります。

[レベル 2]

組織のイノベーション プラットフォームは、ほぼ準備ができています。 データ品質に対処するためにワークフローが配置されています。 組織は、"理由" に関するいくつかの質問に答えることができます。

レベル 2 では、一元管理されたデータ レイク ストアを使用して、データ ストアの広がりを制御し、データの検出しやすさを向上させるエンドツーエンドのデータ戦略を積極的に探しています。 組織は、集中管理されたデータ レイクにコンピューティングをもたらすスマート アプリケーションの準備ができています。 これらのスマート アプリケーションによって、プライバシー リスク、コンピューティング コスト、および重要なデータのフェデレーション コピーの必要性が軽減されます。

このレベルの組織は、一般的なデータ コンピューティング タスクを対象とした、マルチテナント、一元的にホストされる共有データ サービスを使用する準備も完了しています。 これらの共有データ サービスにより、データサイエンス主導のインテリジェンス サービスからの分析情報を迅速に得ることができます。

レベル 3

組織は包括的なデータ アプローチを使用します。 データに関連するプロジェクトは、ビジネス成果と結びついています。 組織は、分析プラットフォームを用いて予測を行います。

レベル 3 では、組織はデータ資産とアプリケーション開発の両方の観点からデジタル イノベーションをロック解除します。 データ レイクや共有データ サービスなどの基本的なデータ サービスが配置されます。

組織全体にまたがる複数のチームが、重要なビジネス ワークロード、主要なビジネス ユース ケース、測定可能な成果を実現することに成功しています。 テレメトリを使用して新しい共有データ サービスが特定されます。 IT は、全社的なチームにとって信頼できるアドバイザーであり、エンドツーエンドの信頼され接続されたデータ戦略を介して、重要なビジネス プロセスの改善を支援してくれます。

[レベル 4]

レベル 4 では、組織全体が、フレームワーク、企業標準、およびデータドリブンのカルチャを使用します。 オートメーション、データ ドリブン フィードバック ループ、分析とソートメーションのセンター オブ エクセレンスの作動を確認できます。

ビジネスに合わせた目標を構築する

ビジネス ビジョンに沿った優先項目を特定し、"大きく考え、小さく始め、すばやく動く" という信念を維持することが、成功の鍵です。 適切なユース ケースの選択に、必ずしも長くて困難な審査プロセスが必要とは限りません。 投資収益率を検証するのに十分なデータ、大きな欲求、積極的な取り組みがあるビジネス ユニットにおいて、それは現在進行形の問題である可能性があります。 状況は急速に移り変わる可能性があり、そのため、ほとんどの組織は作業を開始するのに苦労することになります。

データ属性について

強力なデータ戦略を構築するには、データがどのように機能するかを理解する必要があります。 データのコア特性を把握することは、データを処理するための原則的なプラクティスを構築するのに役立ちます。

データの移動は高速ですが、その速度が物理法則に逆らうことはできません。 データが作成された土地または業界の法律に準拠している必要があります。

データ自体は変更されませんが、このような課題を軽減するための対策を講じない限り、変更や偶発的な損失が発生しやすくなります。 予期しない変更に対処できるように、制御、データベース、およびストレージの破損対策を設けます。 また、監視、監査、アラート、ダウンストリームのプロセスを配置していることを確認します。

データだけでは、分析情報を生成することも、価値を生み出すこともありません。 分析情報を取得したり、価値を抽出したりするには、データの大部分またはすべてを 4 つの個別のステップで配置する必要があります。

  1. データの取り込み
  2. ストレージ
  3. 処理中
  4. 分析

各ステップには、それぞれ独自の原則、プロセス、ツール、およびテクノロジがあります。

源泉徴収データ資産と関連する洞察は、社会経済、政治、研究、投資に関する意思決定に影響を与える可能性があります。 組織が安全で責任ある方法で分析情報を提供できることが重要です。 明示的に指定されていない限り、生成または取得されたすべてのデータは、データ分類を通過する必要があります。 暗号化は、保存時と転送中の両方で機密データを扱うためのゴールド スタンダードです。

データ、アプリケーション、サービスはすべて独自の引力を持っていますが、最大なのはデータの引力です。 アイサック・ニュートンの伝説のリンゴとは異なり、データは周囲の物体に影響を与える物理的な質量を持っていません。 代わりに待機時間とスループットがあり、それらが分析プロセスのアクセラレータとして機能します。 待機時間、スループット、およびアクセスの容易さのためには、それが望ましくないときでもデータを複製することが必要になります。 人、プロセス、ツール、テクノロジを適切に設定して、組織のデータ ポリシーとそのような要件のバランスを取ります。

アーキテクチャの構成によって、データの処理速度が制御されます。 ソフトウェア、ハードウェア、およびネットワークのイノベーションによって構築が促進されます。 アーキテクチャに関する考慮事項の一部を次に示します。

  • データ分散の設定
  • パーティション分割
  • キャッシュ テクノロジ
  • バッチ処理とストリーム処理
  • バックエンドとクライアント側の処理のバランス

データ戦略を定義する

より優れた製品と価値の高いサービスを構築するための競争上の優位性としてデータを使用することは、新しいことではありません。 しかし、クラウド コンピューティングによって可能になったデータのボリューム、速度、多様性です。

クラウドでの最新のデータ分析プラットフォームの設計は、セキュリティ、ガバナンス、監視、オンデマンドのスケーリング、データ操作、セルフサービスで構成されます。 良いデータ戦略と最善のデータ戦略の違いは、これらのファセット間の相互作用を理解することにあります。 クラウド導入フレームワークなどのツールを使用して、アーキテクチャのまとまり、整合性、ベスト プラクティスを確実なものにすることができます。

効果を発揮するには、データ戦略にデータ ガバナンスのプロビジョニングが含まれている必要があります。 次の図は、データ ガバナンスに焦点を当てた、データ ライフ サイクルの主要なステージを示しています。

データ ライフ サイクルの図。

次のセクションでは、設計原則のデータ戦略レイヤーを決定する際に使用する必要がある考慮事項について説明します。 データからビジネスの結果と価値を提供することに注目します。

データ インジェスト

データ インジェストの重要な考慮事項は、安全でかつ規制に準拠した方法で、要件から運用までのデータ パイプラインをすばやく構築できることです。 重要な要素には、メタデータ駆動型のセルフサービス、データ レイクをハイドレートする低コード テクノロジなどが含まれます。

パイプラインを構築するときは、設計と、データのラングリング、データの分散、コンピューティングの拡張のすべてを検討してください。 また、パイプラインの継続的なインテグレーションと配信のための適切な DevOps サポートを確保する必要もあります。

Azure Data Factory などのツールにより、オンプレミス データ ソース、サービスとしてのソフトウェア (SaaS) データ ソース、および他のパブリックク ラウドからの他のデータ ソースが数多くサポートされます。

記憶域

物理層と論理層の両方のデータにタグを付けて、整理します。 データ レイクは、最新のすべてのデータ分析アーキテクチャの一部です。 組織は、すべてのデータの分類と、それが使用される業界のコンプライアンス要件を満たす、適切なデータ プライバシー、セキュリティ、コンプライアンスの要件を適用する必要があります。 カタログ化とセルフサービスによる組織レベルのデータの民主化により、適切なアクセス制御によってガイドしながら、イノベーションを促進します。

ワークロードに適したストレージを選択します。 最初から最適なストレージを用意できない場合でも、クラウドを使用することで迅速にフェールオーバーし、道筋を再び始めることができます。 アプリケーション要件を基にして、最適なデータベースを選択します。 分析プラットフォームを選択するときは、バッチ データとストリーミング データを処理する機能を検討します。

データ処理

データ処理のニーズは、ワークロードによって異なります。 ほとんどの大規模なデータ処理には、リアルタイム処理とバッチ処理の両方の要素が含まれています。 また、ほとんどの企業には、時系列処理要件の要素と、エンタープライズ検索機能のために自由形式のテキストを処理するニーズがあります。

オンライン トランザクション処理 (OLTP) は、最も一般的な組織の処理要件を発生させます。 いくつかのワークロードには、"ビッグ コンピューティング" とも呼ばれる、ハイパフォーマンス コンピューティング (HPC) などの特殊な処理が必要です。これらのワークロードでは、多数の CPU または GPU ベースのコンピューターを使用して、複雑な数学的タスクを解決します。

特定の特殊化されたワークロードでは、ユーザーは Azure コンフィデンシャル コンピューティングなどの実行環境をセキュリティで保護することができます。これにより、ユーザーは、パブリック クラウド プラットフォームでデータを使用しているときにデータをセキュリティ保護できます。 この状態は、効率的な処理のために必要です。 データは Trusted Execution Environment (TEE、エンクレーブとも呼ばれる) 内で保護されます。 TEE は、外部での表示や変更からコードとデータを保護します。 TEE を使用すると、別の組織のデータ ソースを使用している間でも、データの機密性を損なうことなく AI モデルをトレーニングできます。

分析処理

抽出、変換、読み込み (ETL) の構成は、オンライン分析処理 (OLAP) とデータ ウェアハウスのニーズに関連しています。 ビジネスに合わせたデータ モデルとセマンティック モデルを多くの場合、分析プロセスの一部として実装することにより、組織はビジネス ルールと主要業績評価指標 (KPI) を実装することができます。 1 つの便利な機能は、スキーマ ドリフトの自動検出です。

データ戦略の概要

データ ガバナンスや責任ある AI など、他の考慮事項に対して原則的なアプローチを取ると、後でメリットが得られます。

Microsoft では、公平性、信頼性と安全性、プライバシーとセキュリティ、包括性という 4 つの基本原則に従っています。 4つの原則のすべての基礎となるのは、透明性とアカウンタビリティという 2 つの基本原則です。

Microsoft は、リソースとガバナンスのシステムの開発を通じて、その原則と責任ある AI とを実現します。 このガイドラインの一部では、人間と AI の相互作用、会話 AI、包括設計、AI 公平性チェックリスト、データセットのデータ シートについて説明しています。

さらに、イノベーションのあらゆる段階で、他のユーザーが AI を理解し、保護し、制御するのに役立つ一連のツールも開発しました。 これらのツールは、複数の分野にわたるコラボレーションの取り組みによって責任ある AI を強化し、促進した結果によるものです。 このようなコラボレーションは、ソフトウェア エンジニアリングと開発、ソーシャル サイエンス、ユーザー調査、法律、およびポリシーに及んでいます。

コラボレーションを改善するべく、Microsoft は、InterpretML や Fairlearn など、さまざまなツールをオープンソース化しています。 他のユーザーはこれらのオープン ソース ツールに貢献し、構築することができます。 また、Microsoft は、Azure Machine Learning を通じてツールを民主化しました。

データ主導型組織への方向転換は、ニュー ノーマルでの競争上の優位性を実現するための基礎となります。 Microsoft は、お客様がアプリケーションのみのアプローチからアプリケーションとデータ主導のアプローチに移行するのを支援したいと考えています。 アプリケーションとデータに重点を置いたアプローチによって、ビジネスの成果に影響を与える現在および将来のユースケースにおいて再現性とスケーラビリティを確保するエンドツーエンドのデータ戦略を構築することができます。

デジタル イノベーションの解放の図。

コミットメント、コミュニケーション、エンゲージメントを促進する

データ戦略の成功に関係するすべての重要な役割は、採用されたアプローチと一般的なビジネス目標を明確に理解する必要があります。 主要な役割には、リーダーシップ チーム (C レベル)、事業単位、IT、運用、デリバリー チームなどが含まれます。

コミュニケーションは、このフレームワークの最も重要な部分の 1 つです。 組織は、役割間で効果的にコミュニケーションするためのプロセスを考案する必要があります。 コミュニケーションによって、現在のプロジェクトを効果的に進めることができます。 また、将来の包括的なデータ戦略を構築するという全体的な目的に沿って、関係者全員が最新の情報を入手するために役立つフォーラムを確立することができます。

エンゲージメントは、次の 2 つのグループの間で不可欠です。

  • データ戦略を設計および実装するチーム メンバー
  • データに貢献し、データを消費し、活用するチーム メンバー (データに基づいて意思決定を行い、結果を構築する事業単位など)

また、ユーザーのエンゲージメントなしに構築されたデータ戦略や関連するデータ プラットフォームには、関連性と導入に関する課題のリスクがあります。

次の 2 つの戦略的プロセスにより、このフレームワークで成果を出すことができます。

  • センター オブ エクセレンスの形成
  • アジャイル デリバリー方法の導入

詳細については、「クラウド規模の分析に向けた計画を作成する」を参照してください。

価値を届ける

標準化および構造化された方法で、成功基準に照らしてデータ製品を提供すると、その提供によって反復的なフレームワークが検証されます。 さらに、学習を通じて継続的にイノベーションを行うことで、ビジネスの信頼を築き、データ戦略の目標を広げるのに役立ちます。 このプロセスにより、組織全体でより明確で迅速な導入が実現されます。

データ プラットフォームにも同じことが当てはまります。 複数のチームがかなり自律的に運用するように設定されている場合は、調和に向けて進める必要があります。 反復的なプロセスがあります。 多くの場合、組織の設定、準備、およびビジネスの調整に大幅な変更が必要です

次のステップ

次の記事を参照して、クラウド導入体験に関するガイダンスを見つけ、クラウド導入シナリオを成功させてください。