クラウド規模の分析をクラウド導入戦略に統合する

2024-11-27

Azure のクラウド導入フレームワークの戦略手法を使用して、組織の単一の一元化されたクラウド導入戦略を作成します。クラウド導入戦略をまだ記録していない場合は、戦略を使用し、テンプレートを計画します。

この記事では、より広範な戦略に影響を与えるクラウド規模の分析シナリオに関する考慮事項について説明します。

クラウド規模の分析を実装する前に、データ戦略の計画を立てることもできます。 1 つのユースケースで小規模から始めたり、優先順位付けを必要とする大規模なユースケースセットを作成したりできます。戦略を立てることは、プロセスを確立し、集中する必要がある柱に関する最初の会話を開始するのに役立ちます。

データ戦略のビジネス成果に優先順位を付ける

データ戦略を成功に収めれば、競争上の優位性が得られます。データ戦略は、常に目的のビジネス成果に合わせる必要があります。ほとんどのビジネス成果は、次の 4 つのカテゴリのいずれかに分類できます。

従業員に力を与える: 顧客、デバイス、マシンに関するリアルタイムの知識を従業員に提供します。この知識は、顧客やビジネスのニーズを迅速に満たすために効率的に共同作業を行うのに役立ちます。
顧客と関わる: ブランドに着想を得た豊富でパーソナライズされたつながりのあるエクスペリエンスを提供します。データと分析情報の力を活用して、顧客体験のすべてのステップに沿って顧客ロイヤルティを促進します。
運用の最適化: 組織全体の情報フローを増やします。ビジネスプロセスを同期し、データドリブンアプローチを使用して、すべての対話を価値あるものにします。
製品と開発ライフサイクルを変革する: サービスとオファリングに関するテレメトリデータを収集します。テレメトリデータを使用して、リリースに優先順位を付けたり、新しい機能を作成したり、有効性と導入を継続的に評価したりできます。

ビジネス成果に優先順位を付けた後、現在のプロジェクトと長期的な戦略的イニシアチブを確認し、それに応じて分類します。複雑さと影響に基づくマトリックス形式で、ビジネス成果の 4 つのカテゴリを組み合わせることを検討してください。また、アーキテクチャの柱を追加して、シナリオの詳細を確認することを検討してください。

戦略的価値を引き出す

データ駆動型のカルチャを構築し、一貫した先読み、アジャイル、および情報に基づく方法でビジネスを前進させるには、固有の複雑さと現実があります。展開フェーズに入る前に、目的のビジネス成果を達成するのに役立つ一貫性のあるデータ戦略の形成に重点を置く必要があります。

クラウド規模の分析は、イノベーションに重点を置いた動機と一致しています。次の一般的な要因は、顧客がクラウド導入戦略にこのシナリオを統合する動機付けを行います。

エンタープライズデータプラットフォームを構築できるスケーラブルな分析フレームワーク
セルフサービス。データ探索、データ資産の作成、および製品開発においてユーザーを支援します
再利用可能なデータ資産、データコミュニティ、セキュリティで保護されたサードパーティの交換、インプレース共有を備えたデータ主導のカルチャ
ポリシー、共通 ID、機密性、暗号化を使用して、自信を持ってデータを共有する
カスタマーエクスペリエンスとエンゲージメントの向上
製品またはサービスの変革
新しい製品やサービスによる市場の中断

次の図には、独自の戦略でこれらの動機を実現するのに役立つ主要なテーマが含まれています。これらのテーマと、それらが一貫性のあるデータ戦略にどのように貢献しているかを慎重に分析します。また、データの戦略的価値を引き出し、一貫したビジネスの成長を可能にする方法を検討します。

効率の向上、データの民主化、ガバナンスの主要なテーマを示す図。

「データ戦略は、データを資産として使用し、ビジネスを前進させる基盤です。これは、データの問題に対するパッチジョブではありません。これは、データの課題を解決するために配置する人、プロセス、テクノロジを定義する長期的なガイド計画です。"

戦略の作成は 1 つのステップです。エンタープライズ規模で戦略を実行することは、組織の既存の文化、人、プロセス、テクノロジの選択に大きな課題を伴います。実行にはコミットメントと、組織のすべてのレベルでの明確な所有権が必要です。

効率の向上

クラウドの機敏性により、組織は迅速に適応し、ビジネスのあらゆる領域に効率をもたらす必要があります。 Gartnerの新たなリスクに関するレポートによると、組織がデジタルイニシアチブに集中して投資し続けているにもかかわらず、これらの組織の3分の2は企業の弱点を示しており、デジタルイニシアチブに集中して投資し続けているにもかかわらず、期待に応えませんでした。

データ管理の運用化

多くの組織では、機敏性を実現するために中央 IT を徐々に分散化しています。組織は迅速にイノベーションを行いたいと考えており、セルフサービス方式でエンタープライズ全体の統合データにアクセスすることで、困難なビジネス要件を満たすのに役立ちます。

企業がデータの可能性を最大限に活用できないのには、多くの理由があります。これは、各チームがデータ分析に異なるツールと標準を使用しているサイロでビジネス機能が機能するためである可能性があります。または、主要業績評価指標を全体的なビジネス目標にリンクできない可能性があります。

データの民主化は、ビジネスに価値を還元し、困難なビジネス成長目標を達成するのに役立ちます。

LOB のニーズを理解し、優先順位を付けます。
ドメイン間でデータを分散して所有権を有効にし、データをユーザーに近づけます。
セルフサービスデータ製品をデプロイして、分析情報とビジネス価値を高めます。

データガバナンスのためには、分散化されたデータ民主化の世界で適切なバランスを取る必要があります。ガバナンスを厳密に適用しすぎると、イノベーションを妨げることができます。ただし、少なくともいくつかの主要な原則とプロセスがない場合は、最終的にデータサイロが発生する可能性があります。これらのサイロは、組織の評判と潜在的な収益を損なう可能性があります。包括的なデータガバナンスアプローチは、一貫した方法でデータの戦略的価値を引き出すために不可欠です。

十分に考え抜いたデータ戦略が存在しない場合は、単に "進む" だけで、組織に価値を提供し始める必要があります。前述の主要テーマに基づいて行動するか、フレームワーク内の戦略的原則として使用することで、現在のビジネス上の問題に対処します。これらの主要なテーマを使用すると、検証を繰り返しながらタイムリーな結果を提供する包括的なデータ戦略を作成するのにも役立ちます。ビジネスリーダーとテクノロジリーダーは、データから価値を生み出し、簡素化された構造化された方法で迅速にスケーリングするために必要な戦略と考え方を開発する必要があります。

詳細については、「データガバナンスとは」を参照してください。.

データドリブンカルチャを開発する

データ戦略を成功させるには、データドリブンカルチャが必要です。オープンで協調的な参加を一貫して促進する文化を発展させます。この種の文化では、従業員全員が組織のビジネス成果を学び、コミュニケーションを取り、改善することができます。データドリブンカルチャを開発することで、各従業員がデータに基づく影響や影響を生み出す能力も向上します。

体験の出発点は、成熟度曲線に沿った組織、業界、現在の場所によって異なります。次の図は、組織の AI 使用率の成熟度レベルを示す成熟度モデルの例を示しています。

レベル 0

データは、プログラムによって一貫して利用されることはありません。組織のデータフォーカスは、アプリケーション開発の観点からのものです。

レベル 0 では、組織には計画外の分析プロジェクトが含まれていることがよくあります。各アプリケーションは、固有のデータと利害関係者のニーズに高度に特化されています。また、各アプリケーションには重要なコードベースとエンジニアリングチームがあり、多くは IT の外部で設計されています。ユースケースの有効化と分析はサイロ化されます。

レベル 1

レベル 1 では、チームが形成され、戦略が作成されますが、分析は部門化されたままです。組織は、従来のデータキャプチャと分析に適している傾向があります。クラウド規模のアプローチに対するある程度のコミットメントがある場合があります。たとえば、クラウドから既にデータにアクセスしている可能性があります。

レベル 2

組織のイノベーションプラットフォームは、ほぼ準備ができています。ワークフローは、データ品質に対応するために用意されています。組織は、いくつかの "理由" の質問に答えることができます。

レベル 2 では、一元管理されたデータレイクストアを使用してデータストアのスプロールを制御し、データ検出可能性を向上させるエンドツーエンドのデータ戦略を積極的に探しています。組織は、中央管理されたデータレイクにコンピューティングを提供するスマートアプリケーションの準備が整いました。これらのスマートアプリケーションにより、プライバシーリスク、コンピューティングコスト、および重要なデータのフェデレーションコピーの必要性が軽減されます。

このレベルでは、組織は、一般的なデータコンピューティングタスクにマルチテナントで一元的にホストされる共有データサービスを使用する準備も整っています。これらの共有データサービスを使用すると、データサイエンス主導のインテリジェンスサービスから迅速な分析情報を得ることができます。

レベル 3

組織は包括的なデータアプローチを使用します。データに関連するプロジェクトは、ビジネス成果の中に統合されます。組織は分析プラットフォームを使用して予測を行います。

レベル 3 では、組織はデータ資産とアプリケーション開発の両方の観点からデジタルイノベーションのロックを解除します。データレイクや共有データサービスなど、基本的なデータサービスが用意されています。

組織全体の複数のチームが、重要なビジネスワークロード、主要なビジネスユースケース、測定可能な結果を正常に提供します。新しい共有データサービスは、テレメトリを使用して識別されます。 IT は、重要なビジネスプロセスの改善に役立つ、信頼されたエンドツーエンドのデータ戦略を使用して、会社全体のチームに対する信頼できるアドバイザーです。

レベル 4

レベル 4 では、組織全体でフレームワーク、標準、エンタープライズ、データドリブンカルチャが使用されています。自動化、データドリブンフィードバックループ、分析または自動化に関する卓越性の中心を実際に観察できます。

ビジネスに合わせた目標を開発する

ビジネスビジョンに沿った優先順位を特定し、"大きく考え、小さく始め、迅速に行動する" イデオロギーを維持することは、成功の鍵となります。適切なユースケースを取り上げるには、長く困難な審査プロセスが必要であるとは限りません。投資収益率を検証するのに十分なデータがあり、より多くの需要と容易な承認を得られるビジネスユニットでは、継続的な問題となる可能性があります。状況はすぐに動く可能性があり、ほとんどの組織が作業を始めるのに苦労する可能性があります。

データ属性について

強力なデータ戦略を構築するには、データのしくみを理解する必要があります。データのコア特性を知ることは、データを処理するための原則的なプラクティスを構築するのに役立ちます。

データは高速に移動しますが、その速度は物理学の法則に逆らうことはできません。データは、土地およびそれを作成した業界の法律に準拠している必要があります。

データ自体は変更されませんが、そのような課題を軽減するための対策を講じない限り、変更や偶発的な損失が発生しやすくなります。予期しない変更に対処できるように、コントロール、データベース、ストレージの破損対策を実施します。また、監視、監査、アラート、ダウンストリームプロセスも設定してください。

それ自体では、データは分析情報を生成したり、価値を生み出したりすることはありません。分析情報を取得したり、値を抽出したりするには、データの大部分またはすべてを 4 つの個別の手順で配置する必要があります。

データの取り込み
ストレージ
加工
解析学

これら 4 つの各手順には、独自の原則、プロセス、ツール、テクノロジがあります。

データ資産と関連する分析情報を源泉徴収すると、社会経済的、政治的、研究、投資に関する意思決定に影響を与える可能性があります。組織が安全で責任ある方法で分析情報を提供できることが重要です。生成または取得するすべてのデータは、特に明記されていない限り、データ分類演習を実行する必要があります。暗号化は、保存時と転送中の両方で機密データを処理するためのゴールドスタンダードです。

データ、アプリケーション、サービスはすべて独自の重力プルを持っていますが、データのプルは最大です。サー・アイサック・ニュートンの伝説のリンゴとは異なり、データは周囲の物体に影響を与える物理的な質量を持っていません。代わりに待機時間とスループットがあり、分析プロセスのアクセラレータとして機能します。待ち時間、スループット、アクセスの容易さを考慮すると、望ましくない場合でもデータを複製しなければならないことがよくあります。このような要件と組織のデータポリシーのバランスを取ることができるように、ユーザー、プロセス、ツール、テクノロジを適切に設定します。

アーキテクチャコンストラクトは、データを処理できる速度を制御します。コンストラクトは、ソフトウェア、ハードウェア、ネットワークのイノベーションによって促進されます。アーキテクチャ上の考慮事項をいくつか次に示します。

データ分散の設定
パーティショニング
キャッシュテクノロジ
バッチ処理とストリーム処理
バックエンドとクライアント側の処理の分散

データ戦略を定義する

より良い製品と価値の高いサービスを構築するための競争上の利点としてデータを使用することは、新しい概念ではありません。ただし、クラウドコンピューティングによって有効になるデータの量、速度、および多様性は、かつてないほどです。

クラウド内の最新のデータ分析プラットフォームの設計は、セキュリティ、ガバナンス、監視、オンデマンドスケーリング、データ操作、セルフサービスで構成されています。これらのファセット間の相互作用を理解することは、優れたデータ戦略と良いものを区別することです。クラウド導入フレームワークなどのツールを使用して、アーキテクチャの凝集性、整合性、ベストプラクティスを確保します。

効果的にするには、データ戦略にデータガバナンスのプロビジョニングが含まれている必要があります。次の図は、データライフサイクルの主要なステージを示しています。データガバナンスに重点を置きます。

データライフサイクルの図。

次のセクションでは、データ戦略のレイヤーの設計原則を決定する際に使用する必要がある考慮事項について説明します。データからビジネスの成果と価値を提供することに重点を置く。

データインジェスト

データインジェストの主な考慮事項は、要件から運用環境まで、セキュリティで保護された準拠した方法でデータパイプラインを迅速に構築できることです。重要な要素には、データレイクをハイドレートするメタデータ駆動型、セルフサービス型、およびローコードのテクノロジが含まれます。

パイプラインを構築するときは、設計と、データのラングリング、データの分散、コンピューティングのスケーリングの両方を検討してください。また、パイプラインの継続的インテグレーションと配信に対する適切な DevOps サポートを確保する必要があります。

Azure Data Factory などのツールでは、多数のオンプレミスデータソース、サービスとしてのソフトウェア (SaaS) データソース、およびその他のパブリッククラウドからのその他のデータソースがサポートされています。

ストレージ

物理層と論理層の両方でデータにタグを付け、整理します。データレイクは、すべての最新のデータ分析アーキテクチャの一部です。組織は、運用するすべてのデータ分類と業界のコンプライアンス要件を満たす適切なデータプライバシー、セキュリティ、およびコンプライアンス要件を適用する必要があります。カタログ化とセルフサービスは、組織レベルのデータ民主化を支援します。これは、適切なアクセス制御によって導かれながら、イノベーションを促進します。

ワークロードに適したストレージを選択します。ストレージが初めて正確に取得されない場合でも、クラウドを使用すると、迅速にフェールオーバーして体験を再開できます。アプリケーションの要件を使用して、最適なデータベースを選択します。分析プラットフォームを選択するときは、バッチデータとストリーミングデータを処理する機能を必ず検討してください。

データ処理

データ処理のニーズは、ワークロードごとに異なります。ほとんどの大規模なデータ処理には、リアルタイム処理とバッチ処理の両方の要素が含まれています。ほとんどの企業には、時系列処理要件の要素があり、エンタープライズ検索機能用に自由形式のテキストを処理する必要もあります。

オンライントランザクション処理 (OLTP) は、最も一般的な組織処理要件を提供します。一部のワークロードでは、"ビッグコンピューティング" と呼ばれるハイパフォーマンスコンピューティング (HPC) などの特殊な処理が必要です。これらのワークロードは、多くの CPU または GPU ベースのコンピューターを使用して複雑な数学的タスクを解決します。

特定の特殊なワークロードの場合、お客様は Azure コンフィデンシャルコンピューティングなどの実行環境をセキュリティで保護できます。これにより、パブリッククラウドプラットフォーム内でデータが使用されている間にユーザーがデータをセキュリティで保護できます。この状態は、効率的な処理に必要です。データは、エンクレーブとも呼ばれる信頼された実行環境 (TEE) 内で保護されます。 TEE は、外部の表示と変更からコードとデータを保護します。 TEEs を使用すると、さまざまな組織のデータソースを使用している間でも、データの機密性を損なうことなく AI モデルをトレーニングできます。

分析処理

抽出、変換、読み込み (ETL) コンストラクトは、オンライン分析処理 (OLAP) とデータウェアハウスのニーズに関連します。ビジネスに合わせたデータモデルとセマンティックモデルにより、組織はビジネスルールと主要業績評価指標 (KPI) を実装することが多く、分析プロセスの一部として実装されます。便利な機能の 1 つは、自動スキーマドリフト検出です。

データ戦略の概要

データガバナンスや責任ある AI など、他の考慮事項に原則的なアプローチを取ると、後で配当が支払われます。

Microsoft では、公平性、信頼性と安全性、プライバシーとセキュリティ、包括性という 4 つの基本原則に従っています。透明性と説明責任の 2 つの基本原則は、4 つの主要な原則すべてを支えています。

リソースとガバナンスのシステムを開発することで、原則と責任ある AI を実践します。一部のガイドラインでは、人間/AI の相互作用、会話型 AI、インクルーシブデザイン、AI の公平性チェックリスト、データセットのデータシートに対処しています。

また、イノベーションのあらゆる段階で、他のユーザーが AI を理解、保護、制御できるように、一連のツールも開発しました。これらのツールは、責任ある AI を強化および加速するための、学際的なコラボレーションの取り組みの結果です。コラボレーションは、ソフトウェアエンジニアリングと開発、ソーシャルサイエンス、ユーザー研究、法律、ポリシーにまたがっています。

コラボレーションを向上させるために、InterpretML や Fairlearn などの多くのツールをオープンソース化しました。他のユーザーは、これらのオープンソースツールに貢献して構築できます。また、Azure Machine Learning を使用してツールを民主化しました。

データ主導型の組織になるためのピボットは、新しい標準で競争上の優位性を提供するための基礎です。お客様がアプリケーションのみのアプローチからアプリケーションとデータ主導のアプローチに移行できるように支援したいと考えています。アプリケーションとデータに重点を置くアプローチは、ビジネス成果に影響を与える現在および将来のユースケース全体で再現性とスケーラビリティを確保するエンドツーエンドのデータ戦略を作成するのに役立ちます。

デジタルイノベーションのロック解除の図。

コミットメント、コミュニケーション、エンゲージメントを促進する

データ戦略を成功に導くすべての重要な役割は、採用したアプローチと一般的なビジネス目標を明確に理解する必要があります。主要な役割には、リーダーシップチーム (C レベル)、ビジネスユニット、IT、運用、配信チームが含まれる場合があります。

コミュニケーションは、このフレームワークの最も重要な部分の 1 つです。組織は、ロール間で効果的なコミュニケーションを行うプロセスを考案する必要があります。コミュニケーションは、現在のプロジェクトのコンテキストで効果的に提供するのに役立ちます。また、関係者全員が最新の状態を維持し、将来の包括的なデータ戦略を構築するという全体的な目的に焦点を当てるフォーラムを確立します。

エンゲージメントは、次の 2 つのグループの間で不可欠です。

データ戦略を設計して実装するチームメンバー
データに貢献し、使用し、悪用するチームメンバー (意思決定を行い、データに基づいて結果を構築するビジネスユニットなど)

別の言い方をすると、関連性と導入におけるユーザーエンゲージメントリスクの課題なしで構築されたデータ戦略と関連するデータプラットフォームです。

このフレームワークでは、次の 2 つの戦略的プロセスが成功に役立ちます。

センターオブエクセレンスの形成
アジャイル配信方法の導入

詳細については、「クラウド規模の分析の計画を作成する」を参照してください。

価値を提供する

標準化された構造化された方法で成功条件に対してデータ製品を配信すると、その配信によって反復的なフレームワークが検証されます。さらに、学習を使用して継続的にイノベーションを行うことで、ビジネスの信頼度を高め、データ戦略の目標を拡大することができます。このプロセスにより、組織全体でより明確かつ迅速に導入できます。

データプラットフォームにも同じことが当てはまります。複数のチームが自律的に動作するセットアップがある場合は、メッシュに向かって進む必要があります。そこに到達するには反復的なプロセスが必要です。多くの場合、組織のセットアップ、準備、ビジネスの調整に大きな変更が必要です。

次の手順

クラウド導入体験のガイダンスを見つけて、クラウド導入シナリオを成功させるには、次の記事を参照してください。