Azure を使用した小売業向け製品に関する推奨事項

Blob Storage
Event Hubs
HDInsight
Stream Analytics
Power BI

ソリューションのアイデア

このアーティクルはソリューションのアイデアです。 このコンテンツにさらに多くの情報 (想定されるユース ケース、代替サービス、実装に関する考慮事項、価格ガイダンスなど) の掲載をご希望の方は、GitHub のフィードバックでお知らせください。

このソリューションのアイデアでは、顧客データを完全なプロファイルに集計するプロセスを実装します。

アーキテクチャ

イベント ジェネレーターとダッシュボードの間のデータのフローを示すアーキテクチャ図。その他のステージには分析と機械学習があります。

このアーキテクチャの Visio ファイルをダウンロードします。

データフロー

  1. データ ジェネレーターは、シミュレートされた顧客イベントを Azure Event Hubs にパイプします。
  2. Azure Stream Analytics ジョブが Event Hubs から読み取り、集計を実行します。
  3. Stream Analytics が時間によりグループ化されたデータを Azure Blob Storage に保持します。
  4. Azure HDInsight で実行されている Spark ジョブは、最新の顧客ブラウジング データに履歴の購入データと人口統計データを統合して、統合ユーザー プロファイルを作成します。
  5. 2 つ目の Spark ジョブは、機械学習モデルに対して各顧客プロファイルをスコア付けします。 このプロセスでは、将来の購入パターンが予測されます。 これらの予測は、ある特定の顧客が今後 30 日以内に購入する可能性が高いかどうかを示唆しています。 その場合、システムによって、購入の可能性が高い製品カテゴリが判断されます。
  6. 予測およびその他のプロファイル データが視覚化され、Power BI サービスのグラフとテーブルとして共有されます。

コンポーネント

  • Blob Storage は、Azure Storage に含まれるサービスです。 Blob Storage では、大量の非構造化データに対して最適化されたクラウド オブジェクト ストレージを提供します。
  • Event Hubs は、フル マネージド ストリーミング プラットフォームです。
  • Azure Machine Learning は、機械学習モデルのトレーニング、デプロイ、自動化、管理、追跡に使用できるクラウドベースの環境です。
  • Azure SQL Database は、フル マネージドのサービスとしてのプラットフォーム (PaaS) データベース エンジンです SQL Database は、最新の安定したバージョンの SQL Server と、パッチ適用済みのオペレーティング システムで実行されます。
  • Stream Analytics では、 リアルタイムのサーバーレス ストリーム処理が提供されます。 このサービスでは、クラウドとエッジ デバイスでクエリを実行する方法が提供されます。
  • Power BI は、対話型の視覚化およびビジネス インテリジェンス機能を提供するビジネス分析サービスです。 使いやすいインターフェイスにより、ユーザーは独自のレポートとダッシュボードを作成できます。
  • HDInsight は、全範囲に対応した、オープンソースでクラウドベースのエンタープライズ向けマネージド分析サービスです。

シナリオの詳細

顧客の関心と購入パターンを深く理解することは、小売のビジネス インテリジェンス運用の重要な要素です。 このソリューションのアイデアでは、顧客データを完全なプロファイルに集計します。 高度な機械学習モデルは、Azure の信頼性と処理能力に支えられ、シミュレーションされた顧客に関する予測的な分析情報を提供します。

考えられるユース ケース

このソリューションは、通常、小売業者によって採用されています。

このシナリオのデプロイ

このソリューションの構築方法の詳細については、GitHub のソリューション ガイドを参照してください。

一般的な小売業は、さまざまなチャネルを通じて顧客データを収集します。 これらのチャネルには、Web 閲覧パターン、購買行動、人口統計、およびその他のセッションベースの Web 情報が含まれます。 データの一部は、基幹業務に由来します。 しかし、その他のデータは、パートナー、製造元、パブリック ドメインなどの外部ソースから取得して統合する必要があります。

多くの企業は、利用可能なデータのごく一部のみを適用していますが、ROI を最大限に高めるために、ビジネスではすべてのソースから関連するデータを統合する必要があります。 従来、外部の異種データ ソースを共有データ処理エンジンに統合するには、多くの作業とリソースのセットアップが必要でした。 このソリューションでは、分析と機械学習を統合して顧客の購入アクティビティを予測するための、シンプルでスケーラブルなアプローチについて説明します。

ソリューションの特徴

このソリューションでは、前のセクションで指摘した問題に次のように対処します。

  • データ移動とシステムの複雑さを最小限に抑えながら、複数のデータ ソースからのデータに一様にアクセスします。これにより、パフォーマンスが向上します。
  • 予測機械学習モデルを使用するために必要な、抽出、変換、読み込み (ETL) 操作と特徴エンジニアリングを実行します。
  • 360 度の包括的な顧客プロファイルを作成し、分散システム全体で実行される予測分析によってこれを強化します。 この分析は、Microsoft R Server と HDInsight によってサポートされます。

次のステップ