シナリオを分析してそれを HDInsight 構成オプションにマップする。

完了

次のケース スタディを読み、シナリオを HDInsight クラスター構成にマップするための質問に答えます。

ケース スタディ – AdventureWorks サイクル

AdventureWorks は、自転車および自転車部品を顧客と販売代理店に直接販売しています。 同社には現在、オランダにオフィスが 1 つあります。 同社は、販売店のチェーンと自社 Web サイトでのオンライン販売を通じて、米国、ドイツ、およびスペインで自転車を販売しています。 配送のフルフィルメントは、ローカルの配送センターによって行われています。

これらの国や地域での売上がこの 3 年間で増加していることから、同社では、新しいオフィスを開設することで事業の拡大を計画しています。 場所は次のとおりです。

  • 東京 (日本)
  • シアトル (米国)
  • シカゴ (米国)
  • ベルリン (ドイツ)
  • バルセロナ (スペイン)
  • パリ (フランス)

AdventureWorks は、この 15 年間、非常に競争の激しい市場に身を置いていました。 同社は、現在および将来の自転車所有者に対して、クラス最高のテクノロジとサービスを提供する、最も革新的な自転車企業になることを目指しています。 AdventureWorks の研究開発部門は、革新的な製品の次の波を考案することに成功してきました。 同社では、ソリューションの設計と実装の両方を支援するために、データ エンジニア、AI エンジニア、データ サイエンティストに依存しています。

グローバルな規模での売上と拡大のレベルが高くなると、既存のデータ インフラストラクチャでは、ビジネス要件全体や、AdventureWorks が目指す将来の成長に対応できなくなります。 最高情報責任者および最高情報責任者は、既存のオンプレミス システムを破棄し、予想される成長に対応するためにクラウドに移行する意向を示しています。 このプランは、既存のインフラストラクチャの有効期間が終了するのに伴うハードウェア交換の要求があるため、CFO からも支持されています。 CFO は、クラウドがよりコスト効率の高い代替手段を提供できることを認識しています。

あなたは、シニア データ エンジニアとして、ソリューションの設計と実装で AdventureWorks を支援します。 これは、同社が成長、拡大、イノベーション戦略で示したビジネス、機能、技術面の要件を満たすのに役立ちます。 あなたは、運用コストを最小限に抑え、効果を監視できる方法でこのプランを実施します。

探索ワークショップでは、次の情報を決定します。

データ分析

ビジネス レポートは現在、データ ウェアハウスとして構成されている単一のオンプレミス データベースによって提供されています。 これには AdventureWorksDW という名前のデータベースが保持されています。このデータベースは、履歴レポートと記述的分析を提供するために使用されます。 最近では、サーバーがレポート データを迅速に処理することが困難になってきたため、あなたのチームはデータへのアクセスを確実に制限する必要があります。

また、AdventureWorks では、自社のデータ分析をさらに活用し、予測分析機能の利用を開始することも希望しています。 このアクティビティは現在行われていません。 組織は、レコメンデーションまたはテキスト分析エンジンを構築できることを理解しています。 同社では、回復力とパフォーマンスにも優れたこのようなソリューションを実装するにあたり、最適なテクノロジとアプローチをあなたに指示してもらいたいと考えています。

ソーシャル メディア分析

近年、この組織のマーケティング部門は多種多様な X キャンペーンをさまざまな季節に実施してきました。 彼らは、こうしたキャンペーン中にハッシュタグなどのソーシャル メディア資産を追跡することによって、キャンペーンの影響を測定したいと考えています。 彼らは任意の名前のハッシュタグを追跡する機能を必要としています。

接続された自転車

AdventureWorks の自転車には、革新的な組み込みサイクル コンピューターを搭載できます。 このコンピューターは、自転車の自動ロック機能および運転状態で構成されています。 このサイクル コンピューターによってキャプチャされる情報は次のとおりです。

  • 自転車のモデル、シリアル番号、登録されている所有者
  • 自転車の場所 (経緯度)
  • 現在の状態 (停止、移動中)
  • 現在の速度 (km/時)
  • 自転車のロック/ロック解除
  • 自転車の部品とコンポーネントの情報 (電気自転車)

ファーストパーティおよびサードパーティのアプリケーションは、セキュリティで保護する必要があるサイクル コンピューターの情報にアクセスできます。 この情報は、モバイル アプリケーションへの統合、場所のリアルタイム表示、および自転車のライド シェア情報に使用できます。 さらに、毎日の概要データをフラット ファイルに保存することもできます。 このデータには、自転車のモデル、シリアル番号、登録された所有者、1 日あたりの合計マイル数の概要、および平均速度が含まれます。

自転車のメンテナンス サービス

既存の自転車の所有者は、次に基づいて自身の自転車の修理が必要になったときに通知を受け取ることを選ぶことができます。

  • センサー データに基づく電気自転車からのテレメトリ
  • 平均走行距離または損傷に基づいて自転車に組み込まれたコンピューターから取得される自転車の使用状況に関する情報
  • この予測メンテナンス シナリオは、有料サービスとして提供され、自転車所有者が選択できるサービスです。

質問

次のケース スタディに基づき、次の質問に回答してください。


知識チェック

1.

接続されている自転車シナリオで必要とされるストリーミング要件を満たすには、どの HDInsight クラスター構成の種類が適していますか?

2.

オンプレミスの SQL Server でデータ ウェアハウスによって実行されているデータ分析を格納するには、どの HDInsight クラスター構成の種類が適していますか?

3.

自転車のメンテナンス サービスで予測メンテナンス作業を実行するのに適した HDInsight クラスター構成の種類はどれですか?

4.

上記の質問に記載されているすべてのシナリオに対応するため、これらのすべてのワークロードを処理するには、どのデータ ストレージの種類を使用する必要がありますか?