データ ウェアハウスのチュートリアルの概要

適用対象: Microsoft Fabric の SQL 分析エンドポイントとウェアハウス

Microsoft Fabric は、すべての企業のすべての分析ニーズに対して、ワンストップ ショップを提供します。 データ移動、データ レイク、データ エンジニアリング、データ統合とデータ サイエンス、リアルタイム分析、ビジネス インテリジェンスなど、さまざまなサービスが含まれます。 Microsoft Fabric を使用すると、複数のベンダーから異なるサービスを結び付ける必要はありません。 代わりに、お客様は、理解、オンボード、作成、運用が容易な、エンド ツー エンドで高度に統合された単一の包括的な製品を使うことができます。 他製品では、Microsoft Fabric が提供する統合の幅広さ、深さ、およびレベルが提供されません。 コンプライアンスとガバナンスのニーズを満たすために、すべてのテナントに Microsoft Purview が既定で含まれます。

このチュートリアルの目的

Microsoft Fabric の多くの概念はデータと分析の専門家にはなじみがあるかもしれませんが、新しい環境でこれらの概念を適用するのは困難な場合があります。 このチュートリアルは、データの取得からデータ消費までのエンド ツー エンドのシナリオを順を追って説明するように設計されており、Microsoft Fabric のユーザー エクスペリエンス、さまざまなエクスペリエンスとその統合ポイント、および Microsoft Fabric のプロフェッショナルおよび市民開発者エクスペリエンスの基本的な理解を構築します。

このチュートリアルは、参照アーキテクチャ、機能の完全な一覧、または特定のベスト プラクティスの推奨事項を意図したものではありません。

データ ウェアハウスのエンド ツー エンドのシナリオ

このチュートリアルの前提条件として、次の手順を実行します:

  1. Power BI Online アカウントにサインインするか、アカウントをまだ持っていない場合は、無料試用版にサインアップします。
  2. テナントで Microsoft Fabric を有効にします

このチュートリアルでは、架空の Wide World Importers 企業でウェアハウス開発者の役割を担い、Microsoft Fabric ポータルで次の手順を実行して、エンド ツー エンドのデータ ウェアハウス ソリューションを構築して実装します:

  1. Microsoft Fabric ワークスペースを作成する
  2. ウェアハウスの作成
  3. データ パイプラインを使用して、ソースからデータ ウェアハウスのディメンション モデルにデータを取り込みます
  4. ウェアハウスにテーブルを作成する
  5. SQL クエリ エディターを使用して T-SQL を使用してデータを読み込みます。
  6. T-SQL を使用して集計データセットを作成するようにデータを変換します。
  7. ビジュアル クエリ エディターを使用して、データ ウェアハウスに対してクエリを実行します。
  8. ノートブックを使用してデータを分析します。
  9. SQL クエリ エディターを使用して、クロスウェアハウス クエリを作成して実行します。
  10. DirectLake モードを使用して Power BI レポートを作成し、所定の場所のデータを分析します。
  11. データ ハブからレポートを作成します。
  12. ワークスペースやその他の項目を削除して、リソースをクリーンアップします。

データ ウェアハウスのエンド ツー エンド アーキテクチャ

データ ウェアハウスのエンド ツー エンド アーキテクチャを示した図。

データ ソース - Microsoft Fabric を使用すると、Azure Data Services、他のクラウド プラットフォーム、オンプレミスのデータ ソースに簡単かつ迅速に接続してデータを取り込むことができます。

インジェスト - Microsoft Fabric パイプラインの一部として 200 以上のネイティブ コネクタを使用し、データフローを使用したドラッグ アンド ドロップ データ変換を使用すると、組織に関する分析情報をすばやく構築できます。 ショートカットは、既存のデータをコピーまたは移動することなく接続する方法を提供する Microsoft Fabric の新機能です。 ショートカット機能の詳細については、このチュートリアルの後半で確認できます。

変換と保存 - Microsoft Fabric は Delta Lake 形式で標準化しています。つまり、Microsoft Fabric のすべてのエンジンは OneLake に保存された同じデータを読み取り、作業できます。データが重複することはありません。 このストレージを使用すると、組織のニーズに基づいたデータ ウェアハウスまたはデータ メッシュを構築できます。 変換の場合は、パイプライン/データフローでローコード エクスペリエンスまたはノーコード エクスペリエンスを選択するか、コード ファースト エクスペリエンスに T-SQL を使用できます。

消費 - ウェアハウスのデータは、レポート作成と視覚化において業界をリードするビジネス インテリジェンス ツール、Power BI によって消費されます。 各ウェアハウスには TDS エンドポイントが組み込まれており、必要に応じて他のレポート作成ツールと容易に接続し、データをクエリすることができます。 ウェアハウスが作成されると、デフォルト セマンティック モデルと呼ばれる 2 次アイテムが同じ名前で同時に生成されます。 デフォルトのセマンティック モデルを使用すると、ほんの数ステップでデータの視覚化を開始できます。

サンプル データ

サンプル データには、 Wide World Importers (WWI) サンプル データベースを使用します。 データ ウェアハウスのエンドツーエンドのシナリオでは、Microsoft Fabric プラットフォームのスケールとパフォーマンスの機能を確認するのに十分なデータを生成しました。

Wide World Importers (WWI) は、サンフランシスコ湾岸地域でノベルティ商品の輸入と販売を行っている卸売業者です。 卸売業者である WWI の顧客の多くは、個人に再販する企業です。 WWI は、専門店、スーパーマーケット、コンピューティング ストア、観光地の小売店、一部の個人など、米国全域の小売顧客に販売しています。 また、WWI に代わって製品の販売促進を行う代理店のネットワークを介して他の卸売業者にも販売しています。 会社のプロファイルと事業の詳細については、「 Microsoft SQL 用 Wide World Importers サンプル データベース」を参照してください。

通常は、トランザクション システム (または基幹業務アプリケーション) のデータをデータ レイクまたはデータ ウェアハウスのステージング領域に取り込みます。 ただし、このチュートリアルでは、WWI によって提供されるディメンション モデルを初期データ ソースとして使用します。 データ ウェアハウスにデータを取り込み、T-SQL を介して変換するためのソースとして使用します。

データ モデル

WWI ディメンション モデルには複数のファクト テーブルが含まれていますが、このチュートリアルでは、このエンド ツー エンドのデータ ウェアハウス シナリオを示すために、販売のfact_saleテーブルとその関連ディメンションのみに焦点を当てます:

販売のファクト スケールテーブルとその関連ディメンションを含む、このチュートリアルで使用するデータ モデルを示した図。

次のステップ