チュートリアル: ノートブックを使用してデータを分析する
適用対象: Microsoft Fabric の SQL 分析エンドポイントおよびウェアハウス
このチュートリアルでは、一度保存したデータを他の多くのサービスで使用する方法について説明します。 Azure Data Lake Storage および S3 に格納されているデータへのショートカットを作成して、外部システムから Delta テーブルに直接アクセスすることもできます。
レイクハウスを作成する
まず、新しいレイクハウスを作成します。 Microsoft Fabric ワークスペースに新しいレイクハウスを作成するには、次のようにします。
Data Warehouse Tutorial
ナビゲーション メニューでワークスペースを選択します。[+ 新しい>レイクハウス] を選択します。
[名前] フィールドに「
ShortcutExercise
」と入力し、[作成] を選択します。新しいレイクハウスが読み込まれると、[レイクハウスにデータを取り込む] メニューで [エクスプローラー] ビューが開きます。 [レイクハウスにデータを読み込む] で、[新しいショートカット] ボタンを選択します。
[新しいショートカット] ウィンドウで、Microsoft OneLake のボタンを選択します。
[データ ソースの種類の選択] ウィンドウで、前に作成した
WideWorldImporters
という名前の付いたウェアハウスが見つかるまで一覧をスクロールします。 これを選択し、[次へ] を選択します。OneLake オブジェクト ブラウザーで、[テーブル] を展開し、
dbo
スキーマを展開して、dimension_customer
のチェックボックスを選択します。 [次へ] を選択します。 [作成] を選択します[テーブル] の下に
Unidentified
というフォルダーが表示される場合は、水平メニュー バーの [更新] アイコンを選択します。[テーブル] ボックスの一覧で
dimension_customer
を選択して、データをプレビューします。 レイクハウスには、Warehouse のdimension_customer
テーブルのデータが表示されます。次に、
dimension_customer
テーブルにクエリを実行する新しいノートブックを作成します。 [ホーム] リボンで、[ノートブックを開く] のドロップダウンを選択し、[新しいノートブック] を選択します。エクスプローラーで、[レイクハウス] ソース フォルダーを選択します。
dimension_customer
を選択し、[テーブル] の一覧から開いているノートブック セルにドラッグします。 PySpark クエリが書き込まれ、ShortcutExercise.dimension_customer
からのすべてのデータにクエリを実行していることを確認できます。 このノートブック エクスペリエンスは、Visual Studio Code Jupyter Notebook エクスペリエンスに似ています。 VS Code でノートブックを開くこともできます。[ホーム] リボンで、[すべて実行] ボタンを選択します。 クエリが完了すると、PySpark を使用して Warehouse テーブルのクエリを簡単に実行できることがわかります。