Microsoft Fabric Lakehouses を使用する

完了

Microsoft Fabric Lakehouse のコア機能を理解したので、その機能を使用する方法を調べてみましょう。

レイクハウスを作成して探索する

Data Engineering ワークロードで新しいレイクハウスを作成して構成します。 各 lakehouse は、ファブリック対応ワークスペースに次の 3 つの名前付き項目を生成します。

  • レイクハウスは、ファイル、フォルダー、テーブル データとやり取りするレイクハウスのストレージおよびメタデータです。
  • セマンティック モデル (既定値) は、レイクハウス内のテーブルに基づいて自動的に作成されるセマンティック モデルです。 Power BI レポートはセマンティック モデルから作成できます。
  • SQL 分析エンドポイントは、Transact-SQL を使用してデータに接続してクエリを実行できる読み取り専用の SQL 分析エンドポイントです。

説明されている 3 つのレイクハウス項目のスクリーンショット。

レイクハウスのデータは、次の 2 つのモードで操作できます。

  • レイクハウスを使用すると、レイクハウス内のテーブル、ファイル、フォルダーを追加して操作できます。
  • SQL 分析エンドポイントを使用すると、SQL を使用してレイクハウス内のテーブルに対してクエリを実行し、そのリレーショナル セマンティック モデルを管理できます。

2 つのレイクハウス エクスプローラー モードのスクリーンショット。

レイクハウスにデータを取り込む

Fabric レイクハウスにデータを読み込むには、次のようにさまざまな方法があります。

  • アップロード: ローカル ファイルまたはフォルダーをレイクハウスにアップロードします。 その後、ファイル データを調べて処理し、結果をテーブルに読み込むことができます。

  • データフロー (Gen2): Power Query Online を使用してさまざまなソースからデータをインポートおよび変換し、レイクハウス内のテーブルに直接読み込みます。

  • ノートブック: Fabric のノートブックを使ってデータを取り込み、変換し、レイクハウスのテーブルまたはファイルに読み込みます。

  • Data Factory パイプライン: データをコピーしてデータ処理アクティビティを調整し、結果をレイクハウス内のテーブルまたはファイルに読み込みます。

ショートカットを使ってデータにアクセスする

Fabric でデータにアクセスして使うには、"ショートカット" を使う方法もあります。 ショートカットを使うと、データを外部のストレージに保存したまま、レイクハウスに統合することができます。

ショートカットは、別のストレージ アカウントだけでなく、別のクラウド プロバイダーにあるデータを取得する必要がある場合に便利です。 自分のレイクハウス内には、異なるストレージ アカウントや他の Fabric 項目 (データ ウェアハウス、KQL データベース、他のレイクハウスなど) を指すショートカットを作成できます。

ソース データのアクセス許可と資格情報は、すべて OneLake によって管理されます。 別の OneLake の場所へのショートカットを介してデータにアクセスする場合、ショートカットのターゲット パス内にあるデータへのアクセスを認可するために、呼び出し元ユーザーの ID が使われます。 このユーザーがデータを読み取るには、ターゲットの場所のアクセス許可を持っている必要があります。

ショートカットは、レイクハウスと KQL データベースの両方に作成できます。また、レイク内のフォルダーとして表示されます。 これにより、Spark、SQL、リアルタイム インテリジェンス、Analysis Services はすべて、データのクエリ時にショートカットを利用できます。

Note

ショートカットの使用方法の詳細については、Microsoft Fabric のドキュメントの OneLake ショートカットに関するドキュメントを参照してください。