Fabric Lakehouse エクスプローラーを操作する

[Lakehouse エクスプローラー] ページは、Lakehouse 環境内のすべての対話の中心となるハブとして機能します。 エクスプローラーは、Fabric ポータルに組み込まれています。 Lakehouse エクスプローラーを開くには、ワークロード スイッチャーをData Engineeringエクスペリエンスに切り替えます。 レイクハウスの項目を見つけて移動すると、エクスプローラーが開き、レイクハウスデータを操作できます。 エクスプローラーは Lakehouse にシームレスにデータを読み込み、データ内を移動し、コンテンツをプレビューし、さまざまなデータ関連タスクを実行するためのゲートウェイです。 このページは、Lakehouse エクスプローラー、メイン ビュー、リボンの 3 つの主なセクションに分かれています。

Lakehouse エクスプローラー エクスペリエンス内のコントロールを説明する Gif。

Lakehouse エクスプローラー

Lakehouse エクスプローラーは、Lakehouse 全体の統一されたグラフィック表示を提供し、データのナビゲーション、アクセス、管理のための直感的なインターフェイスをユーザーに提供します。

  • [テーブル] セクションは、Lakehouse 内のマネージド領域をわかりやすく表しています。 この領域は通常、効率的なデータ処理と分析を容易にするために編成および管理されます。 ここでは、自動的に生成されたか、明示的に作成され、メタストアに登録されたかに関係なく、すべてのテーブルが見つかります。 プレビューするテーブルの選択、テーブル スキーマの検査、基になるファイルへのアクセス、データに関連するその他のさまざまなアクションの実行を行うことができます。

  • [不明] 領域は、Lakehouse のマネージド領域内の固有の空間です。 SyMS に関連付けられたテーブルがないマネージド領域に存在するフォルダーまたはファイルが表示されます。 たとえば、ユーザーがイメージやオーディオ ファイルなどのサポートされていないファイルをマネージド領域にアップロードした場合、自動的に検出され、テーブルにリンクされることはありません。 代わりに、この不明領域に表示されます。 このセクションの主な目的は、これらのファイルをマネージド領域から削除するか、またはさらに処理するために [ファイル] セクションに転送するように求めるプロンプトをユーザーに出すことです。

  • [ファイル] セクションは、Lakehouse のアンマネージド領域を表し、さまざまなソースから取り込まれた生データの "ランディング ゾーン" と見なすことができます。 このデータを分析に使用する前に、多くの場合、追加の処理が必要です。 このセクションでは、ディレクトリ内を移動し、プレビューするディレクトリを選択し、フォルダーをテーブルに読み込み、他のさまざまなアクションを実行することができます。 [ファイル] セクションには、フォルダー レベルのオブジェクトのみが表示されることに注目してください。 ファイル レベルのオブジェクトを表示するには、メイン ビュー領域を使用する必要があります。

メイン ビュー領域

[Lakehouse] ページのメイン ビュー領域は、ほとんどのデータ操作が発生する領域です。 ビューは、選択内容に応じて変化します。 オブジェクト エクスプローラーにはレイクのフォルダー レベル階層のみが表示されるため、ファイル間の移動、ファイルとテーブルのプレビュー、およびその他のさまざまなタスクでメイン ビュー領域を使用します。

[テーブルのプレビュー]

テーブルのプレビュー データグリッドには、データの対話を高めてデータの操作をさらにシームレスにする一連の強力な機能が搭載されています。 いくつかの主な機能を次に示します。

  • 簡単なクリック操作で列を昇順または降順で並べ替えます。 この機能を使用すると、大規模なセマンティック モデルの操作中、または傾向をすばやく特定する必要がある場合に、データの編成を完全に制御できます。

  • 部分文字列によって、またはテーブル内の使用可能な値の一覧から選択して、データをフィルター処理します。

  • 列のサイズを変更して、好みに合わせてデータ ビューを調整します。 この機能は、重要なデータに優先順位を付けたり、視野を広げて幅広い情報を取り込んだりするのに役立ちます。

ファイルのプレビュー

Lakehouse 内のデータ ファイルをプレビューすると、データの品質、理解、全体的なデータ管理効率を向上させるさまざまな利点があります。 これにより、データ専門家は情報に基づいた意思決定を行い、リソースの割り当てを最適化し、分析が信頼性の高い貴重なデータに基づいて行われるようにすることができます。

プレビューは、ファイルの種類 bmp、css、csv、gif、html、jpeg、jpg、js、json、md、mjs、png、ps1、py、svg、ts、tsx、txt、xml、yaml に使用できます

リボン

Lakehouse リボンは、簡単にアクセスできるアクション バーであり、Lakehouse 内で重要なタスクを実行するのに便利です。 ここから、簡単に Lakehouse を更新、設定を更新、データを読み込む、ノートブックを作成あるいは開く、新しいカスタム セマンティック モデルを作成、あるいは OneLake データアクセスを管理することができます。

Lakehouse にデータを読み込むさまざまな方法

[エクスプローラー] ページから Lakehouse にデータを読み込むには、いくつかの方法があります。

  • ローカル ファイル/フォルダーのアップロード: ローカル コンピューターから Lakehouse の [ファイル] セクションに直接、データを簡単にアップロードします。 詳しくは、こちら** をご覧ください。

  • ノートブック コード: 使用可能な Spark ライブラリを利用してデータ ソースに接続し、データフレームにデータを読み込んでから、Lakehouse に保存します。 詳細については、ここ** を参照してください。

  • パイプラインのコピー ツール: さまざまなデータ ソースに接続し、データを元の形式で配置するか Delta テーブルに変換します。 詳しくは、こちら** をご覧ください。

  • データフロー Gen 2: データフローを作成してデータをインポートし、変換し、Lakehouse に発行します。 詳細はこちら** をご覧ください。

  • ショートカット: データを直接コピーすることなく、既存のデータを Lakehouse に接続するためのショートカットを作成します。 詳細については、ここ** を参照してください。

  • サンプル: サンプル データをすばやく取り込んで、セマンティック モデルとテーブルの探索をすぐに開始します。

さまざまなユース ケースを見つけて、レイクハウスにデータを読み込む最適な方法を理解します。

レイクハウスの SQL 分析エンドポイントへのアクセス

SQL 分析エンドポイントは、リボンの右上の領域にあるドロップダウンを使用して、Lakehouse エクスペリエンスから直接アクセスできます。 このクイック アクセス方法を使用すると、すぐに t-sql モードに入ります。これにより、レポートの準備に役立つように、レイク内の Delta テーブルの上で直接作業できるようになります。

このガイドが、Lakehouse エクスプローラーとその多様な機能を最大限に活用するのに役立つことを願っています。 自由にデータ管理タスクの探索、実験、効率化を行ってください。