Fabric Lakehouse エクスプローラーを操作する

2024-05-28

[Lakehouse エクスプローラー] ページは、Lakehouse 環境内のすべての対話の中心となるハブとして機能します。エクスプローラーは、Fabric ポータルに組み込まれています。 Lakehouse エクスプローラーを開くには、ワークロードスイッチャーを Data Engineering に切り替えます。レイクハウスの項目を見つけて移動すると、エクスプローラーが開き、レイクハウスデータを操作できます。エクスプローラーはレイクハウスにシームレスにデータを読み込み、データ内を移動し、コンテンツをプレビューし、さまざまなデータ関連タスクを実行するためのゲートウェイです。このページは、Lakehouse エクスプローラー、メインビュー、リボンの 3 つの主なセクションに分かれています。

Lakehouse エクスプローラー

Lakehouse エクスプローラーは、レイクハウス全体の統一されたグラフィック表示を提供し、データのナビゲーション、アクセス、管理のための直感的なインターフェイスをユーザーに提供します。

[テーブル] セクションは、レイクハウス内のマネージド領域をわかりやすく表しています。この領域は通常、効率的なデータ処理と分析を容易にするために編成および管理されます。ここでは、自動的に生成されたか、明示的に作成され、メタストアに登録されたかに関係なく、すべてのテーブルが見つかります。プレビューするテーブルの選択、テーブルスキーマの検査、基になるファイルへのアクセス、データに関連するその他のさまざまなアクションの実行を行うことができます。
[不明] 領域は、レイクハウスのマネージド領域内の固有の空間です。 SyMS に関連付けられたテーブルがないマネージド領域に存在するフォルダーまたはファイルが表示されます。たとえば、ユーザーがイメージやオーディオファイルなどのサポートされていないファイルをマネージド領域にアップロードした場合、自動的に検出され、テーブルにリンクされることはありません。代わりに、この不明領域に表示されます。このセクションの主な目的は、これらのファイルをマネージド領域から削除するか、またはさらに処理するために [ファイル] セクションに転送するように求めるプロンプトをユーザーに出すことです。
[ファイル] セクションは、レイクハウスのアンマネージド領域を表し、さまざまなソースから取り込まれた生データの "ランディングゾーン" と見なすことができます。このデータを分析に使用する前に、多くの場合、追加の処理が必要です。このセクションでは、ディレクトリ内を移動し、プレビューするディレクトリを選択し、フォルダーをテーブルに読み込み、他のさまざまなアクションを実行することができます。 [ファイル] セクションには、フォルダーレベルのオブジェクトのみが表示されることに注目してください。ファイルレベルのオブジェクトを表示するには、メインビュー領域を使用する必要があります。

メインビュー領域

[Lakehouse] ページのメインビュー領域は、ほとんどのデータ操作が発生する領域です。ビューは、選択内容に応じて変化します。オブジェクトエクスプローラーにはレイクのフォルダーレベル階層のみが表示されるため、ファイル間の移動、ファイルとテーブルのプレビュー、およびその他のさまざまなタスクでメインビュー領域を使用します。

[テーブルのプレビュー]

テーブルのプレビューデータグリッドには、データの対話を高めてデータの操作をさらにシームレスにする一連の強力な機能が搭載されています。いくつかの主な機能を次に示します。

簡単なクリック操作で列を昇順または降順で並べ替えます。この機能を使用すると、大規模なセマンティックモデルの操作中、または傾向をすばやく特定する必要がある場合に、データの編成を完全に制御できます。
部分文字列によって、またはテーブル内の使用可能な値の一覧から選択して、データをフィルター処理します。
列のサイズを変更して、好みに合わせてデータビューを調整します。この機能は、重要なデータに優先順位を付けたり、視野を広げて幅広い情報を取り込んだりするのに役立ちます。

ファイルのプレビュー

レイクハウス内のデータファイルをプレビューすると、データの品質、理解、全体的なデータ管理効率を向上させるさまざまな利点があります。これにより、データ専門家は情報に基づいた意思決定を行い、リソースの割り当てを最適化し、分析が信頼性の高い貴重なデータに基づいて行われるようにすることができます。

プレビューは、ファイルの種類 bmp、css、csv、gif、html、jpeg、jpg、js、json、md、mjs、png、ps1、py、svg、ts、tsx、txt、xml、yaml に使用できます

リボン

Lakehouse リボンは、簡単にアクセスできるアクションバーであり、レイクハウス内で重要なタスクを実行するのに便利です。ここから、簡単にレイクハウスを更新、設定を更新、データを読み込む、ノートブックを作成あるいは開く、新しいカスタムセマンティックモデルを作成することで、OneLake データアクセスを管理することができます。

レイクハウスにデータを読み込むさまざまな方法

[エクスプローラー] ページからレイクハウスにデータを読み込むには、いくつかの方法があります。

ローカルファイル/フォルダーのアップロード: ローカルコンピューターからレイクハウスの [ファイル] セクションに直接、データを簡単にアップロードします。こちらをご覧ください。
ノートブックコード: 使用可能な Spark ライブラリを利用してデータソースに接続し、データフレームにデータを読み込んでから、レイクハウスに保存します。詳細については、ここを参照してください。
パイプラインのコピーツール: さまざまなデータソースに接続し、データを元の形式で配置するか Delta テーブルに変換します。こちらをご覧ください。
データフロー Gen 2: データフローを作成してデータをインポートし、変換し、レイクハウスに発行します。詳細はこちらをご覧ください。
ショートカット: データをコピーせずに、既存のデータをレイクハウスに接続するためのショートカットを作成します。詳細については、ここを参照してください。
サンプル: サンプルデータをすばやく取り込んで、セマンティックモデルとテーブルの探索をすぐに開始します。

さまざまなユースケースを見つけて、レイクハウスにデータを読み込む最適な方法を理解します。

レイクハウス SQL 分析エンドポイントにアクセスする

SQL 分析エンドポイントは、リボンの右上の領域にあるドロップダウンを使用して、レイクハウスから直接アクセスできます。このクイックアクセス方法を使用すると、すぐに t-sql モードに入ります。これにより、レポートの準備に役立つように、レイク内の Delta テーブルの上で直接作業できるようになります。

このガイドが、Lakehouse エクスプローラーとその多様な機能を最大限に活用するのに役立つことを願っています。自由にデータ管理タスクの探索、実験、効率化を行ってください。

次の方法で共有

Fabric Lakehouse エクスプローラーを操作する

Lakehouse エクスプローラー

メイン ビュー領域

[テーブルのプレビュー]

ファイルのプレビュー

リボン

レイクハウスにデータを読み込むさまざまな方法

レイクハウス SQL 分析エンドポイントにアクセスする

関連するコンテンツ

フィードバック

その他のリソース

メインビュー領域