DBFS でのテーブルの探索と作成

重要

このドキュメントは廃止され、更新されない可能性があります。 このコンテンツで言及されている製品、サービス、テクノロジは、サポートされなくなりました。 「データの追加 UI を使用してデータを読み込む」、「ファイルのアップロードを使用してテーブルを作成または変更する」、「カタログ エクスプローラーとは」を参照してください。

データUIの追加 を使用して、レガシ DBFS ファイルのアップロードとテーブル作成 UI にアクセスします。 New Icon[新規] > [データ] > [DBFS] をクリックします。

この UI には、[ファイル] > [データの追加] をクリックして、ノートブックからアクセスすることもできます。

Databricks では、データ オブジェクトの表示と ACL の管理のエクスペリエンスを向上させるために Catalog Explorer を使用し、小さなファイルを簡単に Delta Lake に取り込むために [ファイルのアップロードからテーブルを作成または変更する] ページを使用することをお勧めしています。

Note

この記事で説明する一部の要素の可用性は、ワークスペースの構成によって異なります。 ワークスペース管理者または Azure Databricks アカウント チームにお問い合わせください。

データのインポート

ローカル コンピューターにある小さなデータ ファイルを Azure Databricks で分析する場合は、UI を使用してそれらを DBFS にインポートできます。

Note

ワークスペース管理者は、この機能を無効にすることができます。 詳細については、データアップロードの管理を参照してください。

これらの方法で DBFS にインポートされたファイルは FileStore に格納されます。

テーブルの作成

DBFS テーブル作成 UI を起動するには、サイドバーの New Icon[新規] をクリックするか、データの追加 UI[DBFS] ボタンをクリックします。 DBFS 内のファイルからテーブルに入力するか、ファイルをアップロードすることができます。

UI では、外部テーブルのみを作成できます。

  1. データ ソースを選択し、対応するセクションの手順に従ってテーブルを構成します。

    Azure Databricks ワークスペース管理者が [ファイルのアップロード] オプションを無効にしている場合は、ファイルをアップロードするオプションは表示されません。他のデータ ソースのひとつを使用してテーブルを作成できます。

    ファイルのアップロードの手順

    1. ファイルを [ファイル] ドロップゾーンにドラッグするか、ドロップゾーンをクリックしてファイルを参照して選択します。 アップロード後、ファイルごとにパスが表示されます。 /FileStore/tables/<filename>-<integer>.<file-type> のようなパスが表示されます。 このパスは、ノートブックでデータを読み取る場合に使用できます。
    2. [Create Table with UI]\(UI を使用してテーブルを作成\) をクリックします。
    3. [クラスター] ドロップダウンで、クラスターを選択します。

    DBFS の手順

    1. ファイルを選択します。
    2. [Create Table with UI]\(UI を使用してテーブルを作成\) をクリックします。
    3. [クラスター] ドロップダウンで、クラスターを選択します。
  2. [Preview Table]\(テーブルのプレビュー\) をクリックしてテーブルを表示します。

  3. [テーブル名] フィールドで、必要に応じて既定のテーブル名をオーバーライドします。 テーブル名には、小文字の英数字とアンダースコアのみを含め、小文字またはアンダースコアで始まる必要があります。

  4. [Create in Database]\(データベースに作成\) フィールドで、必要に応じて、選択した default データベースをオーバーライドします。

  5. [ファイルの種類] フィールドで、必要に応じて、推論されたファイルの種類をオーバーライドします。

  6. ファイルの種類が CSV の場合:

    1. [列区切り記号] フィールドで、推論された区切り記号をオーバーライドするかどうかを選択します。
    2. 先頭の行を列タイトルとして使用するかどうかを指定します。
    3. スキーマを推論するかどうかを指定します。
  7. ファイルの種類が JSON の場合は、ファイルが複数行かどうかを指定します。

  8. [テーブルの作成] をクリックします。

データベースとテーブルを表示する

Note

Catalog Explorer が有効になっているワークスペースでは、以下で説明する従来の動作にアクセスできません。

サイドバーで Catalog icon[カタログ] をクリックします。 Azure Databricks は、アクセス権を持つ実行中のクラスターを選択します。 [データベース] フォルダーには、選択された default データベースのデータベース一覧が表示されます。 [テーブル] フォルダーには、default データベース内のテーブル一覧が表示されます。

Create tables list

[データベース] メニューからクラスターの変更、テーブル UI の作成、またはテーブル UI の表示を行えます。 たとえば、[データベース] メニューから次のように実行します。

  1. Databases フォルダーの上部にある Down Caret 下向き矢印をクリックします。

  2. クラスターを選択します。

    Select cluster

テーブルの詳細を表示する

テーブルの詳細ビューには、テーブル スキーマとサンプル データが表示されます。

  1. サイドバーで Catalog icon[カタログ] をクリックします。

  2. [データベース] フォルダーで、データベースをクリックします。

  3. [テーブル] フォルダーで、テーブル名をクリックします。

  4. [クラスター] ドロップダウンで、必要に応じて別のクラスターを選択して、テーブルのプレビューをレンダリングします。

    Table details

    Note

    テーブルのプレビューを表示するには、[クラスター] ドロップダウンで選択したクラスターで Spark SQL クエリが実行されます。 クラスターで既にワークロードが実行されている場合、テーブルのプレビューの読み込みには時間がかかる場合があります。

UI を使用してテーブルを削除する

  1. サイドバーで Catalog icon[カタログ] をクリックします。
  2. テーブル名の横にある Menu Dropdown をクリックし、[削除] を選択します。