DBFS でのテーブルの探索と作成

データUIの追加 を使用して、レガシ DBFS ファイルのアップロードとテーブル作成 UI にアクセスします。 新規アイコン[新規] > [データ] > [DBFS] をクリックします。

この UI には、[ファイル] > [Upload Data] (データのアップロード) をクリックして、ノートブックからアクセスすることもできます。

Databricks では、データ オブジェクトの表示と ACL の管理のエクスペリエンスを向上するために Data Explorer を使用し、小さなファイルを簡単に Delta Lake に取り込むことができるようにデータのアップロード UI を使用することをお勧めしています。

Note

この記事で説明する一部の要素の可用性は、ワークスペースの構成によって異なります。 ワークスペース管理者または Azure Databricks の担当者にお問い合わせください。

データのインポート

ローカル コンピューターにある小さなデータ ファイルを Azure Databricks で分析する場合は、UI を使用してそれらを DBFS にインポートできます。

Note

ワークスペース管理者は、この機能を無効にすることができます。 詳細については、データアップロードの管理を参照してください。

これらの方法で DBFS にインポートされたファイルは FileStore に格納されます。

テーブルを作成する

DBFS テーブルUIの作成を起動するには、サイドバーの 新規アイコン[新規] をクリックするか、データUIの追加[DBFS] ボタンをクリックします。 DBFS 内のファイルからテーブルに入力するか、ファイルをアップロードすることができます。

UI では、外部テーブルのみを作成できます。

  1. データ ソースを選択し、対応するセクションの手順に従ってテーブルを構成します。

    Azure Databricks ワークスペース管理者が [ファイルのアップロード] オプションを無効にしている場合は、ファイルをアップロードするオプションは表示されません。他のデータ ソースのひとつを使用してテーブルを作成できます。

    ファイルのアップロードの手順

    1. ファイルを [ファイル] ドロップゾーンにドラッグするか、ドロップゾーンをクリックしてファイルを参照して選択します。 アップロード後、ファイルごとにパスが表示されます。 /FileStore/tables/<filename>-<integer>.<file-type> のようなパスが表示されます。 このパスは、ノートブックでデータを読み取る場合に使用できます。
    2. [Create Table with UI](UI を使用してテーブルを作成) をクリックします。
    3. [クラスター] ドロップダウンで、クラスターを選択します。

    DBFS の手順

    1. ファイルを選択します。
    2. [Create Table with UI](UI を使用してテーブルを作成) をクリックします。
    3. [クラスター] ドロップダウンで、クラスターを選択します。
  2. [Preview Table](テーブルのプレビュー) をクリックしてテーブルを表示します。

  3. [テーブル名] フィールドで、必要に応じて既定のテーブル名をオーバーライドします。 テーブル名には、小文字の英数字とアンダースコアのみを含め、小文字またはアンダースコアで始まる必要があります。

  4. [Create in Database](データベースに作成) フィールドで、必要に応じて、選択した default データベースをオーバーライドします。

  5. [ファイルの種類] フィールドで、必要に応じて、推論されたファイルの種類をオーバーライドします。

  6. ファイルの種類が CSV の場合:

    1. [列区切り記号] フィールドで、推論された区切り記号をオーバーライドするかどうかを選択します。
    2. 先頭の行を列タイトルとして使用するかどうかを指定します。
    3. スキーマを推論するかどうかを指定します。
  7. ファイルの種類が JSON の場合は、ファイルが複数行かどうかを指定します。

  8. [テーブルの作成] をクリックします。

データベースとテーブルを表示する

Note

Data Explorer が有効になっているワークスペースは、以下で説明する従来の動作にアクセスできません。

サイドバーの Data Icon[データ] をクリックします。 Azure Databricks は、アクセス権を持つ実行中のクラスターを選択します。 [データベース] フォルダーには、選択された default データベースのデータベース一覧が表示されます。 [テーブル] フォルダーには、default データベース内のテーブル一覧が表示されます。

テーブル一覧の作成

[データベース] メニューからクラスターの変更、テーブル UI の作成、またはテーブル UI の表示を行えます。 たとえば、[データベース] メニューから次のように実行します。

  1. [データベース] フォルダーの上部にある 下向きキャレット 下向き矢印をクリックします。

  2. クラスターを選択します。

    クラスターの選択

テーブルの詳細を表示する

テーブルの詳細ビューには、テーブル スキーマとサンプル データが表示されます。

  1. サイドバーの Data Icon[データ] をクリックします。

  2. [データベース] フォルダーで、データベースをクリックします。

  3. [テーブル] フォルダーで、テーブル名をクリックします。

  4. [クラスター] ドロップダウンで、必要に応じて別のクラスターを選択して、テーブルのプレビューをレンダリングします。

    テーブル詳細

    Note

    テーブルのプレビューを表示するには、[クラスター] ドロップダウンで選択したクラスターで Spark SQL クエリが実行されます。 クラスターで既にワークロードが実行されている場合、テーブルのプレビューの読み込みには時間がかかる場合があります。

UI を使用してテーブルを削除する

  1. サイドバーの Data Icon[データ] をクリックします。
  2. テーブル名の隣にある メニュー ドロップダウン をクリックして、[削除] を選択します。