次の方法で共有


DBeaver と Azure Databricks の統合

この記事では、サード パーティによって開発された DBeaver について説明します。 プロバイダーに問い合わせるには、GitHub の dbeaver/dbeaver リポジトリの問題ページを参照してください。

DBeaver は、開発者、データベース管理者、データ アナリスト、データ エンジニア、およびデータベースを操作する必要がある他のユーザー向けのローカルのマルチプラットフォーム データベース ツールです。 DBeaver では、Azure Databricks だけでなく、他の一般的なデータベースもサポートされています。

この記事では、ローカル開発マシンを使用して、無料のオープン ソースの DBeaver Community Edition (CE) をインストール、構成、使用して Azure Databricks のデータベースを操作する方法について説明します。

この記事は、macOS、 Databricks JDBC Driver バージョン 2.6.36、 DBeaver CE バージョン 23.3.0 でテストされました。

要求事項

DBeaver をインストールする前に、ローカル開発マシンが次の要件を満たしている必要があります。

  • Linux 64 ビット、macOS、または Windows 64 ビット オペレーティング システム。 (Linux 32 ビットはサポートされていますが、推奨されません)。
  • Databricks JDBC Driver をローカル開発マシンにインストールし、ダウンロードしたDatabricksJDBC42.jar ファイルからDatabricksJDBC42-<version>.zip ファイルを抽出します。

DBeaver に接続するには、Azure Databricks クラスター または SQL ウェアハウス も必要です。

手順 1: DBeaver をインストールする

次のように DBeaver CE をダウンロードしてインストールします。

  • Linux: DBeaver Web サイトのダウンロード ページから Linux インストーラーのいずれかを ダウンロード して実行します。 このページでは、snapflatpak のインストールオプションも提供されています。
  • macOS: Homebrew を使用して brew install --cask dbeaver-communityを実行するか、 MacPorts を 使用して sudo port install dbeaver-communityを実行します。 macOS インストーラーは、DBeaver Web サイトの ダウンロード ページからも入手できます。
  • Windows: Chocolatey を使用して choco install dbeaverを実行します。 Windows インストーラーは、DBeaver Web サイトの ダウンロード ページからも入手できます。

手順 2: Azure Databricks JDBC Driver for DBeaver を構成する

前にダウンロードした Databricks JDBC ドライバーに関する情報を使用して DBeaver を設定します。

  1. DBeaver を起動します。
  2. 新しいデータベースの作成を求めるメッセージが表示されたら、[ いいえ] をクリックします。
  3. データベースへの接続または選択を求めるメッセージが表示されたら、[ キャンセル] をクリックします。
  4. [ データベース > ドライバー マネージャー] をクリックします。
  5. [ ドライバー マネージャー ] ダイアログ ボックスで、[ 新規作成] をクリックします。
  6. [ 新しいドライバーの作成 ] ダイアログ ボックスで、[ ライブラリ ] タブをクリックします。
  7. [ファイルの追加] をクリックします。
  8. Azure Databricks JDBC Driver を抽出したフォルダーに移動します。
  9. 1 つ下のレベルに移動して、 .jar ファイルを見つけます。
  10. .jarファイルを強調表示し、[開く] をクリックします。
  11. [ 設定] タブの [ ドライバー名] に「 Databricks」と入力します。
  12. [ 設定] タブの [ クラス名] に「 com.databricks.client.jdbc.Driver」と入力します。
  13. OK をクリックします。
  14. [ ドライバー マネージャー ] ダイアログ ボックスで、[ 閉じる] をクリックします。

手順 3: DBeaver を Azure Databricks データベースに接続する

DBeaver を使用してクラスターまたは SQL ウェアハウスに接続し、Azure Databricks ワークスペース内のデータベースにアクセスします。

  1. DBeaver で、[ データベース] > [新しいデータベース接続] をクリックします。

  2. [ データベースへの接続 ] ダイアログ ボックスの [ すべて ] タブで、[ Databricks] をクリックし、[ 次へ] をクリックします。

  3. [ メイン ] タブをクリックし、Azure Databricks リソースの JDBC URL フィールドに値を入力します。 JDBC URL フィールドの構文については、Databricks JDBC Driver の認証設定を参照してください。

  4. [接続テスト]をクリックします。

    ヒント

    接続をテストする前に、Azure Databricks リソースを開始する必要があります。 そうしないと、リソースの起動中にテストが完了するまでに数分かかる場合があります。

  5. 接続が成功した場合は、[ 接続テスト ] ダイアログ ボックスで [ OK] をクリックします。

  6. [ データベースへの接続 ] ダイアログ ボックスで、[完了] をクリック します

[ データベース ナビゲーター ] ウィンドウに、 Databricks エントリが表示されます。 識別しやすくするために接続の名前を変更するには:

  1. Databricks を右クリックし、[接続の編集] をクリックします。
  2. [ 接続の構成 ] ダイアログ ボックスで、[ 全般] をクリックします。
  3. [ 接続名] で、 Databricks を接続の別の名前に置き換えます。
  4. OK をクリックします。

DBeaver にアクセスするリソースごとに、この手順の手順を繰り返します。

手順 4: DBeaver を使用してデータ オブジェクトを参照する

DBeaver を使用して、Azure Databricks ワークスペース内のデータ オブジェクト (テーブルとテーブルのプロパティ、ビュー、インデックス、データ型、その他のデータ オブジェクト型など) にアクセスします。

  1. DBeaver の [ データベース ナビゲーター ] ウィンドウで、使用する接続を右クリックします。

  2. [接続] が有効になっている場合は、それをクリックします。 ( Connect が無効になっている場合は、既に接続されています)。

    ヒント

    接続する前に、リソースを起動する必要があります。 そうしないと、リソースの起動中に接続が完了するまでに数分かかる場合があります。

  3. 既に接続したものを拡張します。

  4. 使用可能なデータ オブジェクトを展開して参照します。 データ オブジェクトをダブルクリックして、詳細を取得します。

この手順の手順を繰り返して、追加のデータ オブジェクトにアクセスします。

手順 5: DBeaver を使用して SQL ステートメントを実行する

DBeaver を使用して、trips カタログのsamples スキーマからサンプル nyctaxi テーブルを読み込みます。

  1. DBeaver の [ データベース ナビゲーター ] ウィンドウで、使用する接続を右クリックします。

  2. [接続] が有効になっている場合は、それをクリックします。 ( Connect が無効になっている場合は、既に接続されています)。

    ヒント

    接続する前に、リソースを起動する必要があります。 そうしないと、リソースの起動中に接続が完了するまでに数分かかる場合があります。

  3. [ SQL エディター] > [新しい SQL スクリプト] をクリックします。

  4. (connection-name) Script-1 タブで、次の SQL ステートメントを入力します。

    SELECT * FROM samples.nyctaxi.trips;
    
  5. [ SQL エディター] > [SQL スクリプトの実行] をクリックします。

次のステップ

その他のリソース