DataGrip と Azure Databricks との統合

[アーティクル]
05/14/2024

注意

この記事では、Databricks によって提供もサポートもされていない DataGrip について説明します。プロバイダーに問い合わせるには、DataGrip のサポートをご覧ください。

DataGrip は、データベース開発者向けの統合開発環境 (IDE) です。クエリコンソール、スキーマナビゲーション、explain プラン、スマートコード補完、リアルタイム分析とクイック修正、リファクタリング、バージョン管理の統合などの機能が用意されています。

この記事では、ローカルの開発マシンを使用して、Azure Databricks でデータベースを操作するために DataGrip をインストール、構成、使用する方法について説明します。

Note

この記事は、macOS、Databricks JDBC ドライバーバージョン 2.6.36、DataGrip バージョン 2023.3.1 でテストされました。

要件

DataGrip をインストールする前に、ローカル開発マシンが次の要件を満たしている必要があります。

Linux、macOS、または Windows オペレーティングシステム。
Databricks JDBC ドライバーをローカル開発マシンにダウンロードし、ダウンロードした DatabricksJDBC42-<version>.zip ファイルから DatabricksJDBC42.jar ファイルを抽出します。
DataGrip と接続する Azure Databricks クラスターまたは SQL ウェアハウス。

手順 1: DataGrip をインストールする

DataGrip をダウンロードしてインストールします。

Linux: .zip ファイルをダウンロードし、その内容を抽出して、Install-Linux-tar.txt ファイルの指示に従います。
macOS: .dmg ファイルをダウンロードして実行します。
Windows: .exe ファイルをダウンロードして実行します。

詳細については、DataGrip Web サイトの DataGrip のインストールに関するページを参照してください。

手順 2: DataGrip 用に Databricks JDBC ドライバーを構成する

前にダウンロードした Databricks JDBC ドライバーに関する情報を使用して DataGrip を設定します。

DataGrip を起動します。
[ファイル] > [データソース] の順にクリックします。
[データソースとドライバー] ダイアログボックスで、[ドライバー] タブをクリックします。
ドライバーを追加するには、+ ([ドライバー]) ボタンをクリックします。
名前には、Databricksを入力します。
[全般] タブの [ドライバーファイル] 一覧で、+ ([追加]) ボタンをクリックします。
[カスタム JAR] タイルをクリックします。
先ほど抽出した DatabricksJDBC42.jar ファイルを参照して選択し、[開く] をクリックします。
クラス には com.databricks.client.jdbc.Driver を選択します。
[OK] をクリックします。

手順 3: DataGrip を Azure Databricks データベースに接続する

DataGrip で、[ファイル] > [データソース] の順にクリックします。
[データソース] タブで、+ ([追加]) ボタンをクリックします。
前の手順で追加した Databricks ドライバーを選択します。
[全般] タブの [URL] に、Azure Databricks リソースの [JDBC URL] フィールドの値を入力します。 JDBC URL フィールド構文については、「Databricks JDBC ドライバーの認証設定」を参照してください。
[接続テスト]をクリックします。

ヒント

接続をテストする前に、リソースを起動する必要があります。このようにしないと、リソースが起動する時間のために、テストが完了するまでに数分かかる場合があります。
接続に成功した場合は、[スキーマ] タブで、アクセスを可能にするスキーマのチェックボックスをオンにします ([All schemas] (すべてのスキーマ) など)。
OK をクリックします。

DataGrip でアクセスするリソースごとに、この手順の指示を繰り返します。

手順 4: DataGrip を使用してテーブルを参照する

DataGrip を使用して、Azure Databricks ワークスペースのテーブルにアクセスします。

DataGrip の [データベース] ウィンドウで、リソースノードを展開し、参照するスキーマを展開して、[テーブル] を展開します。
テーブルをダブルクリックします。テーブルの最初の行セットが表示されます。

この手順の指示を繰り返して、その他のテーブルにアクセスします。

他のスキーマのテーブルにアクセスするには、[データベース] ウィンドウのツールバーで、[データソースのプロパティ] アイコンをクリックします。 [データソースとドライバー] ダイアログボックスの [スキーマ] タブで、アクセスするその他のスキーマそれぞれのチェックボックスをオンにし、[OK] をクリックします。

手順 5: DataGrip を使用して SQL ステートメントを実行する

DataGrip を使用して、samples カタログの nyctaxi スキーマからサンプル trips テーブルを読み込みます。

DataGrip で、[ファイル] > [新規作成] > [SQL ファイル] の順にクリックします。
ファイルの名前を入力します (例: select_trips)。
select_trips.sql ファイルタブで、次の SQL ステートメントを入力します。
```
SELECT * FROM samples.nyctaxi.trips;
```
SELECT ステートメントを選択します。
[ファイル] タブのツールバーで、[実行] アイコンをクリックします。

次のステップ

DataGrip のクエリコンソールの詳細について確認します。
DataGrip のデータエディターの詳細について確認します。
DataGrip でのさまざまなツールウィンドウの詳細について確認します。
DataGrip で検索する方法について確認します。
DataGrip でデータをエクスポートする方法について確認します。
DataGrip で正規表現を使用してテキストを検索および置換する方法について確認します。

次の方法で共有