Databricks アシスタントを使用する

重要

現在、この機能はパブリック プレビュー段階にあります。 プレビュー期間中の機能の使用は無料です。 最終的な価格は、一般提供 (GA) の前に決定され通知されます。

Databricks アシスタントは、Databricks ノートブック、SQL エディター、ファイル エディターで使用できるコンテキスト対応 AI アシスタントです。 Databricks アシスタントを使用すると、会話インターフェイスを使用してデータのクエリを実行できるため、Databricks 内での生産性が向上します。 タスクを英語で説明し、アシスタントに Python コードまたは SQL クエリを生成させ、複雑なコードを説明させ、エラーを自動的に修正させることができます。 アシスタントでは、テーブル、列、説明、社内全体でよく使用されるデータ資産を理解し、パーソナライズされた応答を提供するために、Unity Catalog のメタデータが使用されます。

Databricks アシスタントは、次のタスクを実行できます。

  • コードの生成。
  • コードのデバッグ (エラーの識別や修正の提案を含む)。
  • コードの変換と最適化。
  • コードの説明。
  • Azure Databricks のドキュメントで関連情報を探す支援。

Databricks Assistant は既定で有効になっています。 管理者は、アカウント内のすべてのワークスペースに対して Databricks アシスタントを無効または有効にすることができます。 管理者がワークスペース設定のオーバーライドを許可している場合、ワークスペース管理者は特定のワークスペースに対して Databricks アシスタントを有効または無効にすることができます。 詳細については、「Databricks アシスタントを有効または無効にする」を参照してください。

アカウントの Databricks Assistant の有効化は、監査ログのアカウント イベントとしてキャプチャされます。「アカウント レベルのアカウント イベント」を参照してください。

追加情報

次の記事には、Databricks アシスタントの使用に関するその他の情報が含まれています。

Databricks アシスタントの使用方法

Databricks Assistant は、ノートブック、SQL エディター、ファイル エディター、ダッシュボードで使用できます。 このドキュメントでは、ノートブックに焦点を当てています。 他の製品での使用も同様です。 Databricks Assistant を使用してダッシュボードの視覚化を作成する方法については、「Databricks Assistant で視覚化を作成する」を参照してください。

ノートブックでは、Databricks アシスタントは [Assistant]\(アシスタント\) ウィンドウまたはコード セル内のインラインで使用できます。

ノートブック セルで Databricks アシスタントを使用する

コード セルで Databricks アシスタントを直接使用するには、Cmd + i キー (MacOS) または Ctrl + i キー (Windows) を押します。 セル内にテキスト ボックスが表示されます。 英語で質問またはコメントを入力してから、Enter キー (セルを実行する場合の Shift+Enter キーではありません) を押すと、アシスタントに応答を生成させることができます。

使用中のインライン アシスタントのスクリーンショット

また、「/」を入力すると、一般的なコマンドの一覧を表示できます。たとえば、セル内のコードを説明するには /explain、コードにエラーがある場合に修正を提案するには /fix、コードのドキュメント コメントを提案するには /doc です。

/fix または /doc を使用すると、アシスタントによって提案される変更が差分ウィンドウに表示されます。 提案された変更を受け入れるには [Accept]\(承認\)、元のコードを保持するには [Reject]\(却下\) を選択します。 提案されたコードを受け入れても、コードは自動的に実行されません。 コードを確認してから実行できます。 生成されたコードが求めていたものではない場合、コメントに詳細または情報を追加して、もう一度やり直してください。 「Databricks アシスタントを使用するためのヒント」を参照してください。

コード オートコンプリートの場合、ノートブックのセルよりも [Assistant]\(アシスタント\) ウィンドウを使用した方がパフォーマンスが良くなることがあります。

ノートブックのセルでアシスタントを終了するには、セルの右上隅にある アシスタントを閉じる をクリックします。 アシスタントが自動的に閉じるのは、生成されたコードを承諾または却下した場合です。

[Assistant]\(アシスタント\) ウィンドウを使用する

[Assistant]\ (アシスタント\) ウィンドウを開くには、左側のサイドバーの Databricks Assistant アイコン をクリックします。

使用中の [アシスタント] ペインのスクリーンショット

[Assistant]\(アシスタント\) ウィンドウの下部にあるテキスト ボックスに質問を入力して、Enter キーを押すか、テキスト ボックスの右側にある アシスタント テキストを入力する をクリックします。 アシスタントによって回答が表示されます。 次のスクリーンショットは、アシスタントがコードを生成した後に [Assistant]\(アシスタント\) ウィンドウで実行できるアクションを示しています。

[アシスタント] ペインのコード ボックスの上部にあるアイコン

同じクエリをもう一度実行して、別の回答を生成できます。 これを行うには、回答の上にカーソルを置き、クエリの再生成アイコン をクリックします。

ウィンドウを閉じるには、もう一度アイコンをクリックするか、セルの右上隅にある アシスタントを閉じる をクリックします。 ウィンドウを全幅に展開するには、全幅を開くアイコン をクリックします。ウィンドウを既定の幅に戻すには 全幅を閉じるアイコン をクリックします。

[アシスタント] ペインの上部にあるアイコン

[Assistant]\(アシスタント\) ウィンドウでは、ウィンドウまたはノートブックを閉じた場合でも会話が追跡されます。 以前の会話をクリアするには、[Assistant]\(アシスタント\) ウィンドウの右上にある clear-assistant をクリックします。

AI ベースのオートコンプリート

重要

この機能はパブリック プレビュー段階にあります。

AI ベースのオートコンプリートでは、Databricks ノートブック、SQL エディター、およびファイル エディターで入力するときに、インライン コードの候補が提供されます。 インライン コードの候補は、Python と SQL で使用できます。

インライン コードの候補を有効または無効にする

この機能は、次のように各ユーザーに対して有効にする必要があります:

  1. ユーザー設定アイコン[設定] をクリックします。
  2. [試験的機能] で、[Databricks Assistant オートコンプリート] を切り替えます。

Note

  • ワークスペースでこの機能を無効にするには、Databricks にお問い合わせください。
  • FedRAMP 準拠の Azure Government リージョンまたはワークスペースでは、インライン コードの候補を使用できません。

インライン コードの候補を使用する

入力すると、候補が自動的に表示されます。 候補を受け入れるには、TAB キーを押します。 提案を手動でトリガーするには、Option + Shift + Space キー (macOS の場合) または Ctrl + Shift + Space キー (Windows の場合) を押します。

コード完成 SQL

コード完了 Python

AI ベースのオートコンプリートでは、コメントからコードを生成することもできます:

コメントからコード完成

コードのデバッグ

Databricks アシスタントを使用してコードを修正するには、[Assistant]\(アシスタント\) ウィンドウで質問するか、エラーが発生したときにセルの結果に表示される [Diagnose Error]\(エラーの診断\) ボタンをクリックします。 次のタブは、Python と SQL コードの例を示しています。

Python

アシスタント デバッグの例

Sql

アシスタント デバッグの例

コードを説明する

Databricks アシスタントは、コード スニペットの詳細な説明を提供できます。 入力するプロンプトに、「be concise」(簡潔にしてください) や「explain code line-by-line」(1 行ずつ説明してください) のような語を含めることで、説明の詳細レベルを要求できます。 コードにコメントを追加するように Databricks アシスタントに依頼することもできます。

Azure Databricks のドキュメントで関連情報を見つける

Databricks アシスタントは、ノートブック エディターからの質問に Databricks ドキュメントに基づいて直接回答できます。

Databricks ドキュメントに基づいて質問に回答する

Databricks アシスタントを使用するためのヒント

このセクションには、Databricks アシスタントを使用するときの一般的なヒントとベスト プラクティスがいくつか含まれています。

Databricks アシスタントはコンテキストを使用してさらに適切な回答を提供

Databricks アシスタントは、テーブルと列のスキーマおよびメタデータにアクセスできます。 このため、自然言語を使用できるようになり、より正確なクエリを生成できるようになります。 たとえば、テーブルに列 State がある場合、Databricks アシスタントにミシガン州に住むユーザーのリストを生成するように依頼できます。

Databricks アシスタントは、次のコンテキストを使用します。

  • 現在のノートブック セルまたは Databricks SQL エディター タブ内のコード/クエリ。
  • テーブルと列の名前と説明。
  • 以前のプロンプトの質問。
  • お気に入りおよびアクティブなテーブル。
  • エラー出力のスタック トレース (エラー診断機能の場合)。

DataFrame から列を選択するときは、開始クエリを指定することで、より正確な結果を得ることができます。 たとえば、SELECT * FROM <table_name> のようなステートメントを指定します。 こうすると Databricks アシスタントが列名を取得でき、推測する必要がありません。

Databricks アシスタントは会話履歴を使用して、より適切で正確な回答を提供するため、以前の応答の出力を変更するように Databricks アシスタントに依頼できます。以下に示すように、プロンプト全体を書き換える必要はありません。 アシスタントのチャット履歴を使用して、[Assistant] ウィンドウで DataFrame のクリーニング、探索、フィルター処理、スライスを繰り返し行うことができます。

具体的にする

Databricks Assistant が提供する構造と詳細は、同じプロンプトであっても、随時異なります。 必要な形式、詳細レベルなどの情報を返すのに役立つできるだけ多くのガイダンスをアシスタントに提供してみてください。 次に例を示します。

  • “このコードを 2 つの文で説明していただく” または “このコードを 1 行ずつ説明してください”。
  • “MatPlotLib を使用して視覚化を作成する” または “Seaborn を使用して視覚化を作成します”。

行レベルのデータ値の例を示します

Databricks アシスタントは行レベルのデータを使用しないため、プロンプトにさらに詳しく指定すると、最も正確な回答を得ることができます。 カタログ エクスプローラーでテーブルまたは列のコメントを使用して、サンプル データの行を追加します。 たとえば、高さの列が feet-inches 形式であるとします。 アシスタントがデータを解釈できるように、"高さ" 列は文字列形式で、ハイフンで区切られたコメントを追加します。 例: ‘6-2’。” テーブルと列のコメントの詳細については、「マークダウン コメントを使用した Catalog Explorer でのドキュメント データを」を参照してください。

また、操作を実行するために列データ型の変換が必要な場合は、詳細を指定する必要があります。 例: 「このコードを Pandas から PySpark に変換してください。Pandas DataFrame を PySpark DataFrame に変換するために必要なコードを組み込み、列のデータ型を chum から integer に変更します。」

Shift + Enter キーを使用してチャット テキスト ボックスに新しい行を追加する

Shift+Enter キーを使用してアシスタントのチャット テキスト ボックスに新しい行を追加できます。 これにより、Databricks アシスタントに対するメッセージの書式設定と整理が簡単になります。

Databricks アシスタントのチャット ウィンドウでコードを編集して実行する

[Assistant]\(アシスタント\) ウィンドウでコードを実行して検証したり、スクラッチパッドとして使用したりできます。 コードを実行するには、[Assistant]\(アシスタント\) ウィンドウのコード ボックスの左上隅にある コードの実行アイコン をクリックします。 次のタブは、Python と SQL コードの例を示しています。

Python

[アシスタント] ペインでのコードの実行

Sql

[アシスタント] ペインでのコードの実行

[Assistant]\(アシスタント\) ウィンドウでコードを実行すると、出力が表示され、変数がノートブックで使用できるようになります。

また、Databricks アシスタントによって生成されたコードを、アシスタントのチャット ボックスで直接編集してから、そのコードをノートブックに移動することもできます。