次の方法で共有


データ サイエンス エージェントを使用する

Important

この機能は ベータ版です

このページでは、Databricks Assistant で [エージェント モード] を選択して使用できる AI データ エージェントである Data Science Agent について説明します。 Databricks ノートブックと SQL エディター専用に設計されており、1 つのプロンプトからデータの探索、コードの生成と実行、エラーの修正を行います。

データ サイエンス エージェントとは

Data Science Agent は、Databricks Assistant のエージェント モードの強力な機能であり、アシスタントをインテリジェントなコンパニオンに変換し、Databricks ノートブックと SQL エディターでマルチステップ データ サイエンス ワークフロー全体を自動化できます。

ノートブックでデータ サイエンス エージェントを使用します。

アシスタント チャット モードと比較して、エージェント モードでは、ソリューションの計画、関連する資産の取得、コードの実行、セル出力を使用した結果の改善、エラーの自動修正などの機能が拡張されています。

Data Science Agent は、SQL エディターで実行するノートブックまたはクエリで実行するコードを計画および生成できます。 エージェントは、お客様と協力して計画を承認し、次の手順を確認してから続行します。 Data Science Agent では、承認を得て、ツールを使用して、テーブルの検索、ノートブックの編集、セルの実行、セル出力の読み取りなどのタスクを実行できます。

データ サイエンス エージェントのアクセスとアクションは、ユーザーのアクセス許可によって制御されます。 アクセス権を持つデータにのみアクセスし、アクセス許可を持つ操作を実行できます。

Requirements

Data Science Agent を使用するには、ワークスペースに次のものが必要です。

データ サイエンス エージェントを使用する

データ サイエンス エージェントを使用するには:

  1. Databricks ノートブックまたは SQL エディターから、アシスタントのサイド パネルを開きます。

  2. 右下隅にある [エージェント] を選択 します。 これにより、アシスタントのエージェント モードが切り替わり、データ サイエンス エージェントと対話できるようになります。

    Open Data Science Agent

  3. エージェントのプロンプトを入力します。 たとえば、「samples.bakehouse から @sales_transactions を分析して、最も売れている製品を特定する」などです。

    ヒント

    @table_nameを使用して特定のテーブルを参照します。 エージェントは、そのテーブルとそれに関連付けられているメタデータを使用して、応答をキュレーションします。 エージェントはユーザーの Unity カタログのアクセス許可を尊重するため、アクセス権を持つデータにのみアクセスできます。

  4. エージェントが応答を生成すると、多くの場合、入力を取得するために一時停止します。

    • より複雑なタスクの場合、エージェントは段階的な計画を作成し、明確な質問をする場合があります。 エージェントの明確な質問に答えて、その計画を磨くのに役立ちます。

    • エージェントがコードを実行する必要がある場合は、続行する前に承認を求められます。 要求を許可または拒否します。 このスレッドで [許可] (アシスタント会話スレッドを参照) または [常に許可] を選択することもできます。

      Important

      Data Science Agent は、ノートブックでコードを生成して実行できます。 危険な行動を防ぐためのガードレールがありますが、依然としてリスクがあります。 信頼できるコードとデータでのみ使用する必要があります

    • エージェントが作業を続行すると、[ 続行 ] または [拒否 ] を選択するように求められる場合があります。エージェントの既存の作業を確認し、[ 続行 ] を選択してエージェントが次の手順に進むのを許可するか 、[拒否] を選択して他の操作を試みるように指示します。

    • エージェントの動作中にエージェントを停止するには、赤い 停止アイコンをクリックします。

エージェントは、新しいノートブック セル (またはクエリ) を作成し、テキストとコードを生成し、ノートブック セルを実行し、セル出力にアクセスして結果を解釈できます。

データ サイエンス エージェントが作業を続行し、次の手順を実行するには、エージェントが作業している現在のタブを維持する必要があります。

活用事例

エージェント モードでは、アシスタントには、データの検索、出力の解釈、セルアクションの実行などの機能が拡張されています。

データ サイエンス エージェントは、探索的データ分析、予測、機械学習などの複雑なデータ サイエンス タスクに役立ちます。 Data Science Agent を使用して、新しいデータ分析ノートブックを最初から作成することもできます。 より良い結果を得るには、 @<resource_name>を使用してテーブルとパイプラインを参照することで、エージェントにコンテキストを提供します。 [At] アイコンをクリックして該当するリソースを参照し、提供するコンテキストを手動で選択できます。

開始するには、次のプロンプトを試してください。

  • データ検出:
    • "どのテーブルにベイクハウス トランザクション データが含まれていますか?
    • 「カリフォルニア州ロサンゼルス市の 2025-01-01 日付の気象データを確認したい」
    • "ニューヨーク市のタクシー データを含むテーブルを見つけて、最初の 10 行を表示してください。"
  • 探索的データ分析:
    • "列 A の JSON 文字列の解析に役立ちます。"
    • "このテーブルからデータの視覚化を作成します。"
    • "この横棒グラフを解釈します。"
    • " @sales_transactions データセットについて説明します。 列の統計を理解し、値の分布を視覚化するのに役立つ EDA をいくつか実行します。 データ サイエンティストのように考えてください。
    • @workload_insights 分析して、先週の Databricks SQL ワークロードの上位 5 人の顧客を収益別に見つけます。 次に、過去 6 週間に Databricks SQL に対して 1 週間に使用したユーザーの数をプロットします。
  • 予測:
    • " @incidents データセットを使用して、今後 2 週間のインシデントの日次数の予測を作成します。 完了したら、データ テーブルと、結果を表示するための対話型グラフを提供してください。
    • " @website_traffic データセットを使用して、来月の 1 日の訪問者数を予測します。 季節のパターンを強調表示します。
    • "信頼区間を含め、 @inventory データセットから今後 6 か月間の製品需要の予測を生成します。"
  • 機械学習:
    • "データの準備と特徴エンジニアリングを実行して、このデータセットをモデル トレーニング用に準備します。"
    • "変更頻度を予測するために、 @customer_data データセットで分類モデルをトレーニングします。 精度と AUC メトリックを使用してモデルを評価します。"
    • "予測エラーを改善するために、 @housing_prices データセットを使用して回帰モデルに対してハイパーパラメーター調整を実行します。"
    • " @sales_leads データセットでクラスタリング モデルを構築し、顧客セグメントを識別し、各クラスターの特性の概要を提供します。"
  • ノートブックの編成:
    • "このノートブックの結果を要約する新しいセルを作成します。"
    • "このノートブックに関連する名前を付けます。"

探索的データ分析

データ サイエンス エージェントを使用して、データセットに対して探索的データ分析を実行します。 たとえば、エージェントを使用して、 samples.bakehouse.sales_transactions データセットを分析する新しいノートブックを作成してみてください。

空のノートブック タブで、[アシスタント] パネルを開き、エージェントモードを選択し、次のプロンプトを入力してください: 「データセットを説明し、samples.bakehouseから引用します」。 列統計を理解し、値の分布を視覚化できるように、いくつかの EDA を実行したいと思います。 データ サイエンティストのように考えてください。

データ サイエンス エージェントは、EDA 用のノートブックを作成します。

エージェントはプロンプトに答える計画を作成し、明確な質問をする場合があります。 承認により、データを探索するコードと、そのプロセスと結果を説明するテキストを含む新しいノートブック セルが生成されます。