パイプライン開発に Genie Code を使用する

Important

このページでは、Genie Code でエージェントモードを選択して使用できる AI データエージェントであるパイプライン開発用の Genie Code について説明します。 Lakeflow Spark 宣言パイプライン (SDP) と Lakeflow Pipelines エディター専用に設計されており、データの探索、パイプラインコードの生成と実行、エラーの修正をすべて 1 回のプロンプトから行います。

パイプライン開発のための Genie Code とは

エージェントモードの Genie Code は、SDP と Lakeflow Pipelines Editor でマルチステップデータエンジニアリングワークフロー全体を自動化できる自律的なパートナーです。

データエンジニアリングエージェントを使用します。

Genie Code チャットモードと比較して、エージェントモードでは、ソリューションの計画、関連する資産の取得、コードの実行、パイプライン出力を使用した結果の改善、エラーの自動修正などの機能が拡張されています。

エージェントモードの Genie Code では、パイプライン全体をゼロからエンドツーエンドで計画および生成したり、既存のパイプラインの作業を高速化したりできます。エージェントは、続行する前に、お客様と協力してプランを承認し、次の手順を確認します。 Genie Code では、承認を得て、ツールを使用して、テーブルの検索、SQL またはPythonソースファイルの編集、パイプラインの更新の実行、パイプラインデータセットの読み取りなどのタスクを実行できます。

Genie Code のアクセスとアクションは、ユーザーのアクセス許可によって管理されます。アクセス権を持つデータにのみアクセスし、アクセス許可を持つ操作を実行できます。

注

Genie Code でエージェントモードを有効にすると、Genie Code は Databricks で現在使用している機能に基づいて機能を調整します。たとえば、Lakeflow Pipelines エディターでは、Genie Code はパイプラインの編集タスクとデータエンジニアリングタスクに重点を置いています。ノートブックと SQL エディターでは、Genie Code はデータの探索と分析をサポートします。詳細については、「データサイエンスに Genie Code を使用する」を参照してください。

Requirements

データエンジニアリングに Genie Code を使用するには、ワークスペースに次のものが必要です。

アカウントとワークスペースの両方で有効になっているパートナーを利用した AI 機能。パートナーを利用した AI 機能を参照してください。
ワークスペースは、サポートされているリージョンに存在する必要があります。 Genie Code は、Geos を使用してデータ所在地を管理する指定サービスです。 Genie Code 機能の Geo 可用性を参照してください。