Microsoft Fabric のデータ エージェントは、生成 AI を使用して独自の会話型 Q&A システムを構築できる新しい Microsoft Fabric 機能です。 Fabric データ エージェントにより、組織内のすべてのユーザーがデータ分析情報にアクセスし、アクションを実行できるようになります。 Fabric データ エージェントを使用すると、簡単な英語の質問を使って、組織の Fabric OneLake に保存されているデータについて会話し、関連する回答を受け取ることができます。 これにより、AI に関する技術的な専門知識を持たない人や、データ構造を深く理解していないユーザーでも、正確でコンテキストに富んだ回答を受け取ることができます。
また、組織固有の指示、サンプル、ガイダンスを追加して、Fabric データ エージェントを微調整することもできます。 このアプローチにより、応答が組織のニーズと目標と一致し、すべてのユーザーがより効果的にデータを操作できるようになります。 Fabric データ エージェントは、分析情報へのアクセスに対する障壁を下げ、コラボレーションを容易にすることでデータドリブン型の意思決定の文化を促進し、組織がデータからより多くの価値を引き出せるようにします。
重要
この機能は プレビュー段階です。
[前提条件]
- 有料の F2 以上のファブリック容量、または Microsoft Fabric が有効になっている容量あたりの Power BI Premium (P1 以上) 容量
- ファブリック データ エージェントのテナント設定 が有効になっています。
- AI のクロス geo 処理 が有効になっています。
- AI の地域間ストレージ が可能です。
- データを含む少なくとも 1 つのデータ: ウェアハウス、レイクハウス、1 つ以上の Power BI セマンティック モデル、KQL データベース、またはオントロジ。
- Power BI セマンティック モデルのデータ ソースでは、XMLA エンドポイントテナントスイッチを介した Power BI セマンティック モデルが有効になります。
Fabric データ エージェントのしくみ
Fabric データ エージェントでは、大規模な言語モデル (LLM) を使用して、ユーザーが自然にデータを操作できるようにします。 Fabric データ エージェントは、Azure OpenAI Assistant API を適用し、エージェントのように動作します。 ユーザーの質問を処理し、最も関連性の高いデータ ソース (Lakehouse、Warehouse、Power BI データセット、KQL データベース、オントロジ) を決定し、クエリを生成、検証、実行するための適切なツールを呼び出します。 その後、ユーザーはプレーンな言語で質問し、構造化された人間が判読できる回答を受け取ることができ、複雑なクエリを記述する必要がなくなり、正確で安全なデータ アクセスを確保できます。
このしくみについて詳しく説明します。
質問の解析と検証: Fabric データ エージェントは、基になるエージェントとして Azure OpenAI Assistant API を適用してユーザーの質問を処理します。 このアプローチにより、質問がセキュリティ プロトコル、責任ある AI (RAI) ポリシー、およびユーザーのアクセス許可に準拠していることが保証されます。 Fabric データ エージェントは、読み取り専用アクセスを厳密に適用し、すべてのデータ ソースに対する読み取り専用のデータ接続を維持します。
データ ソースの識別: Fabric データ エージェントは、ユーザーの資格情報を使用してデータ ソースのスキーマにアクセスします。 この方法により、システムは、ユーザーが表示する権限を持つデータ構造情報を取得します。 次に、リレーショナル データベース (Lakehouse と Warehouse)、Power BI データセット (セマンティック モデル)、KQL データベース、オントロジなど、使用可能なすべてのデータ ソースに対するユーザーの質問を評価します。 また、ユーザーが指定したデータ エージェントの指示を参照して、最も関連性の高いデータ ソースを特定する場合もあります。
ツールの呼び出しとクエリの生成: 正しいデータ ソースまたはソースが特定されると、Fabric データ エージェントは明確さと構造について質問を言い換え、対応するツールを呼び出して構造化クエリを生成します。
- リレーショナル データベース (Lakehouse/Warehouse) の SQL (NL2SQL) に対する自然言語。
- Power BI データセット (セマンティック モデル) の DAX (NL2DAX) に対する自然言語。
- KQL データベース向けの自然言語からKQL (NL2KQL) への変換。
選択したツールは、指定されたスキーマ、メタデータ、コンテキストに基づいてクエリを生成し、これを Fabric データ エージェントの基になるエージェントが渡します。
クエリの検証: ツールは検証を実行して、クエリの形式が正しく、独自のセキュリティ プロトコルと RAI ポリシーに準拠していることを確認します。
クエリの実行と応答: 検証されると、Fabric データ エージェントは選択したデータ ソースに対してクエリを実行します。 結果は人間が判読できる応答に書式設定されます。これには、テーブル、概要、主要な分析情報などの構造化データが含まれる場合があります。
このアプローチにより、ユーザーは自然言語を使用してデータを操作できるようになります。一方、Fabric データ エージェントは、クエリの生成、検証、実行に伴う複雑さを処理します。ユーザーが SQL、DAX、または KQL 自体を記述する必要はありません。
Fabric データ エージェントの構成
Fabric データ エージェントの構成は、Power BI レポートを作成するのと似ています。まず、ニーズを満たすように設計と調整を行い、同僚がデータを操作できるように公開して共有します。 Fabric データ エージェントの設定には、次の作業が含まれます。
データ ソースの選択: Fabric データ エージェントは、レイクハウス、ウェアハウス、KQL データベース、Power BI セマンティック モデル、オントロジなど、任意の組み合わせで最大 5 つのデータ ソースをサポートします。 たとえば、構成済みの Fabric データ エージェントに、5 つの Power BI セマンティック モデルが含まれる場合があります。 これには、2 つの Power BI セマンティック モデル、1 つの lakehouse、1 つの KQL データベースの組み合わせが含まれる場合があります。 使用可能なオプションは多数あります。
関連テーブルの選択: データ ソースを選択した後、それらを一度に 1 つずつ追加し、Fabric データ エージェントが使用する各ソースの特定のテーブルを定義します。 この手順により、Fabric データ エージェントは、関連するデータのみに焦点を当てて正確な結果を取得できます。
コンテキストの追加: Fabric データ エージェントの精度を向上させるには、Fabric データ エージェントの指示とクエリ例を使用して、より多くのコンテキストを提供します。 このコンテキストは、Fabric データ エージェントの基になるエージェントとして、Azure OpenAI Assistant API がユーザーの質問を処理する際に、より多くの情報に基づいて意思決定を行い、回答に最適なデータ ソースはどれかを決定するのに役立ちます。
データ エージェントの手順: 特定の種類の質問に答える最適なデータ ソースを決定する際に、Fabric データ エージェントの基になるエージェントをガイドする手順を追加します。 組織の用語や特定の要件を明確にするカスタムルールや定義を提供することもできます。 これらの手順では、エージェントがデータ ソースを選択してクエリを実行する方法に影響を与える、より多くのコンテキストまたは基本設定を提供できます。
- 財務メトリックに関する直接の質問を Power BI セマンティック モデルに送信します。
- 生データ探索に関連するクエリを lakehouse に割り当てます。
- ログ分析を必要とする質問を KQL データベースにルーティングします。
クエリの例: サンプルの質問とクエリのペアを追加して、Fabric データ エージェントが一般的なクエリにどのように応答するかを示します。 これらの例は、エージェントのガイドとして機能し、同様の質問を解釈し、正確な回答を生成する方法を理解するのに役立ちます。
注
Power BI セマンティック モデルのデータ ソースでは、サンプル クエリと質問のペアの追加は現在サポートされていません。
明確な AI 命令と関連するクエリ例を組み合わせることにより、Fabric データ エージェントを組織のデータ ニーズに合わせて調整し、より正確でコンテキストに対応した応答を実現できます。
Fabric データ エージェントと Copilot の違い
Fabric データ エージェントと Fabric 副操縦者の両方が、データを処理および推論するために生成 AI を使用しますが、機能とユース ケースには主な違いがあります。
構成の柔軟性: Fabric データ エージェントを高度に構成できます。 特定のシナリオに合わせて動作を調整するためのカスタム命令と例を提供できます。 一方、ファブリックの副操縦士は事前構成されており、このレベルのカスタマイズは提供されません。
スコープとユース ケース: Fabric の副操縦は、ノートブック コードやウェアハウス クエリの生成など、Microsoft Fabric 内のタスクを支援します。 一方、Fabric データ エージェントはスタンドアロンの成果物です。 幅広いユース ケースに Fabric データ エージェントの汎用性を広げるため、Microsoft Copilot Studio、Azure AI Foundry、Microsoft Teams、その他の Fabric 以外のツールなどの外部システムと統合できます。
Fabric データ エージェントの評価
製品チームは、Fabric データ エージェントの応答の品質と安全性を厳密に評価しました。
ベンチマーク テスト: 製品チームは、さまざまなパブリック データセットとプライベート データセットにわたって Fabric データ エージェントをテストし、高品質で正確な応答を保証しました。
強化された損害軽減策: 製品チームは、Fabric データ エージェントの出力が選択されたデータ ソースのコンテキストに集中し続け、無関係または誤解を招く回答のリスクを軽減するためのセーフガードを実装しました。
制限事項
Fabric データ エージェントは現在パブリック プレビュー段階であり、制限があります。 今後の更新で、Fabric データ エージェントは改善される見込みです。
- Fabric データ エージェントでは、SQL、DAX、KQL の "読み取り" クエリのみが生成されます。 データを作成、更新、または削除する SQL、DAX、または KQL クエリは生成されません。
- Fabric データ エージェントは、.pdf、.docx、.txt ファイルなどの非構造化データをサポートしていません。 Fabric データ エージェントを使用して非構造化データ リソースにアクセスすることはできません。
- 現在、Fabric データ エージェントは英語以外の言語をサポートしていません。 最適なパフォーマンスを得るための質問、手順、クエリの例を英語で指定します。
- Fabric データ エージェントが使用する LLM を変更することはできません。
- Fabric データ エージェントの会話履歴は、常に保持されない場合があります。 バックエンド インフラストラクチャの変更、サービスの更新、モデルのアップグレードなど、特定のケースでは、過去の会話履歴がリセットまたは失われる可能性があります。
- データ ソースのワークスペースの容量がデータ エージェントのワークスペースの容量とは異なるリージョンにある場合、Fabric データ エージェントはクエリを実行できません。 データ エージェントのリソースがフランス中部にある場合、北ヨーロッパにリソースを持つレイクハウスは機能しません。