Microsoft Fabric のデータ エージェントは、生成 AI を使用して独自の会話型 Q&A システムを構築できる新しい Microsoft Fabric 機能です。 Fabric データ エージェントにより、組織内のすべてのユーザーがデータ分析情報にアクセスし、アクションを実行できるようになります。 Fabric データ エージェントを使用すると、簡単な英語の質問を使って、組織の Fabric OneLake に保存されているデータについて会話し、関連する回答を受け取ることができます。 これにより、AI に関する技術的な専門知識を持たない人や、データ構造を深く理解していないユーザーでも、正確でコンテキストに富んだ回答を受け取ることができます。
また、組織固有の指示、サンプル、ガイダンスを追加して、Fabric データ エージェントを微調整することもできます。 これにより、応答が組織のニーズと目標と一致し、すべてのユーザーがより効果的にデータを操作できるようになります。 Fabric データ エージェントは、分析情報へのアクセスに対する障壁を下げ、コラボレーションを容易にすることでデータドリブン型の意思決定の文化を促進し、組織がデータからより多くの価値を引き出せるようにします。
重要
この機能は プレビュー段階です。
[前提条件]
- F2以上の有料ファブリック容量リソース
- ファブリック データ エージェントのテナント設定 が有効になっています。
- Copilot テナント スイッチ が有効になっています。
- AI のクロス geo 処理 が有効になっています。
- AI の地域間ストレージ が可能です。
- データを含む、ウェアハウス、レイクハウス、1 つ以上の Power BI セマンティック モデル、または KQL データベースのうち少なくとも 1 つ。
- Power BI セマンティック モデルのデータ ソースでは、XMLA エンドポイントテナントスイッチを介した Power BI セマンティック モデルが有効になります。
Fabric データ エージェントのしくみ
Fabric データ エージェントは、大規模言語モデル (LLM) を使用して、ユーザーが自然にデータを操作できるようにします。 Fabric データ エージェントは、Azure OpenAI Assistant API を適用し、エージェントのように動作します。 ユーザーの質問を処理し、最も関連性の高いデータ ソース (Lakehouse、Warehouse、Power BI データセット、KQL データベース) を決定し、クエリを生成、検証、実行するための適切なツールを呼び出します。 その後、ユーザーはプレーンな言語で質問し、構造化された人間が判読できる回答を受け取ることができ、複雑なクエリを記述する必要がなくなり、正確で安全なデータ アクセスを確保できます。
このしくみについて詳しく説明します。
質問の解析と検証: Fabric データ エージェントは、基になるエージェントとして Azure OpenAI Assistant API を適用してユーザーの質問を処理します。 このアプローチにより、質問がセキュリティ プロトコル、責任ある AI (RAI) ポリシー、およびユーザーのアクセス許可に準拠していることが保証されます。 Fabric データ エージェントは、読み取り専用アクセスを厳密に適用し、すべてのデータ ソースに対する読み取り専用のデータ接続を維持します。
データ ソースの識別: Fabric データ エージェントは、ユーザーの資格情報を使用してデータ ソースのスキーマにアクセスします。 これにより、ユーザーが閲覧権限を持つデータ構造情報がシステムによって取得されます。 次に、リレーショナル データベース (Lakehouse と Warehouse)、Power BI データセット (セマンティック モデル)、KQL データベースなど、使用可能なすべてのデータ ソースに対してユーザーの質問を評価します。 また、ユーザーが指定したデータ エージェントの指示を参照して、最も関連性の高いデータ ソースを特定する場合もあります。
ツールの呼び出しとクエリの生成: 正しいデータ ソースまたはソースが特定されると、Fabric データ エージェントは明確さと構造について質問を言い換え、対応するツールを呼び出して構造化クエリを生成します。
- リレーショナル データベース (Lakehouse/Warehouse) の SQL (NL2SQL) に対する自然言語。
- Power BI データセット (セマンティック モデル) の DAX (NL2DAX) に対する自然言語。
- KQL データベース向けの自然言語からKQL (NL2KQL) への変換。
選択したツールは、指定されたスキーマ、メタデータ、コンテキストに基づいてクエリを生成し、これを Fabric データ エージェントの基になるエージェントが渡します。
クエリの検証: ツールは検証を実行して、クエリの形式が正しく、独自のセキュリティ プロトコルと RAI ポリシーに準拠していることを確認します。
クエリ実行と応答: 検証が完了すると、Fabric データ エージェントは選択したデータ ソースに対してクエリを実行します。 結果は人間が判読できる応答に書式設定されます。これには、テーブル、概要、主要な分析情報などの構造化データが含まれる場合があります。
このアプローチにより、ユーザーは自然言語を使用してデータを操作できるようになります。一方、Fabric データ エージェントは、クエリの生成、検証、実行に伴う複雑さを処理します。ユーザーが SQL、DAX、または KQL 自体を記述する必要はありません。
Fabric データ エージェントの構成
Fabric データ エージェントの構成は、Power BI レポートを作成するのと似ています。まず、ニーズを満たすように設計と調整を行い、同僚がデータを操作できるように公開して共有します。 Fabric データ エージェントの設定には、次の作業が含まれます。
データ ソースの選択: Fabric データ エージェントは、レイクハウス、ウェアハウス、KQL データベース、Power BI セマンティック モデルなど、任意の組み合わせで最大 5 つのデータ ソースをサポートします。 たとえば、構成済みの Fabric データ エージェントに、5 つの Power BI セマンティック モデルが含まれる場合があります。 これには、2 つの Power BI セマンティック モデル、1 つの lakehouse、1 つの KQL データベースの組み合わせが含まれる場合があります。 使用可能なオプションは多数あります。
関連テーブルの選択: データ ソースを選択したら、それらを一度に 1 つずつ追加し、Fabric データ エージェントが使用する各ソースの特定のテーブルを定義する必要があります。 この手順により、Fabric データ エージェントは、関連するデータのみに焦点を当てて正確な結果を取得できます。
コンテキストの追加: Fabric データ エージェントの精度を向上させるために、Fabric データ エージェントの手順とクエリ例を使用して、より多くのコンテキストを提供できます。 このコンテキストは、Fabric データ エージェントの基になるエージェントとして、Azure OpenAI Assistant API がユーザーの質問を処理する際に、より多くの情報に基づいて意思決定を行い、回答に最適なデータ ソースはどれかを決定するのに役立ちます。
データ エージェントの手順: 特定の種類の質問に答える最適なデータ ソースを決定する際に、Fabric データ エージェントの基になるエージェントをガイドする手順を追加できます。 組織の用語や特定の要件を明確にするカスタムルールや定義を提供することもできます。 これらの手順では、エージェントがデータ ソースを選択してクエリを実行する方法に影響を与える、より多くのコンテキストまたは基本設定を提供できます。
- 財務メトリックに関する直接の質問を Power BI セマンティック モデルに送信します。
- 生データ探索に関連するクエリを lakehouse に割り当てます。
- ログ分析を必要とする質問を KQL データベースにルーティングします。
クエリの例: サンプルの質問とクエリのペアを追加して、Fabric データ エージェントが一般的なクエリにどのように応答するかを示すことができます。 これらの例は、エージェントのガイドとして機能し、同様の質問を解釈し、正確な回答を生成する方法を理解するのに役立ちます。
注
Power BI セマンティック モデルのデータ ソースでは、サンプル クエリと質問のペアの追加は現在サポートされていません。
明確な AI 命令と関連するクエリ例を組み合わせることにより、Fabric データ エージェントを組織のデータ ニーズに合わせて調整し、より正確でコンテキストに対応した応答を実現できます。
Fabric データ エージェントと Copilot の違い
Fabric データ エージェントと Fabric Copilot は、どちらも生成 AI を使用してデータの処理と推論を行いますが、その機能とユース ケースには大きな違いがあります。
構成の柔軟性: ファブリック データ エージェントは高度に構成可能です。 特定のシナリオに合わせて動作を調整するためのカスタム命令と例を提供できます。 一方、ファブリックの副操縦士は事前に構成されており、このレベルのカスタマイズは提供されません。
スコープとユース ケース: Fabric の副操縦は、ノートブック コードやウェアハウス クエリの生成など、Microsoft Fabric 内のタスクを支援するように設計されています。 一方、Fabric データ エージェントはスタンドアロンの成果物です。 幅広いユース ケースに Fabric データ エージェントの汎用性を広げるため、Microsoft Copilot Studio、Azure AI Foundry、Microsoft Teams、その他の Fabric 以外のツールなどの外部システムと統合できます。
Fabric データ エージェントの評価
Fabric データ エージェントの応答の品質と安全性は、厳密な評価を通過しています。
ベンチマーク テスト: 製品チームは、さまざまなパブリック データセットとプライベート データセットにわたって Fabric データ エージェントをテストし、高品質で正確な応答を保証しました。
強化された損害軽減策: ファブリック データ エージェントの出力が選択されたデータ ソースのコンテキストに集中し続け、無関係または誤解を招く回答のリスクを軽減するために、より多くのセーフガードが実施されています。
制限事項
Fabric データ エージェントは現在パブリック プレビュー段階であり、制限があります。 今後の更新で、Fabric データ エージェントは改善される見込みです。
- Fabric データ エージェントは、事実、合計、ランク付け、またはフィルターを含む質問について構造化クエリ (SQL、DAX、または KQL) を生成することで、データを取得できます。 ただし、傾向を解釈したり、説明を提供したり、基になる原因を分析したりすることはできません。
- Fabric データ エージェントは、SQL、DAX、KQL の "読み取り" クエリのみを生成します。 データを作成、更新、または削除する SQL/DAX/KQL クエリは生成されません。
- Fabric データ エージェントは、提供されたデータにのみアクセスできます。 指定したデータ リソース構成のみが使用されます。
- Fabric データ エージェントには、Fabric データ エージェントと対話するユーザーに付与されたアクセス許可と一致するデータ アクセス許可があります。 これは、Fabric データ エージェントが他の場所 (Microsoft Copilot Studio、Azure AI Foundry、Microsoft Teams など) に公開されている場合に当てはまります。
- Fabric データ エージェントに 5 つを超えるデータ ソースを追加することはできません。
- Fabric データ エージェントを使用して非構造化データ リソースにアクセスすることはできません。 これらのリソースには、たとえば、.pdf、.docx、または .txt ファイルが含まれます。
- Fabric データ エージェントは、英語以外の質問または指示をブロックします。
- Fabric データ エージェントが使用する LLM を変更することはできません。
- 1,000 を超えるテーブルまたは 100 列を超えるテーブルがある場合、KQL データベースをデータ ソースとして追加することはできません。
- 合計 100 を超える列とメジャーが含まれている場合、Power BI セマンティック モデルをデータ ソースとして追加することはできません。
- Fabric データ エージェントは、全データ ソースで 25 個以下のテーブルが選択されているときに最適に動作します。
- 非規範的なデータ リソースの列とテーブル名は、生成された SQL/DAX/KQL クエリ品質に大きな悪影響を及ぼします。 わかりやすい名前を使用することをお勧めします。
- 列とテーブルが多すぎると、Fabric データ エージェントのパフォーマンスが低下する可能性があります。
- Fabric データ エージェントは現在、単純なクエリを処理するように設計されています。 多くの結合または高度なロジックを必要とする複雑なクエリでは、信頼性が低くなる傾向があります。
- Power BI セマンティック モデルをデータ ソースとして追加した場合、Fabric データ エージェントは、非表示のテーブル、列、メジャーを使用しません。
- 以前に、ウェアハウスをデータ ソースとして使用した Fabric データ エージェントを作成しており、そのウェアハウスがその Fabric データ エージェントをホストしないワークスペースに配置されている場合は、エラーが発生する可能性があります。 この問題を解決するには、既存のデータ ソースを削除し、もう一度追加します。
- Power BI セマンティック モデルを Fabric データ エージェントのデータ ソースとして追加するには、その Power BI セマンティック モデルの読み取り/書き込みのアクセス許可が必要です。 Power BI セマンティック モデルを使用する Fabric データ エージェントに対してクエリを実行する場合は、基になる Power BI セマンティック モデルに対する読み取り/書き込みのアクセス許可も必要です。
- Fabric データ エージェントは、正しくない回答を返す場合があります。 Fabric データ エージェントを同僚とともにテストして、質問の回答が予想通りに得られるかを確認する必要があります。 間違えていた場合は、より多くの例と指示を提供してください。
- 以前に Fabric データ エージェントを作成して公開し、その URL をプログラムで使用した場合、Fabric データ エージェントの新しいユーザー インターフェイス ページで Fabric データ エージェントを開くと、その URL は機能しなくなっています。 これを解決するには、Fabric データ エージェントを再び公開し、Assistants API に基づいて新しい URL を使用する必要があります。