Microsoft Agent Framework AI エージェントについて

完了

AI エージェントは、生成型 AI を使用してデータを解釈し、意思決定を行い、ユーザーや他のアプリケーションに代わってタスクを実行するプログラムです。 AI エージェントは、大規模な言語モデルに依存してタスクを実行します。 従来のプログラムとは異なり、AI エージェントは自律的に機能し、複雑なワークフローを処理し、継続的な人間の監視を必要とせずにプロセスを自動化できます。

AI エージェントは、Microsoft Agent Framework など、さまざまなツールとプラットフォームを使用して開発できます。 Microsoft Agent Framework は、開発者が最新の AI モデルをアプリケーションに簡単に統合できるオープンソース SDK です。 このフレームワークは、自然言語処理を使用してタスクを完了し、他のエージェントと共同作業できる機能エージェントを作成するための包括的な基盤を提供します。

Microsoft Agent Framework のコア コンポーネント

Microsoft Agent Framework には、個別に使用したり組み合わせたりできるさまざまなコンポーネントが用意されています。

  • チャット クライアント - 共通のインターフェイスで異なるプロバイダーから AI サービスに接続するための抽象化を提供します。 サポートされているプロバイダーには、azure OpenAI、OpenAI、Anthropic などが含まれます。 BaseChatClient 抽象化を使用します。

  • 関数ツール - エージェント機能を拡張するカスタム関数のコンテナー。 エージェントは、関数を自動的に呼び出して、外部 API やサービスと統合できます。

  • 組み込みツール - Python 実行用のコード インタープリター、ドキュメント分析用のファイル検索、インターネット アクセス用の Web Search などの事前構築済みの機能。

  • 会話管理 - ロール (USER、ASSISTANT、SYSTEM、TOOL) と AgentThread を持つ構造化されたメッセージ システムで、対話を通じて永続的な会話コンテキストを実現します。

  • ワークフロー オーケストレーション - 複雑なマルチエージェント コラボレーションのシーケンシャル ワークフロー、同時実行、グループ チャット、ハンドオフ パターンをサポートします。

Microsoft Agent Framework は、エージェントの作成を効率化するのに役立ち、複数のエージェントが人間の入力を含めながら会話で共同作業を行うことができます。 このフレームワークでは、Microsoft Foundry、Azure OpenAI、OpenAI、Microsoft Copilot Studio、Anthropic エージェントなど、複数のプロバイダーのさまざまな種類のエージェントがサポートされています。

Microsoft Foundry エージェントとは

Microsoft Foundry Agents は、Microsoft Foundry Agent Service を使用してエンタープライズ レベルの機能を提供します。 これらのエージェントは、複雑なエンタープライズ シナリオ向けの高度な機能を提供します。 主な利点を以下に示します。

  • エンタープライズ レベルの機能 – コード インタープリター、関数ツールの統合、モデル コンテキスト プロトコル (MCP) のサポートなど、高度な AI 機能を備えた Azure 環境向けに構築されています。

  • 自動ツール呼び出し – エージェントは、ツールを自動的に呼び出して実行し、Azure AI Search、Azure Functions、およびその他の Azure サービスとシームレスに統合できます。

  • スレッドと会話の管理 – セッション間で永続的な会話状態を管理するための組み込みのメカニズムを提供し、スムーズなマルチエージェント対話を実現します。

  • セキュリティで保護されたエンタープライズ統合 – Azure CLI 認証、RBAC、およびカスタマイズ可能なストレージ オプションを使用して、セキュリティで保護され、準拠している AI エージェントの開発を可能にします。

Microsoft Foundry Agents を使用すると、エンタープライズ Azure 機能と Microsoft Agent Framework の機能を組み合わせたフル パワーが得られます。 これらの機能は、ビジネス アプリケーション間で効率的にスケーリングできる堅牢な AI 駆動型ワークフローを作成するのに役立ちます。

エージェント フレームワークのコア概念

  • BaseAgent - 一貫性のあるメソッドを持つすべてのエージェントの基礎であり、すべてのエージェントの種類にわたって統一されたインターフェイスを提供します。

  • エージェント スレッド - AgentThread クラスを使用して、永続的な会話コンテキストを管理し、セッション間で会話履歴を格納します。

  • チャット メッセージ - 円滑な通信と統合を可能にするロールベースのメッセージング (USER、ASSISTANT、SYSTEM、TOOL) を使用してエージェント通信用に整理された構造。

  • ワークフロー オーケストレーション - シーケンシャル ワークフローをサポートし、複数のエージェントを並列で実行し、エージェント間の会話をグループ化し、特殊なエージェント間で制御を転送します。

  • マルチモーダル サポート - エージェントは、視覚機能やタイプ セーフな応答生成など、テキスト、画像、構造化された出力を操作できます。

  • 関数ツール - Python 関数からスキーマを自動生成するカスタム関数を含めることで、エージェントにカスタム機能を追加できます。

  • 認証方法 - Azure CLI 資格情報、API キー、Microsoft ビジネス認証用 MSAL、ロールベースのアクセス制御など、複数の認証方法がサポートされています。

このフレームワークは、自律的なマルチエージェント AI 動作をサポートすると同時に、必要に応じてエージェント、ツール、ワークフローを組み合わせることができる柔軟なアーキテクチャを維持します。 この設計により、コードを変更せずに OpenAI、Azure OpenAI、Anthropic、およびその他のプロバイダーを切り替えることができます。これにより、単純なチャットボットから複雑なビジネス ソリューションまで、AI システムを簡単に構築できます。