この記事では、信頼できる AI エージェントを構築およびデプロイするためのリソースの概要について説明します。 これには、エージェントライフサイクルのすべての段階で制御とチェックポイントを使用したエンドツーエンドのセキュリティ、可観測性、ガバナンスが含まれます。 Microsoft が推奨する基本的な開発ステップは、Microsoft の責任ある AI 基準に根ざしており、この基準で規定されたポリシー要件に Microsoft 自身のエンジニアリング チームも従っています。 Standard のコンテンツの多くはパターンに従い、潜在的なコンテンツ リスクの検出、保護、管理をチームに依頼します。
Microsoft のアプローチは、AI の原則に根ざしたガバナンス フレームワークによって導かれ、製品要件を確立し、"北の星" として機能します。生成型 AI のビジネス ユース ケースを特定するときは、まず AI システムの潜在的なリスクを検出して評価し、重要な焦点領域を特定します。
これらのリスクを特定した後に、それが AI システム内にどれだけ広がっているかを体系的な測定を通じて評価します。このことは、注意が必要な領域に優先度を付けるのに役立ちます。 その後、これらのリスクに対してモデルとエージェント レベルで適切な保護を適用します。
最後に、生産環境におけるリスクを管理するための戦略を検討し、デプロイメントと運用の準備、継続的なガバナンスを支援する監視の設定などを含め、アプリケーションの稼働後にコンプライアンスを確保し、新しいリスクを明らかにします。
Microsoft の RAI プラクティスに合わせて、これらの推奨事項は次の 3 つの段階に分かれています。
- デプロイの前後にエージェントの品質、安全性、セキュリティのリスクを検出します。 たとえば、エージェントを敵対的なプロンプトでテストして、脱獄の潜在的な脆弱性を特定します。
- セキュリティ リスク、望ましくない出力、安全でないアクションから、モデル出力レベルとエージェント ランタイム レベルの両方で保護します。 コンテンツ フィルターとガードレールを使用して、ユーザーに到達する前に有害な出力をブロックします。
- トレースおよび監視ツールとコンプライアンス統合を通じてエージェントを管理します。 エージェントの動作を追跡し、運用環境の異常を検出するように継続的な監視を設定します。
セキュリティ アラートを表示して対応する
Defender for Cloud のセキュリティ アラートと推奨事項を表示して、[ リスクとアラート ] セクションでセキュリティ体制を改善できます。 セキュリティ アラートは、AI ワークロードで脅威が特定されたときに Defender for Foundry Tools プランによって生成される通知です。 これらのアラートに対処するには、Azure portalまたは Defender ポータルでアクションを実行できます。
セキュリティ アラートを表示するには:
- Microsoft Foundry ポータルにサインインします。
- あなたのプロジェクトに移動します。
- 左側のナビゲーションで、[ リスク + アラート] を選択します。
- アクティブなアラートと推奨事項を確認します。
- アラートを選択すると、詳細と修復手順が表示されます。
- セキュリティ アラートの詳細については、「Alerts for AI workloads (Preview)を参照してください。
- セキュリティに関する推奨事項の詳細については、「Review セキュリティに関する推奨事項を参照してください。