この記事では、Azure Kubernetes Service (AKS) のエージェント CLI に関する最も一般的な質問に対する回答を示します。
AKS のエージェント CLI とは何ですか?
AKS 用エージェント CLI は、AKS ユーザーがクラスターの問題を効率的にトラブルシューティングできるように設計された、AI を利用したコマンド ライン ツールです。 テレメトリシグナル (ログ、メトリック、イベント) を分析し、インフラストラクチャとワークロード間でそれらを関連付け、実用的な分析情報を提供します。 エージェントは、自然言語クエリを入力として受け取り、診断の概要、根本原因の分析、および修復の提案を返します。 エージェント CLI には AI モデルが含まれていないため、エージェントが機能するために独自の大規模言語モデル (LLM) API キーを提供する必要があります。
AKS のエージェント CLI は何を行うことができますか?
AKS のエージェント CLI は、自然言語クエリを解釈し、診断コマンドを実行し、実用的な分析情報を返すローカル アシスタントとして機能します。 これは、Kubernetes イベント、ログ、Inspektor Gadget、Azure、AKS API などの AKS ネイティブ ツールとテレメトリ ソースとシームレスに統合されます。 各ツールセットは、 az aks agentでネイティブにツールセットとして有効になります。
エージェントは、Azure CLI からユーザーのアクセス許可を継承するため、Azure ロールベースのアクセス制御 (RBAC) と ID 制御を尊重します。 既定では、読み取り専用モードで動作します。 AI プロバイダー (OpenAI、Azure OpenAI、Anthropic など) とモデルを構成できます。 ツールセットの出力を出力するようにエージェントを構成することもできます。
az aks agentの出力は次のとおりです。
- ユーザー クエリに対する AI 合成の概要応答。
- 根本原因の分析と証拠のサポート。
- AKS のベスト プラクティスに合わせた修復候補。
- 診断トレースとツールの出力。
AKS のエージェント CLI の用途は何ですか?
AKS のエージェント CLI には、次の用途があります。
- 問題を効率的に検出、診断、解決するのに役立つ、AKS クラスターとの人間のループ内対話。
- Kubernetes API および AKS API との読み取り専用のインタラクション。 リソース情報を取得し、AKS クラスター リソースの正常性を理解し、一般的な Kubernetes と AKS のベスト プラクティスに従うことができます。
AKS のエージェント CLI は、AKS の対話の範囲を超えて汎用コーディングまたは AI エージェントとして使用されるわけではありません。 インターネットにアクセスして一般的な質問に回答することはできません。
AKS 用のエージェント CLI は、AKS 固有のシナリオ向けに最適化されています。 kubectl、Azure CLI、Inspektor Gadget、Azure Monitor などのツールと統合されますが、間違いを犯す可能性があります。 エージェントは、微妙な信号を見逃したり、ノイズの多いテレメトリを誤って解釈したり、人間の検証を必要とする軽減策を提案したりする場合があります。 たとえば、誤って構成されたアップストリーム DNS サーバーが根本原因である場合、DNS 障害をネットワークポリシーの問題として誤って解釈される可能性があります。 このシナリオは、テレメトリが不完全な場合やアクセス許可が制限されている場合に特に発生する可能性があります。
自動化の偏りを回避するには、最終的な判定ではなく、エージェントの出力を役立つ開始点として扱う必要があります。 原因の表面化と調査の指針に優れていますが、人間の監視は不可欠です。 複雑な環境や危険な環境では、人間によるレビューが必要です。
AI モデルについては、GPT4o や GPTo3 などの Azure OpenAI デプロイ モデルを使用することをお勧めします。 OpenAI API プラットフォームから直接使用することもできます。 Anthropic や Gemini など、Open API 仕様でサポートされている任意の LLM モデル プロバイダーを使用できます。
AKS のエージェント CLI はどのように評価されましたか? パフォーマンスの測定にはどのようなメトリックが使用されますか?
AKS 用エージェント CLI は、診断機能が正確で関連性があり、意味のあるものになるように設計された内部テストとプログラムによる評価の組み合わせによって評価されています。
プログラムによる評価では、基礎、UPIA、XPIA 脱獄、有害なコンテンツ、会話の品質 (一貫性や流暢さなど) などの標準的な責任ある AI メトリックを測定しました。
これらのテストは、推論、ツール統合、およびプロンプト実行のギャップを特定するのに役立ちます。 成功のための主要なメトリックは、エージェントの診断の精度とその推奨事項の関連性です。 エージェントは根本原因を正しく特定し、アクション可能なコンテキスト対応の軽減策を提案しましたか?
さまざまなケースでエージェントの動作を厳密にテストするために、内部のバグ バッシュとレッド チームを実施しています。 ノードの正常性の低下、DNS エラー、アップグレードの中断、ポッドのスケジュールの問題を確認します。
Agentic-AI の相互作用の動的な性質を認識しており、プレビューの一環としてフィードバックをお待ちしております。 フィードバックは、 aksagentcli@service.microsoft.comで直接 Microsoft と共有できます。 GitHub の問題を開くこともできます。
AKS のエージェント CLI の制限事項は何ですか? システムを使用するときに、これらの制限の影響を最小限に抑えるにはどうすればよいですか?
AKS のエージェント CLI は強力であり、AKS クラスターの問題を診断して解決するために構築されています。 効果的かつ責任ある使用を確保するために注意する必要がある重要な制限がいくつかあります。
- エージェントがデータにアクセスして分析する機能は、アクセス許可とテレメトリの可用性に直接依存します。 十分なアクセス権がない場合、またはログ、メトリック、イベントなどのテレメトリ ソースが不足しているか不完全な場合、エージェントは正確または完全な診断を生成できない可能性があります。
- 時系列メトリックなど、大規模なデータセットを処理する場合、システムにはトークンの制限が適用されます。 これらの制限により、複雑なトラブルシューティング シナリオで分析の深さまたは幅が制限される可能性があります。
- 現在の MVP 状態では、エージェント CLI では、マネージド Azure エクスペリエンスのサポートが制限されています。 Azure Monitor アラートの統合など、特定のワークフローは完全にはサポートされていない場合があります。
これらの制限の影響を最小限に抑えるために、いくつかのプロアクティブな手順を実行できます。
- エージェントがより豊富なテレメトリにアクセスし、より包括的な診断を実行できるように、必要な診断ツール (Azure Monitor など) が適切に構成されていることを確認します。
- エージェント CLI の機能を、Azure Model Context Protocol (MCP) または AKS MCP サーバーと共に使用して拡張します。 詳細については、「 AKS MCP サーバーと AKS のエージェント CLI の統合」を参照してください。
- 最新世代の推論または汎用モデル (GPT4o や GPTo3 など) を使用して、可能な限り最良の結果を得ます。 AKS 用のエージェント CLI には、AI モデルは含まれていません。
AKS のエージェント CLI を効果的かつ責任ある方法で使用できる運用上の要因と設定は何ですか?
AKS のエージェント CLI を効果的かつ責任を持って使用するには、いくつかの運用設定が重要な役割を果たします。 エージェントは、既定で読み取り専用モードで動作するように設計されているため、クラスターに変更を加えずに安全な診断が保証されます。 デバッグ ポッドのデプロイや修復手順の実行など、書き込み操作が必要な場合は、ユーザー制御を維持し、意図しない影響を最小限に抑えるために、明示的なユーザー承認が必要です。
エージェントはローカルでマシン上で実行され、ユーザー独自のAIプロバイダーをサポートします。 このため、独自の LLM API キーを構成できます。 このセットアップにより、組織の承認済みの AI プロバイダーとエンドポイントを確実に利用できるようになります。 すべてのデータ処理は、データのプライバシーを維持し、エンタープライズ セキュリティ標準に準拠するためにローカルで行われます。
エージェントには構成可能な詳細設定も用意されています。この設定を使用すると、ニーズに応じて簡潔な概要と詳細な診断出力を切り替えることができます。 この柔軟性は、エージェントの推論とツールの実行に対する迅速な分析情報と完全な透明性の両方の収集をサポートします。
Azure ID と RBAC との統合により、エージェントは、表示する権限を持つリソースにのみアクセスできるようになります。 この制限により、セットアップが簡略化され、セキュリティで保護されたアクセス境界が適用されます。 これらの設定を組み合わせることで、セキュリティで保護され、プライバシーを意識し、ユーザーが制御する環境が作成され、AI の支援を受けて AKS クラスターのトラブルシューティングを行うことができます。
AKS の agentic CLI に関するフィードバックを提供したり、ヘルプを表示したりするにはどうすればよいですか?
いくつかのチャネルを通じて、AKS の agentic CLI に関するフィードバックを提供したり、ヘルプを得ることができます。
- エージェント CLI リポジトリの GitHub issue とプル要求。
- プレビュー フェーズ中の内部チャネル。
- Azure サポート チケットを通じての対応、または AKS 製品チームとの直接関与。
プラグインとは何ですか。また、AKS 用エージェント CLI ではそれらをどのように使用しますか?
AKS 用エージェント CLI のコンテキストでは、プラグインは、外部ツール、データ ソース、ドメイン固有のロジックをトラブルシューティング ワークフローに統合することで、エージェントの診断機能を強化するモジュール式拡張機能です。 これらのプラグインを使用すると、エージェントは静的なコマンド実行を超え、シナリオに対応した動的な推論を組み込むことができます。 エージェントは、次の種類のプラグインをサポートしています。
- ツールセットの統合: Prometheus、Datadog、Azure Monitor などの監視プラットフォームに接続するツールセットを使用して、エージェントの機能を拡張できます。 これらのツールセットは、エージェントがクエリを実行してリアルタイムで分析できるメトリック、ログ、アラートを公開します。 たとえば、Prometheus ツールセットを使用すると、エージェントは失敗したポッドの CPU とメモリ使用量の傾向をフェッチできます。 Azure Monitor 統合では、ノードの正常性の問題に関連する最近のアラートまたはアクティビティ ログが表示される可能性があります。
-
MCP サーバー: モデル コンテキスト プロトコル サーバーは、診断ツールとプロンプト テンプレートを AI エージェントに公開する仲介役として機能します。 AKS の CLI エージェントでは、MCP サーバーは Kubernetes と Azure リソースへの構造化されたアクセスを提供します。 エージェントは、
kubectl describeやaz aks showなどのコマンドを実行したり、デバッグ ポッドをデプロイしたりできます。 これらのサーバーは、ツールの呼び出し方法とデータの返し方を標準化するのにも役立ちます。これにより、環境全体でエージェントの機能を簡単にスケーリングできます。
AKS 用エージェント CLI でプラグインに提供できるデータは何ですか? プラグインにはどのようなアクセス許可がありますか?
すべてのプラグインはプルのみです。 このツールを使用すると、AKS のエージェント CLI は、さまざまなソースからデータをプルしたり、LLM プロンプトの一部として埋め込むカスタム Runbook を使用して診断機能を向上させることができます。 外部データフローは、AKS のエージェント CLI に接続する AI モデルのみです。
プラグインで有効になっている AKS 用エージェント CLI を使用すると、どのような問題が発生する可能性がありますか?
プラグインで AKS のエージェント CLI を使用すると、トラブルシューティング エクスペリエンスの信頼性や精度に影響を与える可能性のあるいくつかの種類の問題が発生する可能性があります。
一般的な課題の 1 つは、誤って構成されたプロンプトが原因でツールを正しく呼び出さないためです。 プラグインは、多くの場合、AI の推論とツールの選択をガイドするためにプロンプト テンプレートに依存します。 プロンプトロジックや構造の小さなエラーでも、間違ったツールがトリガーされたり、正しいツールが間違ったコンテキストで使用されたりする可能性があります。 結果は、誤解を招く診断や不完全な調査である可能性があります。
もう 1 つのリスクは、特にプラグインが不完全、古い、またはあいまいなデータを返す場合に、製造された出力または不適切な出力の生成です。 このような場合、AI は「もっともらしく聞こえるが誤った説明でギャップを埋めよう」と試みる可能性があります。 テレメトリが見つからない場合や、サポートされていないクラスター構成でプラグインが使用されている場合にも、エラーが発生する可能性があります。 たとえば、プライベート クラスターでは、特定の API またはツールへのアクセスが不足している可能性があります。
これらのリスクを軽減するために、AKS のエージェント CLI にはいくつかのセーフガードが含まれています。 詳細なログ記録とエラー報告は、呼び出されたツール、返されたデータ、AI による解釈方法を正確に追跡するのに役立ちます。 レポートを使用すると、問題を簡単に見つけて修正できます。 また、特定のプラグインが問題を引き起こしているか、信頼性の低いデータを返していると思われる場合は、手動でオーバーライドしたり無効にしたりすることもできます。
最後に、プラグインの開発とメンテナンスには、明確なドキュメントとコミュニティ サポートが不可欠です。 例、バージョン互換性に関するメモ、既知の制限を含むよく文書化されたプラグインは、それらを責任を持って使用する方法を理解し、必要に応じて改善に貢献するのに役立ちます。 最先端の AI プロバイダーから最新世代の LLM/推論モデルを使用すると、情報が正しくないリスクも軽減されます。
関連するコンテンツ
- AKS のエージェント CLI の概要については、AKS のエージェント CLI についてを参照してください。
- AKS のエージェント CLI を使用する場合の一般的な問題を解決するには、 AKS のエージェント CLI のトラブルシューティング ガイドを参照してください。