Windows での責任ある生成 AI アプリケーションと機能の開発

2025-05-19

このドキュメントでは、生成 AI を使用して Windows でアプリケーションと機能を作成するときに使用する、推奨される責任ある開発プラクティスの概要について説明します。

Windows AI Foundry のデバイス上の生成 AI モデルは、有害なコンテンツのデバイス上の分類エンジンや既定のブロックリストなど、ローカルコンテンツの安全性機能を適用するのに役立ちます。 Microsoft では、Windows 上のローカルモデルを使用して、安全で信頼できる AI エクスペリエンスを構築するためのサポート開発者に優先順位を付けます。

Windows での生成 AI アプリと機能の責任ある開発に関するガイドライン

Microsoft のすべてのチームは、中心となる原則と実践に従って、Windows も含め、AI を責任を持って構築して出荷します。責任ある開発に対する Microsoft のアプローチの詳細については、 Microsoft の責任ある AI 透明性レポートを参照してください。 Windows は、米国国立標準技術研究所 (NIST) AI リスク管理フレームワークに沿った RAI 開発の基本的な柱であるガバナンス、マッピング、測定、管理に従います。

ガバナンス - ポリシー、プラクティス、およびプロセス

標準が、ガバナンスとコンプライアンスプロセスの基盤です。 Microsoft は、責任ある AI のガイドラインを作成していただくための出発点として使用できる 6 つの原則を含む、当社独自の責任ある AI の標準を開発しました。 AI の原則は、開発ライフサイクル全体に組み込み、また、プライバシー、セキュリティ、責任ある AI 全般の法令を遵守するためのプロセスとワークフローにも組み込むことをお勧めします。これは、AI Fairness Checklist や Guidelines for Human-AI Interaction (Microsoft Research ) などのツールを使用した各 AI 機能の早期評価から、責任ある AI スコアカードなどのツールを使用した AI ベンチマーク、テストとプロセスの監視とレビュー、AI の機能と制限事項、ユーザーの開示と制御に関する公開ドキュメントまで多岐にわたり、同意、データ収集および処理情報など-- 適用されるプライバシー法、規制要件、およびポリシーに従います。

マッピング - リスクの特定

リスクを特定するための推奨プラクティスは次のとおりです。

エンドツーエンドのテスト

エンドツーエンドのテストでは、AI システム全体が最初から最後まで評価され、意図したとおりに動作し、確立された標準に準拠していることを確認します。この包括的なアプローチには次のものが含まれる場合があります。

Red Teaming

レッドチーミングという用語はこれまで、セキュリティの脆弱性をテストするための体系的な敵対的攻撃を意味していました。最近では、この用語の使用範囲が従来のサイバーセキュリティの枠を超え、AI システムのプローブ、テスト、攻撃の多くの種類を説明するためによく使用されるようになっています。

大規模言語モデル (LLM) と小規模言語モデル (SLM) の両方において、無害な使用と敵対的な使用の両方で、ヘイトスピーチ、扇動、暴力の賛美、性的コンテンツなど、多くの形を取る場合がある潜在的に有害な出力を生成する可能性があります。徹底したレッドチームによるセキュリティテストを行うことで、システムに対してストレステストを実施し、コンテンツ戦略を最適化して、システムが悪影響を与える可能性を低減することができます。

すべての AI システムは、生成 AI を採用するリスクの高いシステムと非生成 AI を使用する低リスクシステムの両方について、機能と目的に応じてレッドチームテストを受ける必要があります。

公式なレッドチーミング: 大規模言語モデル (LLM) を使用する生成AIを採用するすべての高リスクシステムに対して、独立したレッドチーミングを完了する必要があります。正式なレッドチーミングには、組織外の専門家を募集してレッドチーミング活動に参加してもらうことが含まれます。
内部レッドチーミング: 少なくとも、リスクの低いすべての非生成 AI システムに対して内部レッドチーミングを計画します。これは組織内の人物が行うことができます。

赤いチーミングの詳細と、システムの赤いチーミングのニーズを評価する方法を確認する: Microsoft AI Red Team

モデルの評価

エンドツーエンドのテストの一環として、モデル自体を評価することが重要です。

モデルカード: HuggingFace などの一般公開されているモデルの場合は、各モデルのモデルカードを便利な参照として確認して、モデルがユースケースに適しているかどうかを理解できます。モデルカードに関する詳細はこちら。
手動テスト: スクリプトを使用せずにステップバイステップで人間がテストを実行することは、モデルの評価をサポートする重要なコンポーネントです。
- 少数の優先度が高い問題の進行状況を測定します。特定の危害を軽減する場合、自動測定に移行する前に、危害が観察されなくなるまで、小さなデータセットに対して手動で進行状況を確認し続けることが多くの場合最も生産性が高くなります。
- 自動測定に移行するまでメトリックを定義してレポートすることは、単独で使用するのに十分な信頼性があります。
- スポットチェックを定期的に行い、自動測定の品質を測定します。
自動テスト: 自動実行テストも、モデルの評価をサポートする重要なコンポーネントです。
- より包括的な結果を得るために、カバレッジを上げて大規模に測定します。
- システム、使用状況、軽減策の進化に伴う回帰を監視するために継続的に測定します。
モデルの選択: 目的に適したモデルを選択し、その機能、制限事項、および潜在的な安全上の課題を自分自身が理解できるようにします。モデルをテストするときは、使用に適した結果が生成されることを確認します。作業を開始するために、Microsoft (および Microsoft 以外やオープンソース) のモデルソースの参照先には次のものがあります。

測定 - リスクと軽減策を評価する

推奨されるプラクティスには次のようなものがあります。

Content Moderator の割り当て: Content Moderator は、テキスト、画像、および動画コンテンツをチェックして、コンテンツ内に不快感を与える、危険な、またはその他望ましくない可能性のある素材が含まれていないかを確認します。詳細情報: Content Moderator の概要 (Microsoft Learn トレーニング)。
- コンテンツの安全フィルターを使用する: この多クラス分類モデルのアンサンブルは、さまざまな重大度レベル (低、中、高) で有害なコンテンツ (暴力、ヘイト、性的、自傷) の 4 つのカテゴリを検出します。詳細情報: Azure OpenAI Service でコンテンツフィルターを構成する方法。
- メタプロンプトの適用: メタプロンプトとは、システムメッセージの一種で、プロンプトの最初に含まれており、ユースケースに関連するコンテキスト、指示、その他の情報でモデルを事前処理するために使用されます。これらの手順は、モデルの動作をガイドするために使用されます。詳細情報: メタプロンプト/システムメッセージエンジニアリングを使用した効果的なセキュリティガードレールの作成。
- ブロックリストの利用: プロンプトでの特定の用語またはパターンの使用がブロックされます。詳細情報: Azure OpenAI でブロックリストを使用する。
- モデルの来歴について理解する: 来歴とは、モデルの所有権の履歴、つまり、関係者、対象物、場所、時期に関する情報で、理解することが非常に重要です。誰がモデル内のデータを収集したか? データは誰に属するか? どのような種類のデータが使用されているか? どこでデータが収集されたか? いつデータが収集されたか? モデルデータがどこから来たのかを知ることは、その品質、信頼性を評価し、非倫理的、不公正、偏った、不正確なデータの使用を回避するのに役立ちます。
- 標準パイプラインの使用: パーツを段階的にプルするのではなく、1 つのコンテンツモデレーションパイプラインを使用します。詳細情報: Azure Machine Learning パイプラインとは
ApplyUImitigations: これらは、AI ベースの機能と制限についてユーザーに重要な明確さを提供します。ユーザーを支援し、機能に関する透明性を提供するために、次のことができます。
- 受け入れる前に出力を編集するようユーザーに促す
- AI 出力が不正確である可能性を強調する
- 対話における AI の役割を開示する
- リファレンスと出典を明示する
- 必要に応じて、入力と出力の長さを制限する
- 入力または出力の構造を提供する - プロンプトは標準形式に従う必要があります
- 論争の的になるプロンプトに対して事前に決定された応答を準備します。
顧客フィードバックループの実装: フィードバックループに積極的に参加するようユーザーに推奨します。
- ユーザーエクスペリエンスの一部としてコンテキストで利用できるシンプルなフィードバックメカニズムを使用して、アプリ/製品内で直接フィードバックを求めます。
- 顧客が機能の問題、懸念事項、および危害の可能性に関する早期の会話に使用するチャネルにソーシャルリスニング手法を適用します。

管理 - AI リスクを軽減する

AI リスクを軽減するための推奨事項には次のようなものがあります。

不正使用の監視: この手法では、倫理規定またはその他の該当する製品条件に違反する可能性のある方法でサービスが使用されたことを示す繰り返しのコンテンツや行動のインスタンスを検出して影響を軽減します。詳細情報: 不正使用の監視。
段階的な配信: AI ソリューションを時間をかけてロールアウトし、受領したレポートや懸念事項を処理します。
インシデント対応計画: 優先度の高いリスクごとに、何が起こるか、インシデントへの対応にかかる時間、対応プロセスがどのようになるかを評価します。
機能またはシステムをオフにする機能: 機能を一時停止して損害の拡大を防ぐ必要があるインシデントが発生しようとしている、または既に発生した場合に機能をオフにできるようにします。
ユーザーアクセス制御/ブロック: システムを不正使用しているユーザーをブロックする方法を開発します。
ユーザーフィードバック: メカニズムを利用して、ユーザー側から問題を検出します。
- 一般的なワークフローのコンテキストで利用できるシンプルなフィードバックメカニズムを使用して、製品内で直接フィードバックを求めます。
- 顧客が機能の問題、懸念事項、および危害の可能性に関する早期の会話に使用するチャネルにソーシャルリスニング手法を適用します。
利用統計情報の責任あるデプロイ: ユーザーの満足度またはシステムを意図したとおりに使用する能力を示すシグナルを特定、収集、監視し、適用されるプライバシーに関する法律、ポリシー、コミットメントに従っていることを確認します。利用統計情報を使用してギャップを特定し、システムを改善します。

ツールとリソース

Windows AI Foundry: モデルの選択、微調整、CPU、GPU、NPU、クラウド全体のデプロイから AI 開発者のライフサイクルをサポートする、統合された信頼性とセキュリティで保護されたプラットフォーム。
責任ある AI ツールボックス: 責任ある AI とは、安全で信頼できる倫理的な方法で AI システムを評価、開発、デプロイするためのアプローチです。責任ある AI ツールボックスは、モデルと、データを探索し評価するためのユーザーインターフェイスとライブラリのコレクションを提供する AI システムの理解を深める一連のツールです。これらのインターフェイスとライブラリにより、AI システムの開発者と利害関係者は、AI をより責任を持って開発および監視し、より優れたデータドリブンのアクションを実行できます。
責任ある AI ダッシュボードでのモデルのデバッグ: このダッシュボードは、データを使用して問題を特定、診断、軽減し、情報に基づいたアクションを実行することに役立ちます。このカスタマイズ可能な環境は、モデルまたはデータを包括的に分析することから、関心のあるコーホートに関する詳細な調査や比較の実施、個々のインスタンスについてのモデル予測の説明と摂動、ビジネス上の意思決定やアクションについてのユーザーへの情報提供まで、さまざまな方向で実行できます。責任ある AI 意思決定テストを受けてください。
「責任ある AI とは?」の Azure Machine Learning の概要を確認する
「Bing における Copilot: 責任ある AI へのアプローチ」を参照してください。
2024 年 2 月 13 日の「不正な AI 生成コンテンツへの対処: 包括的なアプローチ」に関する Brad Smith の記事を参照してください。
Microsoft セキュリティブログを参照してください。
Azure OpenAI モデルの責任ある AI プラクティスの概要
Azure OpenAI サービスでコンテンツフィルター (プレビュー) の使用方法
Azure OpenAI Service でブロックリストを使用する方法
大規模言語モデル (LLM) とそのアプリケーションに対するレッドチーミングの計画
Azure OpenAI Service 不正使用の監視
AI/ML システムと依存関係の脅威のモデル化
AI/ML はセキュリティの中心です。開発ライフサイクルのバグバー
機械学習の障害モード
責任ある AI 軽減策を管理および発案するためのツール - Microsoft Research
AI プレイブックを使用した自然言語エラーの計画
ML のソフトウェアエンジニアリング: ケーススタディ
現実の世界におけるセキュリティと機械学習
AI への過度の依存: 文献レビュー
エラー分析とエラー分析ツールキットを使用した責任ある AI の構築 (youtube.com)
InterpretML と InterpretML を使用してモデルを説明する方法の詳細 (youtube.com)
機械学習でのブラックボックスとグラスボックスの説明 (youtube.com)