次の方法で共有


Azure OpenAI サービスのデータ、プライバシー、セキュリティ

Von Bedeutung

英語以外の翻訳は便宜上のみ提供されています。 バインドのバージョンについては、このドキュメントの EN-US バージョンを参照してください。

この記事では、Azure OpenAI サービスに提供されたデータがどのように処理、使用、格納されるかについて詳しく説明します。 Azure OpenAI は、サービスを提供し、該当する製品条件に違反する使用を監視するために、データを格納および処理します。 また、Azure OpenAI サービスによるデータ処理を管理する Microsoft 製品とサービスのデータ保護補遺も参照してください。 Azure OpenAI は Azure サービスです。該当する Azure コンプライアンス オファリングの 詳細を確認 してください。

Von Bedeutung

プロンプト (入力) と入力候補 (出力)、埋め込み、トレーニング データ:

  • 他のお客様にはご利用できません。
  • OpenAI では利用できません。
  • は OpenAI モデルの改善には使用されません。
  • は、Azure OpenAI Service 基盤モデルのトレーニング、再トレーニング、または改善には使用されません。
  • は、お客様の許可または指示なしに、Microsoft または第三者の製品またはサービスを改善するために使用されません。
  • 微調整された Azure OpenAI モデルは、自分専用で使用できます。

Azure OpenAI サービスは、Microsoft が Azure サービスとして運営しています。Microsoft は、Microsoft の Azure 環境で OpenAI モデルをホストしており、サービスは OpenAI によって運営されるサービス (ChatGPT、OpenAI API など) と対話しません。

Azure OpenAI サービスではどのようなデータが処理されますか?

Azure OpenAI は、次のようなデータを処理します。

  • プロンプトと生成されたコンテンツ。 プロンプトはユーザーによって送信され、完了操作、チャット完了操作、画像生成操作、および埋め込み操作を通じてサービスによってコンテンツが生成されます。
  • アップロードされたデータ。 Files API またはベクター ストアを使用して、特定のサービス機能 ( 微調整アシスタント APIバッチ処理など) で使用する独自のデータを提供できます。
  • ステートフル エンティティのデータAssistants API のスレッド機能や保存された入力候補など、Azure OpenAI サービスの特定のオプション機能を使用すると、サービスは、機能の構成方法に従って、メッセージ履歴やその他のコンテンツを保持するデータ ストアを作成します。
  • プロンプトに含まれる、またはプロンプトを介して含まれる拡張データ。 ステートフル エンティティに関連付けられているデータを使用すると、サービスは構成されたデータ ストアから関連するデータを取得し、プロンプトを拡張して、データを基盤とする世代を生成します。 プロンプトは、URL など、プロンプト自体に含まれるソースから取得されたデータで拡張することもできます。
  • トレーニングと検証データOpenAI モデルを微調整する目的で、プロンプトと入力候補のペアで構成される独自のトレーニング データを提供できます。

Azure OpenAI サービスはデータをどのように処理しますか?

データの処理方法を次の図に示します。 この図では、いくつかの種類の処理について説明します。

  1. Azure OpenAI サービスが、推論を介してプロンプトを処理してコンテンツを生成する方法 (指定されたデータ ソースからの追加データが、データ、アシスタント、またはバッチ処理で Azure OpenAI を使用してプロンプトに追加される場合を含む)。
  2. アシスタント機能がメッセージ、スレッド、および実行に関連してデータを格納する方法。
  3. Batch 機能でアップロードされたデータを処理する方法。
  4. Azure OpenAI サービスで、アップロードしたデータを使用して微調整された (カスタム) モデルを作成する方法。
  5. Azure OpenAI Service と Microsoft の担当者が、有害なコンテンツや、行動規範またはその他の適用可能な製品条件に違反する方法でサービスの使用を示唆するパターンについて、プロンプトと入力候補 (テキストと画像) を分析する方法。

サービスのデータ フロー図。

上の図に示すように、管理対象のお客様は不正使用監視の変更を申請することができます。

推論を通じて補完、画像、または埋め込みを生成する

リソースにデプロイされたモデル (基本または微調整済み) は、入力プロンプトを処理し、テキスト、画像、または埋め込みを使用して応答を生成します。 モデルに対するお客様の操作は、TLS1.2 以降のトランスポート暗号化、コンピューティング セキュリティ境界、テキストのトークン化、割り当てられた GPU メモリへの排他的アクセスなど、技術的な手段を使用して論理的に分離され、セキュリティで保護されています。 プロンプトと入力候補は、有害なコンテンツ タイプについてリアルタイムで評価され、構成されたしきい値に基づいてコンテンツ生成がフィルター処理されます。 詳細については、 Azure OpenAI Service のコンテンツ フィルター処理に関するページを参照してください。

プロンプトと応答は、(グローバル展開の種類を使用している場合を除き) 顧客が指定した 地域 内で処理されますが、運用上の目的 (パフォーマンスと容量管理を含む) のために地域内のリージョン間で処理される場合があります。 グローバル 展開の種類を使用する場合の処理の場所については、以下を参照してください。

モデルはステートレスです。プロンプトや世代はモデルに格納されません。 さらに、プロンプトと生成物は、基本モデルのトレーニング、再トレーニング、または改善には使用されません。

"グローバル" デプロイと "データ ゾーン" デプロイの種類の処理の場所を理解する

Azure OpenAI Service には、標準のデプロイに加えて、"グローバル" と "DataZone" というラベルの付いたデプロイ オプションが用意されています。 "グローバル" というラベルが付いた展開の種類の場合、プロンプトと応答は、関連する Azure OpenAI モデルが展開されている任意の地域で処理される可能性があります (リージョン別のモデルの利用可用性の詳細を確認してください)。 "DataZone" というラベルが付いたデプロイの種類の場合、プロンプトと応答は、Microsoft が定義している、指定されたデータ ゾーン内の任意の地域で処理される可能性があります。 米国内にある Azure OpenAI リソース内に DataZone デプロイを作成した場合、プロンプトと応答は米国内の任意の場所で処理される可能性があります。 欧州連合加盟国内にある Azure OpenAI リソース内に DataZone デプロイを作成した場合、プロンプトと応答は、その加盟国またはその他の欧州連合加盟国内で処理される可能性があります。 グローバルと DataZone の両方のデプロイの種類で、アップロードされたデータなど、すべての格納データは、お客様が指定した地域に保存されます。 お客様が Azure OpenAI Service でグローバル展開タイプまたは DataZone 展開タイプを使用する場合、処理の場所のみが影響を受けます。Azure のデータ処理とコンプライアンスのコミットメントは引き続き適用されます。

プロンプトを拡張して、生成された結果をあなたのデータに基づかせる

Azure OpenAI の "データに関する" 機能を使用すると、データ ソースを接続して、データを用いて生成された結果を裏付けることができます。 データは、指定したデータ ソースと場所に保存されたままです。Azure OpenAI サービスでは、重複するデータ ストアは作成されません。 ユーザー プロンプトを受信すると、サービスは接続されたデータ ソースから関連するデータを取得し、プロンプトを拡張します。 モデルは、この拡張プロンプトを処理し、生成されたコンテンツが上記のように返されます。 On Your Data 機能を安全に使用する方法について説明します。

Azure OpenAI サービス機能のデータ ストレージ

一部の Azure OpenAI Service 機能では、サービスにデータが格納されます。 このデータは、Files API またはベクター ストアを使用して顧客によってアップロードされるか、Assistants API のスレッド機能や保存された入力候補などの特定のステートフル エンティティに関連して自動的に保存されます。 Azure OpenAI サービス機能用の格納データ:

  • Azure OpenAI リソースと同じ 地域 内で、顧客の Azure テナント内の Azure OpenAI リソースに保存されます。
  • Microsoft の AES-256 暗号化を使用して保存時に常に暗号化されます。既定では、カスタマー マネージド キーを使用するオプションがあります (特定のプレビュー機能ではカスタマー マネージド キーがサポートされない場合があります)。
  • お客様がいつでも削除できます。

プレビュー段階の Azure OpenAI 機能では、上記の条件がすべてサポートされていない場合があります。

保存されたデータは、次のサービス機能と共に使用できます。

  • カスタマイズされた (微調整された) モデルを作成する。 詳細については、 微調整のしくみをご覧ください。 微調整されたモデルは、微調整されたモデルの作成に使用されたデータを持つお客様のみが利用でき、保存時に暗号化され (推論のためにデプロイされていない場合)、いつでも顧客が削除できます。 微調整のためにアップロードされたトレーニング データは、Microsoft またはサード パーティの基本モデルのトレーニング、再トレーニング、または改善には使用されません。
  • バッチ処理バッチ処理のしくみについて詳しくは、こちらをご覧ください。 バッチ処理はグローバル展開の種類です。保存時に格納されたデータは、処理容量が使用可能になるまで、指定された Azure 地域に残ります。処理は、関連する Azure OpenAI モデルがデプロイされている任意の地域で発生する可能性があります ( モデルのリージョンの可用性の詳細を参照)。
  • Assistants API (プレビュー)Assistants API のしくみの詳細について説明します。 スレッド、ストア メッセージ履歴、その他のコンテンツなど、アシスタントの一部の機能。
  • 保存済みの完了項目 (プレビュー) 保存された入力候補は、顧客がデプロイした Azure OpenAI モデル (GPT-4o など) の入力と出力のペアをチャット入力候補 API 経由で格納し、 Azure AI Foundry ポータルにペアを表示します。 これにより、お客様は実稼働データを使用してデータセットを構築できます。これにより、モデルの評価または微調整に使用できます (該当する製品条項で許可されています)。

不正使用や有害なコンテンツ生成の防止

Azure OpenAI サービスの有害な使用のリスクを軽減するために、Azure OpenAI サービスには、コンテンツ のフィルター処理と不正使用の監視機能の両方が含まれています。 コンテンツ のフィルター処理の詳細については、 Azure OpenAI サービスのコンテンツ フィルター処理に関するページを参照してください。 不正使用の監視の詳細については、 不正使用の監視に関するページを参照してください。

コンテンツ のフィルター処理は、前述およびここで説明したように、サービスがコンテンツの生成を求めるプロンプトを処理する場合に同期的に行 われます。 プロンプトや生成されたコンテンツはコンテンツ分類子モデルに格納されず、プロンプトと出力は、同意なしに分類子モデルをトレーニング、再トレーニング、または改善するために使用されません。

微調整されたモデルの安全性評価では、 Azure のリスクと安全性のメトリックを使用して、有害な可能性のある応答について微調整されたモデルを評価します。 サービスによりログに記録されるのは、結果として得られた評価 (展開の可否) のみです。

Azure OpenAI の不正使用監視システムは、行動規範やその他の適用可能な製品条件に違反する可能性のあるサービスの使用法を示す、繰り返されるコンテンツや動作を検出して軽減するように設計されています。 ここで説明するように、システムはアルゴリズムとヒューリスティックを使用して、潜在的な不正使用のインジケーターを検出します。 これらのインジケーターが検出されると、顧客のプロンプトと完了のサンプルがレビュー用に選択される場合があります。 レビューは既定で LLM によって行われ、必要に応じて人間のレビュー担当者による追加のレビューが行われます。 AI と人間のレビューに関する詳細情報は、 Azure OpenAI サービスの不正使用の監視で入手できます。

AI レビューでは、顧客のプロンプトと入力候補はシステムによって保存されず、LLM やその他のシステムのトレーニングに使用されません。 ヒューマン レビューでは、プロンプトと入力候補が格納されるデータ ストアは、顧客リソースによって論理的に分離されます (各要求には、顧客の Azure OpenAI リソースのリソース ID が含まれます)。 Azure OpenAI サービスを利用できる各地域に個別のデータ ストアがあり、顧客のプロンプトと生成されたコンテンツは、顧客の Azure OpenAI サービス リソースがデプロイされている Azure 地域の Azure OpenAI サービス境界内に格納されます。 悪用の可能性を評価する人間のレビュー担当者は、そのデータに既に不正使用監視システムのフラグが設定されている場合にのみ、プロンプトと完了データにアクセスできます。 人間のレビュー担当者は、要求 ID、Secure Access Workstations (SAW)、Just-In-Time (JIT) 要求承認を使用してポイントごとのクエリ経由でデータにアクセスする承認された Microsoft 従業員です。 欧州経済地域にデプロイされた Azure OpenAI サービスの場合、承認された Microsoft 従業員は欧州経済地域に配置されます。

お客様が変更された不正使用の監視を承認されている場合 ( 詳細については、Azure OpenAI サービスの不正使用の監視を参照してください)、承認された Azure サブスクリプションに関連付けられているプロンプトと完了は Microsoft に保存されず、前述のヒューマン レビュー プロセスは不可能であり、実行されません。 ただし、提供または生成された時点でプロンプトと完了をレビューする LLM を利用して、該当する場合は、AI レビューを引き続き実行できます。

プレビュー段階の Azure OpenAI モデルを含む Azure プレビュー機能では、不正使用の監視など、さまざまなプライバシー プラクティスが採用されている場合があります。 プレビューには、 Microsoft Azure プレビューの追加使用条件に関する補足条件が適用される場合があります。

お客様は、不正使用監視用のデータ ストレージがオフかどうかを確認するにはどうすればよいですか?

不正使用の監視をオフにすることが承認されると、承認された Azure サブスクリプションで不正使用の監視用のデータ ストレージがオフになっていることを確認するには、次の 2 つの方法があります。

  • Azure portal を使用する、または
  • Azure CLI (または任意の管理 API)。

"ContentLogging" 属性の値 "false" は、不正使用の監視用のデータ ストレージがオフになっている場合にのみ表示されます。 それ以外の場合、このプロパティは Azure portal または Azure CLI の出力には表示されません。

[前提条件]

  1. Azure へのサインイン
  2. Azure OpenAI Service リソースをホストする Azure サブスクリプションを選択します。
  3. Azure OpenAI サービス リソースの [概要 ] ページに移動します。
  1. リソースの [概要] ページに移動する

  2. 次の図に示すように、右上隅にある JSON ビュー のリンクをクリックします。

    Azure portal のログ状態 json ビュー。

機能の一覧に "ContentLogging" という値が表示され、不正使用の監視のログ記録がオフの場合は FALSE に設定されます。

{ 
    "name":"ContentLogging",
    "value":"false"
}

Microsoft のプライバシーとセキュリティのコミットメントの詳細については、 Microsoft セキュリティ センターを参照してください。

変更ログ

日付 変遷
2024 年 12 月 17 日 新しい保存済み入力候補機能に関連するデータ処理とストレージに関する情報を追加しました。プレビュー段階の Azure OpenAI 機能では、すべてのデータ ストレージ条件がサポートされない可能性があることを明確にする言語が追加されました。バッチ処理の "プレビュー" 指定が削除されました
2024 年 11 月 18 日 新しい "データ ゾーン" デプロイの種類のデータ処理の場所に関する情報を追加しました。不正使用の防止と有害なコンテンツの生成の一環として、プロンプトと完了の新しい AI レビューに関する情報を追加しました
2024 年 9 月 4 日 Assistants API (プレビュー)、Batch (プレビュー)、グローバル デプロイなどの新機能のデータ処理に関する情報 (およびそれに応じて既存のテキストを変更) を追加しました。 Azure データ所在地の原則に従って、データ処理の場所に関連する改訂された言語。微調整されたモデルの安全性評価のためのデータ処理に関する情報を追加しました。プロンプトと完了の使用に関連するコミットメントを明確にしました。明確さを向上させるためのマイナー リビジョン
2023 年 6 月 23 日 新しい Azure のオン・ユア・データ機能におけるデータ処理に関する情報を追加しました。Azure OpenAI サービスの不正使用監視で利用可能になった不正使用監視に関する情報を削除しました。 概要に関するメモを追加しました。 コンテンツと図を更新し、わかりやすくするために合理化しました。 変更ログを追加しました

こちらも参照ください