Personalizer のデータとプライバシー
重要
2023 年 9 月 20 日以降は、新しい Personalizer リソースを作成できなくなります。 Personalizer サービスは、2026 年 10 月 1 日に廃止されます。
この記事では、Azure AI Personalizer が機能するために使用するデータ、そのデータの処理方法、およびそのデータを制御する方法について説明します。 Personalizer とは何か、そしてPersonalizer のしくみについて基本的な知識があることを前提としています。 特定の用語については、「用語」を参照してください。
Personalizer はどのようなデータを処理しますか?
Personalizer は、次のようなデータを処理します。
- コンテキスト特徴とアクション特徴: アプリケーションは、ユーザーと、パーソナル化する製品またはコンテンツに関する情報を集計された形式で送信します。 このデータは、コンテキストとアクションの引数の各 Rank API 呼び出しで Personalizer に送信されます。 API に送信する内容と、その集計方法を決定します。 データは属性または特徴として表されます。 ユーザーに関する情報 (デバイスや環境など) は、コンテキスト特徴として提供します。 電話番号やメールアドレス、ユーザー ID などのユーザーに固有の特徴は送信しないでください。 アクション特徴には、映画のジャンルや製品価格など、コンテンツや製品に関する情報が含まれます。 詳細については、アクションとコンテキストの特徴に関する記事を参照してください。
- 報酬情報: 報酬スコア (0 から 1 の数値) は、個人用設定の選択に起因するユーザー操作がどの程度ビジネス目標に結び付いているかをランク付けしたものです。 たとえば、おすすめの記事がクリックされた場合、イベントは "1" の報酬を受け取ることができます。 詳細については、報酬に関する記事を参照してください。
Personalizer で通常どのような情報を使用するかの詳細については、「特徴はアクションとコンテキストに関する情報です」を参照してください。
[!ヒント] アプリケーションで Personalizer の Rank API を呼び出すときに、どの特徴を使用するか、それをどのように集計するか、どこから情報を取得するかを決定します。 また、報酬スコアの作成方法も決定します。
Personalizer はどのようにしてデータを処理しますか?
次の図は、データの処理方法を示しています。
Personalizer は次のようにデータを処理します。
アプリケーションが個人用設定イベントの Rank API を呼び出すたびに、Personalizer がデータを受信します。 データが、コンテキストとアクションの引数を介して送信されます。
Personalizer は、コンテキストとアクションの情報、その内部 AI モデル、およびサービス構成を使用して、使用するアクションの ID のランク応答を返します。 コンテキストとアクションの内容は、Rank API で使用または生成された EventID を使用して、一時的なキャッシュに 48 時間まで格納されます。
その後、アプリケーションは 1 つ以上の報酬スコアを使用して Reward API を呼び出します。 この情報は、一時的なキャッシュにも格納され、アクションとコンテキストの情報と照合されます。
イベントのランクと報酬の情報が関連付けられたら、一時的なキャッシュから削除され、より永続的なストレージに配置されます。 データ保持設定で指定された日数までは永続的なストレージに残り、その後、情報は削除されます。 データ保持設定で日数を指定しない場合、Personalizer Azure Resource が削除される、または UI や API を使用してデータをクリアするまで、このデータは保存されます。 データ保持設定はいつでも変更できます。
Personalizer は、永続的なストレージにあるデータと、[学習の設定] の機械学習構成パラメーターを使用して、この Personalizer ループに固有の内部 Personalizer AI モデルを継続的にトレーニングします。
Personalizer は、オフライン評価を自動で、またはオンデマンドで作成します。 オフライン評価には、過去の期間中に Personalizer モデルによって取得された報酬のレポートが含まれます。 オフライン評価では、作成時にアクティブなモデル、作成に使用される学習設定、そしてその時間枠のイベントごとの平均報酬の履歴集計が埋め込まれます。 評価には、特徴の重要度も含まれます。これは、期間に見られた特徴の一覧と、モデルでの相対的な重要度です。
Personalizer ループの独立性
各 Personalizer ループは、次のように分離され、他のループとは独立しています。
- 外部データ拡張なし: 各 Personalizer ループは、Rank と Reward の API 呼び出しを介して提供されたデータのみを使用してモデルをトレーニングします。 Personalizer では、独自の Azure サブスクリプション、Microsoft、サード パーティーのソース、サブプロセッサの他の Personalizer ループのような、配信元の追加情報は使用されません。
- データ、モデル、情報の共有なし: Personalizer ループは、イベント、特徴、モデルに関する情報を、サブスクリプション、Microsoft、サード パーティー、またはサブプロセッサの他の Personalizer ループと共有しません。
データの保持方法と、使用できる顧客コントロール
Personalizer は、さまざまな方法でさまざまな種類のデータを保持し、それぞれに対して次のコントロールを提供します。
Personalizer のランクと報酬のデータ
Personalizer には、[データ保持] の構成で指定された日数のランクと報酬の呼び出しを介して送信されたアクションとコンテキストに関する特徴が格納されます。 このデータ保持を制御するには、次の操作を行います。
Personalizer リソース用 Azure portal の [構成]>[データ保持] で、または API を介して、ログ ストレージを保持する日数を指定します。 既定の [データ保持] の設定は 7 日間です。 Personalizer では、この日数より古いランクと報酬のすべてのデータが自動的に削除されます。
Azure portal の [モデルと学習設定]>[データのクリア]>[ログに記録された個人用設定と報酬のデータ] で、または API を介して、ログに記録された個人用設定と報酬のデータをクリアします。
Azure portal または Azure リソース管理 API を使用して、サブスクリプションから Personalizer ループを削除します。
Personalizer リソースの Rank と Reward の API 呼び出しから過去のデータに直接アクセスすることはできません。 保存されているすべてのデータを表示する場合は、ログ ミラーリングを構成して、自分が作成し、管理を担当している Azure Blob Storage リソースにこのデータのコピーを作成します。
Personalizer の一時的なキャッシュ
Personalizer は、ランクと報酬の呼び出しとは別のイベントに関する部分的なデータを一時的なキャッシュに格納します。 イベントは、イベントが発生した時刻から 48 時間後、一時的なキャッシュから自動的に消去されます。
一時的なデータを削除するには、次の操作を行います。
Azure portal の [モデルと学習設定]>[データのクリア] で、または API を介して、ログに記録された個人用設定と報酬のデータをクリアします。
Azure portal または Azure リソース管理 API を使用して、サブスクリプションから Personalizer ループを削除します。
Personalizer のモデルと学習設定
Personalizer ループは、Rank と Reward の API 呼び出しからのデータを使用してモデルをトレーニングします。これは、Azure portal の[モデルと学習設定] で指定されたハイパーパラメーターと構成によって駆動します。 モデルは揮発性です。 常に変化し、ほぼリアルタイムで追加のデータに関するトレーニングを受けています。 Personalizer は古いモデルを自動的に保存せず、最新のモデルで常に上書きしています。 詳細については、モデルと学習の設定を管理する方法に関する記事を参照してください。 モデルと学習の設定をクリアするには:
Azure portal の[モデルと学習設定]>[データのクリア]、または API を介してリセットします。
Azure portal または Azure リソース管理 API を使用して、サブスクリプションから Personalizer ループを削除します。
Personalizer 評価レポート
Personalizer は、レポートのオフライン評価で生成された情報も保持します。
オフライン評価レポートを削除するには、次の操作を行います。
Azure portal の下にある Personalizer ループに移動します。 [評価] に移動し、関連する評価を削除します。
Evaluations API を使用して評価を削除します。
Azure portal または Azure リソース管理 API を使用して、サブスクリプションから Personalizer ループを削除します。
ストレージに関する追加の考慮事項
- カスタマー マネージド キー: お客様は、独自のマネージド キーを使用して保存データを暗号化するようにサービスを構成できます。 この 2 番目の暗号化レイヤーは、Microsoft 独自の暗号化の上にあります。
- 地理的な場所: どのケースでも、Personalizer リソースが作成されたのと同じ地域で受信データ、モデル、および評価が処理され、格納されます。
こちらもご覧ください。
次のステップ
Microsoft のプライバシーとセキュリティに関するコミットメントの詳細については、Microsoft セキュリティ センターを参照してください。