コンテキストとアクション

重要

2023 年 9 月 20 日から、新しい Personalizer リソースを作成することはできません。 Personalizer サービスは、2026 年 10 月 1 日に廃止されます。オープンソースの microsoft/learning-loop に移行することをお勧めします。

Personalizer は、特定のコンテキストでアプリケーションがユーザーに表示する内容を学習することで機能します。コンテキストとアクションは、Personalizer に渡す最も重要な 2 つの情報です。 コンテキストは、現在のユーザーまたはシステムの状態に関する情報を表し、アクションは選択肢となるオプションです。

コンテキスト

コンテキストの情報は各アプリケーションとユースケースに左右されますが、通常、次のような情報が含まれます。

ユーザーの人口統計情報とプロフィール情報。
ユーザーエージェントなど、HTTP ヘッダーから抽出された情報、または IP アドレスに基づく地理的逆参照など、HTTP 情報から誘導された情報。
曜日、週末または平日、午前または午後、休暇期または労働期など、現在の時間に関する情報。
場所、移動、バッテリレベルなど、モバイルアプリケーションから抽出された情報。
このユーザーが最も多く視聴している映画のジャンルなど、ユーザーの過去の行動の集計。
システムの状態に関する情報。

アプリケーションは、関連するデータベース、センサー、システムからコンテキストに関する情報を読み込む役目を担います。コンテキスト情報が変わらない場合、Rank API に送信する前に、この情報をキャッシュするロジックをアプリケーションに追加できます。

Actions

アクションはオプションの一覧を表します。

アクションに順位を付ける場合は、50 を超えるアクションを送信しないでください。毎回同じ 50 のアクションになることもあれば、変わることもあります。たとえば、eコマースアプリケーションに品物が 10,000 個の製品カタログを用意している場合、レコメンデーションまたはフィルターエンジンを使用し、顧客が気に入りそうな上位 40 品目を決定することができます。さらに、Personalizer を使用し、現在のコンテキストに対して生成されるリワードが最も大きい品目を見つけることもできます。

アクションの例

Rank API に送信するアクションは、パーソナライズしようとしている内容に依存します。

いくつかの例を示します。

目的	アクション
ニュース Web サイトで強調表示する記事をパーソナライズします。	各アクションは潜在的にニュース記事です。
Web サイトでの広告配置を最適化します。	各アクションはレイアウトか広告のレイアウトを作成するルールになります (たとえば、上、右、小さい画像、大きい画像)。
買い物 Web サイトにお勧めの品目を個人的にランク付けして表示します。	各アクションは特定の製品になります。
特定の写真に適用するフィルターなど、ユーザーインターフェイス要素を提案します。	各アクションは異なるフィルターになることがあります。
チャットボットの応答を選択し、ユーザーの意図を明確にするか、アクションを提案します。	各アクションは、応答を解釈する方法の選択肢です。
検索結果一覧の一番上に表示するものを選択します	各アクションは上位検索結果の 1 つです。

クライアントアプリケーションからアクションを読み込む

アクションのフィーチャーは通常、コンテンツ管理システム、カタログ、推奨システムを情報源とします。アプリケーションは、関連するデータベースやシステムからアクションに関する情報を読み込む役目を担います。アクションが変わらない場合、あるいは毎回読み込むことがパフォーマンスに不要な影響を与える場合、この情報をキャッシュするロジックをアプリケーションに追加できます。

ランク付けの対象からアクションを外す

ユーザーに見せたくないアクションが存在する場合があります。アクションに順位を付けないようにするための最善の方法は、そのアクションを除外アクションリストに追加するか、順位要求に渡さないようにすることです。

場合によっては、既定でイベントをトレーニングしないようにすることをお勧めします。つまり、特定の条件が満たされた場合にのみイベントをトレーニングするようにします。たとえば、Web ページのパーソナル化された部分が折りたたみの下にあるとします (ユーザーは、パーソナル化されたコンテンツを操作する前にスクロールする必要があります)。この場合に、ページ全体をレンダリングしても、ユーザーがスクロールしてパーソナル化されたコンテンツを操作できる状態にならないとイベントがトレーニングされないようにする必要があります。このような場合は、エンドユーザーが操作する機会がなかった既定の報酬 (およびトレーニング) イベントを割り当てないように、イベントのアクティブ化を延期する必要があります。

機能

コンテキストと選択できるアクションの両方について、フィーチャーを使用して説明します。フィーチャーは、報酬を最大化するための意思決定プロセスにおいて、重要と考えられるすべての情報を表します。各タイムスタンプで最適なアクションを選択する任務を負っていることを想像し、次のように自問することから始めることをお勧めします。「情報に基づいた意思決定を行うためにどのような情報が必要か。コンテキストと考えられる各アクションを記述するために使用できる情報は何か」。特徴は汎用的なものでも、アイテムに固有のものでもかまいません。

Personalizer では、アクションとコンテキストに対して送信できるフィーチャーを規定したり、制限したり、修正したりすることはありません。

時間の経過と共に、コンテキストやアクションに関するフィーチャーを追加したり、削除したりすることができます。 Personalizer では、利用可能な情報から学習が継続されます。
カテゴリの特徴の場合、使用可能な値を事前に定義する必要はありません。
数値の特徴の場合、範囲を事前に定義する必要はありません。
アンダースコア _ で始まるフィーチャー名は無視されます。
フィーチャーのリストが大きくなる (数百) 可能性がありますが、簡潔なフィーチャーセットから始めて、必要に応じて拡張することをお勧めします。
アクション フィーチャーは、context フィーチャーと相関関係がある場合もあれば、ない場合もあります。
使用可能ではない特徴は要求から除外する必要があります。特定のフィーチャーの値が特定の要求で使用できない場合は、この要求で対象のフィーチャーを省略してください。
null 値を持つフィーチャーは送信しないようにしてください。 null 値は、"null" という値を持つ文字列として処理されますが、これは望ましくありません。

時間の経過とともにフィーチャーが変化するのは、自然なことであり問題ありません。ただし、Personalizer の機械学習モデルは、認識したフィーチャーに基づいて適応するこを留意してください。すべての新しい特徴を含む要求を送信した場合、Personalizer のモデルは、過去のイベントを利用して現在のイベントに最適なアクションを選択できなくなります。 "安定した" フィーチャーセット (繰り返しフィーチャーを含む) を使用すると、Personalizer の機械学習アルゴリズムのパフォーマンスの向上に役立ちます。

コンテキストの特徴

一部のコンテキストフィーチャーは、一部の時間にしか使用できない場合があります。たとえば、ユーザーがオンライン食料品店の Web サイトにログインしている場合、コンテキストには購入履歴を記述するフィーチャーが含まれます。これらの特徴は、ゲストユーザーでは使用できません。
少なくとも 1 つのコンテキストフィーチャーが必要です。 Personalizer では、空のコンテキストはサポートされていません。
コンテキストフィーチャーがすべての要求で同じである場合、Personalizer はグローバルに最適なアクションを選択します。

アクションの特徴

すべてのアクションに同じフィーチャーを含める必要はありません。たとえば、オンライン食料品店のシナリオでは、電子レンジ対応のポップコーンには "調理時間" の特徴がありますが、きゅうりにはありません。
特定のアクション ID のフィーチャーは 1 日だけ利用できて、その後は利用不可能になることがあります。

例:

以下は、アクションフィーチャーの好例です。これらは各アプリケーションに大きく依存します。

アクションの特性を持つフィーチャー。たとえば、それは映画ですか? それともテレビシリーズですか?
過去にユーザーがこのアクションとどのようにやりとりした可能性があるかに関するフィーチャー。たとえば、この映画は人口統計 A または B の住民が一番多く見ています。再生回数は概して 1 回のみです。
ユーザーがアクションを見る方法という特性に関するフィーチャー。たとえば、サムネイルに表示されている映画のポスターには、顔、車、または景色が含まれていますか?

サポートされているフィーチャーの種類

Personalizer では、フィーチャーとして文字列、数値、ブールをサポートしています。多くの場合、いくつかの例外を除いて、アプリケーションでは主に文字列の特徴が使用されます。

Personalizer でフィーチャーの種類が機械学習に与える影響

文字列: 文字列型の場合、すべてのキーと値 (フィーチャー名、フィーチャー値) の組み合わせがワンホットフィーチャーとして扱われます (たとえば、category:"Produce" と category:"Meat" は、内部的には機械学習モデルの異なるフィーチャーとして表されます)。
数値: 数値がパーソナル化の結果に比例して影響する規模である場合にのみ、数値を使用してください。これはシナリオに大きく依存します。数値単位に基づき、意味が線形ではないフィーチャー (年齢、気温、身長など) は、カテゴリ文字列としてエンコードすることをお勧めします。たとえば、年齢は "Age":"0-5"、"Age":"6-10" などのようにエンコードできます。高さは、"Height": "<5'0"、"Height": "5'0-5'4"、"Height": "5'5-5'11"、"Height":"6'0-6-4"、"Height":">6'4" のようにバケット化できます。
ブーリアン
配列数値配列のみがサポートされます。

機能エンジニアリング

規模ではないフィーチャーには、カテゴリと文字列の型を使用します。
パーソナル化を進めるために十分なフィーチャーがあることを確認してください。コンテンツの対象を絞り込む必要性が上がるにつれて、必要とされるフィーチャーの数も増えます。
多様な "密度" のフィーチャーがあります。たくさんの項目が 2、3 のバケットにグループ化される場合、フィーチャーは密度が高くなります。たとえば、大量の動画を "長編" (5 分以上) と "短編" (5 分未満) に分類できます。これは非常に密度の高いフィーチャーです。一方で、同じくらい大量の項目に "タイトル" という属性を与えることができます。その属性に項目間で同じ値が与えられることはほとんどありません。これは密度が非常に低い、まばらなフィーチャーです。

高密度のフィーチャーを使用すると、Personalizer は項目間で学習を外挿することができます。ただし、フィーチャーが数個しかなく、それらの密度が高すぎる場合、Personalizer は、少ないバケットからしか選択できないコンテンツを正確にターゲットにしようとします。

フィーチャー設計と書式設定に関する一般的な問題

カーディナリティの高いフィーチャーを送信します。 多くのイベントで繰り返される可能性が低い、一意の値を持つフィーチャー。たとえば、ある個人を特定できる情報 (名前、電話番号、クレジットカード番号、IP アドレスなど) は、Personalizer で使用しないでください。
ユーザー ID の送信 ユーザー数が多い場合、この情報が Personalizer 学習に関連して平均報酬スコアを最大化する可能性は低くなります。ユーザー ID (個人を特定できる情報ではなくても) を送信することは、モデルにノイズが増える可能性が高いため、推奨されません。
数回以上発生することがめったにない一意の値を送信します。より詳細にフィーチャーをバケット化することをお勧めします。たとえば、"Context.TimeStamp.Day":"Monday" や "Context.TimeStamp.Hour":13 などのフィーチャーを持つことは、有用である場合があります。これは、それぞれ 7 個と 24 個しか一意の値が存在しないためです。しかし、"Context.TimeStamp":"1985-04-12T23:20:50.52Z" は非常に厳密であり、非常に多くの一意の値を持っているため、Personalizer がそこから学習するのは非常に困難です。

フィーチャーセットを改善する

フィーチャー評価ジョブを実行して、ユーザーの行動を分析します。これにより、過去のデータを見て、ポジティブなリワードに大きく貢献しているフィーチャーと貢献度が低いフィーチャーを比較できます。どのフィーチャーが役立っているのか判断できます。Personalizer に送信するより良いフィーチャーを見つけ、結果をさらに改善するのは利用者とそのアプリケーション次第となります。

人工知能とAzure AI サービスを使用して機能セットを拡張する

人工知能とすぐに実行できるAzure AI サービスは、Personalizer に非常に強力な追加機能を備えています。

人工知能サービスを利用して項目を事前に処理することで、パーソナライズに関連する可能性がある情報を自動的に抽出できます。

次に例を示します。

Video Indexer で映画ファイルを実行し、シーンの要素、テキスト、センチメント、その他さまざまな属性を抽出できます。そのような属性は密度を高くし、元の項目メタデータにはなかった特性を反映できます。
たとえば、画像は物体検出で、顔はセンチメントで実行できます。
テキストに含まれる情報は、エンティティやセンチメントを抽出し、Bing ナレッジグラフでエンティティを拡大することで強化できます。

他のいくつかのAzure AI サービスなどを使用することができます。

埋め込みをフィーチャーとして使用する

さまざまなMachine Learningモデルからの埋め込みは、Personalizer の影響を受ける機能であることが証明されています

大規模言語モデルからの埋め込み
Azure AI Vision モデルからの埋め込み

名前空間

必要に応じて、(コンテキストとアクションの両方のフィーチャーに関連する) 名前空間を使用して、フィーチャーを整理することもできます。名前空間を使用すると、トピック別、ソース別、またはアプリケーションで意味のあるその他のグループ別にフィーチャーをグループ化できます。名前空間を使用するかどうか、およびどのような名前空間にするかを決定してください。名前空間は、フィーチャーを個別のセットに整理したり、類似した名前のフィーチャーを明確にしたりします。名前空間は、フィーチャー名に追加される "接頭辞" と考えることができます。名前空間は入れ子にしないでください。

アプリケーションで使用されるフィーチャーの名前空間の例:

User_Profile_from_CRM
Time
Mobile_Device_Info
http_user_agent
VideoResolution
DeviceInfo
天気
Product_Recommendation_Ratings
current_time
NewsArticle_TextAnalytics

名前空間の名前付け規則とガイドライン

名前空間は入れ子にしないでください。
名前空間の先頭は一意の ASCII 文字にする必要があります (UTF-8 ベースの名前を使用することをお勧めします)。現在、同じ文字で始まる複数の名前空間が存在すると競合が発生する可能性があるため、名前空間が相互に異なる文字で始まるようにすることを強くお勧めします。
名前空間では、大文字と小文字が区別されます。たとえば user と User は異なる名前空間と見なされます。
フィーチャー名は複数の名前空間をまたいで繰り返し使用でき、別個のフィーチャーとして扱われます。
コード < 32 (印刷不可)、32 (スペース)、58 (コロン)、124 (パイプ)、126 から 140 の各文字は使用できません。
アンダースコア _ で始まるフィーチャー名はすべて無視されます。

JSON の使用例

Actions

Rank を呼び出すとき、次から複数のアクションを選択して送信します。

JSON オブジェクトには、入れ子にした JSON オブジェクトと単純なプロパティ/値を含めることができます。配列は、配列の項目が数値の場合にのみ含めることができます。

{
    "actions": [
    {
      "id": "pasta",
      "features": [
        {
          "taste": "salty",
          "spiceLevel": "medium",
          "grams": [400,800]
        },
        {
          "nutritionLevel": 5,
          "cuisine": "italian"
        }
      ]
    },
    {
      "id": "ice cream",
      "features": [
        {
          "taste": "sweet",
          "spiceLevel": "none",
          "grams": [150, 300, 450]
        },
        {
          "nutritionalLevel": 2
        }
      ]
    },
    {
      "id": "juice",
      "features": [
        {
          "taste": "sweet",
          "spiceLevel": "none",
          "grams": [300, 600, 900]
        },
        {
          "nutritionLevel": 5
        },
        {
          "drink": true
        }
      ]
    },
    {
      "id": "salad",
      "features": [
        {
          "taste": "salty",
          "spiceLevel": "low",
          "grams": [300, 600]
        },
        {
          "nutritionLevel": 8
        }
      ]
    }
  ]
}