Данные и конфиденциальность персонализатора

Важно!

Начиная с 20 сентября 2023 г. вы не сможете создавать новые ресурсы Персонализатора. Служба Персонализатора отменяется 1 октября 2026 года.

В этой статье содержатся сведения о том, какие данные Azure AI Персонализатор использует для работы, как он обрабатывает эти данные и как можно управлять данными. В ней предполагается базовое знание того, что такое Персонализатор и как он работает. Конкретные термины можно найти в Терминологии.

Какие данные обрабатывает Персонализатор?

Персонализатор обрабатывает следующие типы данных:

  • Функции контекста и действия: приложение отправляет сведения о пользователях и продуктах или содержимом для персонализации в агрегированной форме. Эти данные отправляются Персонализатору при каждом вызове Rank API в качестве аргументов для контекста и действий. Вы решаете, что отправляется в программный интерфейс и как его агрегировать. Данные выражаются как атрибуты или признаки. Вы предоставляете сведения о пользователях, таких как их устройство и их среда, в качестве функций контекста. Вы не должны отправлять функции, характерные для пользователя, такие как номер телефона, электронная почта или идентификаторы пользователей. К действиям относятся сведения о вашем содержимом и продукте, такие как жанр фильма или цена продукта. Дополнительные сведения см. в разделе Функции для действий и контекста.
  • Сведения о вознаграждениях: Оценка вознаграждения (число от 0 до 1) оценивает, насколько взаимодействие пользователя в результате выбора персонализации соответствует бизнес-цели. Например, событие может получить вознаграждение «1», если была нажата рекомендуемая статья. Дополнительные сведения см. в статье Вознаграждения.

Дополнительные сведения о том, какие сведения обычно используются с Персонализатором, см. в разделе Функции — сведения о действиях и контексте.

[!TIP] Вы сами решаете, какие функции использовать, как их агрегировать и откуда берется информация, когда вызываете Персонализатор Rank API в своем приложении. Вы также определяете, как создавать оценки вознаграждения.

Какие данные обрабатывает Персонализатор?

На следующей схеме показано, как обрабатываются данные.

Diagram that shows how Personalizer processes data.

Персонализатор обрабатывает данные следующим образом:

  1. Персонализатор получает данные каждый раз, когда приложение вызывает Rank API для события персонализации. Данные отправляются с помощью аргументов контекста и действий.

  2. Персонализатор использует сведения в контексте и действиях, внутренние модели ИИ и конфигурацию службы, чтобы вернуть ответ для идентификатора используемого действия. Содержимое контекста и действий хранится не более 48 часов во временных кэшах с идентификатором EventID, используемым или сгенерированным в Rank API.

  3. Затем приложение вызывает Reward API с одним или несколькими оценками вознаграждения. Эти сведения также хранятся в временных кэшах и соответствуют сведениям о действиях и контексте.

  4. После корреляции сведений о рангах и вознаграждениях для событий они удаляются из временных кэшей и помещаются в более постоянное хранилище. Они остаются в постоянном хранилище до тех пор, пока не истечет количество дней, указанное в параметре «Хранение данных», после чего информация будет удалена. Если вы решили не указывать количество дней в параметре «Хранение данных», эти данные будут сохранены до тех пор, пока ресурс Персонализатора Azure не будет удален или пока вы не решите очистить данные через пользовательский интерфейс или API. Вы можете изменить параметр хранения данных в любое время.

  5. Персонализатор непрерывно обучает внутренние модели ИИ Персонализатора, относящиеся к этому циклу Персонализатора, используя данные в параметрах конфигурации постоянного хранилища и машинного обучения в Параметрах обучения.

  6. Персонализатор создает автономные оценки автоматически или по запросу. Автономные оценки содержат отчет о вознаграждениях, полученных моделями Персонализатора за прошлый период времени. Автономная оценка внедряет модели, активные во время их создания, и параметры обучения, используемые для их создания, а также исторический статистический агрегат средней вознаграждения на событие для этого периода времени. Оценки также включают важность признаков, которая представляет собой список признаков, наблюдаемых за период времени, и их относительную важность в модели.

Независимость циклов Персонализатора

Каждый цикл Персонализатора отделен и не зависит от других, как показано ниже:

  • Без расширения внешних данных: каждый цикл Персонализатора использует только данные, предоставленные вами посредством вызовов Rank и Reward API для обучения моделей. Персонализатор не использует никаких дополнительных сведений из любого источника, таких как другие циклы Персонализатора в собственной подписке Azure, Майкрософт, сторонних источниках или субпроцессорах.
  • Отсутствие данных, модели или совместного использования информации: цикл Персонализатора не будет совместно использовать сведения о событиях, функциях и моделях с любым другим циклом Персонализатора в вашей подписке, Майкрософт, третьих сторонах или субпроцессорах.

Как хранятся данные и какие средства контроля доступны для клиентов?

Персонализатор сохраняет различные типы данных различными способами и предоставляет следующие элементы управления для каждого из них.

Данные о ранжировании и вознаграждениях Персонализатора

Персонализатор хранит функции действий и контекста, отправляемые с помощью вызовов ранжирования и вознаграждения за количество дней, указанных в конфигурации в разделе "Хранение данных". Чтобы управлять хранением данных, вы можете:

  1. Укажите количество дней для хранения хранилища журналов в портал Azure для ресурса Персонализаторав разделе"Хранение данных>конфигурации" или через API. По умолчанию параметр Сохранение данных составляет семь дней. Персонализатор автоматически удаляет все данные ранжирования и вознаграждения старше этого числа дней.

  2. Очистите данные для ведения журнала персонализации и вознаграждения в портал Azure в разделе Модель и параметры> обученияОчистить данные>Зарегистрированные данные персонализации и вознаграждения или через API.

  3. удалить цикл Персонализатора из подписки в портал Azure или с помощью API управления ресурсами Azure.

Вы не можете получить доступ к прошлым данным из вызовов API ранжирования и вознаграждения непосредственно в ресурсе Персонализатора. Если вы хотите просмотреть все сохраненные данные, настройте зеркальное отображение журналов, чтобы создать копию этих данных в созданном вами ресурсе Хранилище BLOB-объектов Azure и отвечать за управление.

Временный кэш Персонализатора

Персонализатор хранит частичные данные о событии, отдельном от вызовов ранжирования и вознаграждения в временных кэшах. События автоматически очищаются из временного кэша 48 часов с момента возникновения события.

Чтобы удалить временные данные, можно:

  1. очистить данные для ведения журнала персонализации и вознаграждения в портале Azure в разделе Модель и параметры обучения>Очистить данные или через API.

  2. удалить цикл Персонализатора из подписки в портал Azure или с помощью API управления ресурсами Azure.

Модели Персонализатора и параметры обучения

Цикл Персонализатора обучает модели с данными из вызовов API ранжирования и вознаграждения, управляемых гиперпараметров и конфигурацией, указанными в разделе Модель и параметры обучения на портал Azure. Модели являются переменными. Они постоянно меняются и обучаются на дополнительных данных практически в реальном времени. Персонализатор не сохраняет старые модели автоматически и продолжает перезаписывать их с помощью последних моделей. Дополнительные сведения см. в разделе (Управление моделями и параметрами обучения). Чтобы очистить модели и параметры обучения:

  1. Сбросьте их на портал Azure в разделе Модель и параметры обучения>Очистить данные или через API.

  2. удалить цикл Персонализатора из подписки в портал Azure или с помощью API управления ресурсами Azure.

Отчеты об оценке Персонализатора

Персонализатор также сохраняет информацию, созданную в автономных оценках для отчетов.

Чтобы удалить отчеты об автономной оценке, можно:

  1. перейти к циклу Персонализатора на портале Azure. Перейти к оценкам и удалить соответствующую оценку.

  2. Удалите оценки через Оценки API.

  3. удалить цикл Персонализатора из подписки в портал Azure или с помощью API управления ресурсами Azure.

Рекомендации по работе с хранилищем

  • Ключи, управляемые клиентом. Клиенты могут настроить службу для шифрования неактивных данных с помощью собственных управляемых ключей. Этот второй уровень шифрования находится поверх собственного шифрования Microsoft.
  • География: во всех случаях входящие данные, модели и оценки обрабатываются и хранятся в одном географическом регионе, где был создан ресурс Персонализатора.

См. также:

Следующие шаги

Дополнительные сведения об обязательствах корпорации Майкрософт по обеспечению конфиденциальности и безопасности см. в Центре управления безопасностью Майкрософт.