Поделиться через


Информация об обучаемых классификаторах

Обучаемые классификаторы

Этот метод классификации хорошо подходит для содержимого, которое невозможно легко определить с помощью ручных или автоматических методов сопоставления шаблонов. Этот метод классификации предназначен для использования классификатора для идентификации элемента на основе элемента, а не по элементам, которые находятся в элементе (сопоставление шаблонов). Классификатор узнает, как определить тип содержимого, просмотрев сотни примеров содержимого, которое требуется обнаружить.

Примечание.

В предварительной версии: Обучаемые классификаторы можно просмотреть в обозревателе содержимого, разверните раздел Обучаемые классификаторы на панели фильтров. Обучаемые классификаторы автоматически отображают количество инцидентов, обнаруженных в SharePoint, Teams и OneDrive, без необходимости присвоения меток. Если вы не хотите использовать эту функцию, необходимо отправить запрос с помощью служба поддержки Майкрософт. Этот запрос отключает отображение конфиденциальных данных, которые не используются ни в каких политиках маркировки в Обозреватель содержимого. Вы также можете отключить сканирование данных. Если сканирование отключено, метки конфиденциальности и политики защиты от потери данных с этими классификаторами не работают.

Где можно использовать классификаторы

Используйте классификаторы в качестве условия для:

Важно!

Классификаторы работают только с элементами, которые не зашифрованы.

Типы классификаторов

  • Корпорация Майкрософт предоставила предварительно обученные классификаторы . Корпорация Майкрософт создала и предварительно обучила несколько классификаторов, которые можно начать использовать без их обучения. Эти классификаторы отображаются с состоянием Ready to use.
  • Пользовательские обучаемые классификаторы . Если вам нужно определить и классифицировать содержимое за пределами предварительно обученных классификаторов, можно создать и обучить собственные классификаторы.

Полный список всех предварительно обученных классификаторов см. в разделе Определения классификаторов с возможностью обучения.

Настраиваемые классификаторы

Важно!

Ограничение языка: Поддержка пользовательских классификаторов ограничена английским языком.

Если предварительно обученные классификаторы, предоставленные корпорацией Майкрософт, не соответствуют вашим потребностям, вы можете создать и обучить собственные классификаторы. При создании собственных необходимо больше работы, но они лучше подходят для вашей организации.

Чтобы создать настраиваемый обучаемый классификатор, начните с подачи ему одного набора примеров, которые определенно находятся в категории, и еще одного набора примеров, которые определенно не относятся. Microsoft Purview обрабатывает эти примеры, а затем классификатор делает прогнозы относительно того, попадает ли какой-либо элемент в категорию, которую вы создаете. Затем вы подтверждаете результаты, отсортируя истинные положительные, истинные отрицательные, ложноположительные и ложноотрицания, чтобы повысить точность прогнозов.

При публикации классификатора он сортирует элементы в таких расположениях, как SharePoint, Exchange и OneDrive, и классифицирует содержимое.

Например, можно создать обучаемые классификаторы для:

  • Юридические документы, такие как адвокатская привилегия клиента, закрывающие наборы, выписка о работе
  • Стратегические бизнес-документы, такие как пресс-релизы, слияние и приобретение, сделки, бизнес- или маркетинговые планы, интеллектуальная собственность, патенты, документация по проектированию
  • Сведения о ценах, такие как счета, ценовые предложения, заказы на работу, документы для торгов
  • Финансовая информация, например организационные инвестиции, квартальные или годовые результаты

Процесс создания пользовательских классификаторов

На следующей схеме показан процесс создания и публикации классификатора для использования в решениях соответствия требованиям, таких как политики хранения и контроль обмена данными. Дополнительные сведения о создании настраиваемого обучаемого классификатора см. в статье Начало работы с обучаемыми классификаторами.

Схема рабочего процесса для создания настраиваемого обучаемого классификатора.

Совет

Если вы создаете новый сайт и папку SharePoint для начальных данных, предоставьте по крайней мере час индексации этого расположения перед созданием обучаемого классификатора, использующего эти начальные данные.

Переобучение классификаторов

Повторное обучение опубликованных пользовательских классификаторов не поддерживается. Если необходимо повысить точность опубликованного обучаемого классификатора, удалите классификатор и начните с более крупных наборов выборок.

Чтобы повысить точность неопубликованного классификатора, просмотрите результаты теста, обновите набор данных дополнительными данными и перезапустите обучение.

См. также