Информация об обучаемых классификаторах
Классификация и маркировка содержимого, чтобы его можно было защитить и правильно обрабатывать, является отправной точкой для дисциплины защиты информации. Microsoft Purview предоставляет три способа классификации содержимого.
Совет
Если вы не являетесь клиентом E5, используйте 90-дневную пробную версию решений Microsoft Purview, чтобы узнать, как дополнительные возможности Purview могут помочь вашей организации управлять безопасностью данных и соответствием требованиям. Начните сейчас, перейдя в центр пробных версий на портале соответствия требованиям Microsoft Purview. Сведения о регистрации и условиях пробной версии.
Вручную
Для классификации вручную требуется человеческое суждение и действия. Пользователи и администраторы классифицируют содержимое по мере его возникновения. Можно использовать либо существующие метки и типы конфиденциальной информации, либо пользовательские созданные. Затем можно защитить содержимое и управлять его ликвидацией.
Автоматическое сопоставление шаблонов
Эти механизмы классификации включают поиск содержимого с помощью:
- Ключевые слова или значения метаданных (ключевое слово языке запросов).
- Использование ранее выявленных шаблонов конфиденциальной информации, таких как социальное обеспечение, кредитные карта или номера банковских счетов (определения сущностей типа конфиденциальной информации).
- Распознавание элемента, так как он является разновидностью шаблона (печать пальцем документа).
- Использование точного соответствия данных в строках.
Затем можно автоматически применить метки конфиденциальности и хранения, чтобы сделать содержимое доступным для использования в статье Сведения о Защита от потери данных Microsoft Purview и автоматическое применение политик для меток хранения.
Классификаторы
Этот метод классификации хорошо подходит для содержимого, которое не легко определить с помощью ручных или автоматических методов сопоставления шаблонов. Этот метод классификации больше связан с использованием классификатора для идентификации элемента на основе элемента, а не по элементам, которые находятся в элементе (сопоставление шаблонов). Классификатор узнает, как определить тип содержимого, рассматривая сотни примеров содержимого, который вы хотите определить.
Примечание.
В предварительной версии — вы можете просмотреть обучаемые классификаторы в обозревателе содержимого, разверните раздел Обучаемые классификаторы на панели фильтров. Обучаемые классификаторы будут автоматически отображать количество инцидентов, обнаруженных в SharePoint, Teams и OneDrive, без применения каких-либо меток. Если вы не хотите использовать эту функцию, необходимо отправить запрос с помощью служба поддержки Майкрософт. Это приведет к отключению отображения конфиденциальных данных, которые не используются ни в каких политиках маркировки в Обозреватель содержимого. Вы также можете отключить сканирование данных. Если сканирование отключено, метки конфиденциальности и политики защиты от потери данных с этими классификаторами не будут работать.
Где можно использовать классификаторы
Классификаторы можно использовать в качестве условия для:
- Автоматическая маркировка Office с помощью меток конфиденциальности
- Автоматическое применение политики меток хранения на основе условия
- Соответствие требованиям к обмену данными
- Метки конфиденциальности могут использовать классификаторы в качестве условий. См. статью Автоматическое применение метки конфиденциальности к содержимому.
- Защита от потери данных
Важно!
Классификаторы работают только с элементами, которые не зашифрованы.
Типы классификаторов
- предварительно обученные классификаторы . Корпорация Майкрософт создала и предварительно обучила несколько классификаторов, которые можно использовать без их обучения. Эти классификаторы будут отображаться с состоянием
Ready to use
. - пользовательские обучаемые классификаторы . Если у вас есть требования к идентификации и классификации содержимого, которые выходят за рамки предварительно обученных классификаторов, вы можете создавать и обучать собственные классификаторы.
Полный список всех предварительно обученных классификаторов см. в разделе Определения классификаторов с возможностью обучения.
Пользовательские классификаторы
Если предварительно обученные классификаторы не соответствуют вашим потребностям, вы можете создать и обучить собственные классификаторы. При создании собственных будет больше работы, но они будут гораздо лучше адаптированы к потребностям вашей организации.
Вы начинаете создание настраиваемого обучаемого классификатора с подачи ему примеров, которые определенно находятся в категории. После обработки этих примеров вы протестируете их, предоставив ему сочетание как соответствующих, так и несоединяющихся примеров. Затем классификатор делает прогнозы о том, попадает ли какой-либо элемент в категорию, которую вы создаете. Затем вы подтверждаете его результаты, отбирая истинные положительные, истинные отрицательные, ложноположительные и ложноотрицания, чтобы повысить точность прогнозов.
При публикации классификатора он сортирует элементы в таких расположениях, как SharePoint Online, Exchange и OneDrive, и классифицирует содержимое. После публикации классификатора можно продолжить обучение с помощью процесса обратной связи, аналогичного начальному процессу обучения.
Например, можно создать обучаемые классификаторы для:
- Юридические документы, такие как адвокатская привилегия клиента, закрывающие наборы, выписка о работе
- Стратегические бизнес-документы, такие как пресс-релизы, слияние и приобретение, сделки, бизнес- или маркетинговые планы, интеллектуальная собственность, патенты, документация по проектированию
- Сведения о ценах, такие как счета, ценовые предложения, заказы на работу, документы для торгов
- Финансовая информация, например организационные инвестиции, квартальные или годовые результаты
Процесс создания пользовательских классификаторов
Создание и публикация классификатора для использования в решениях соответствия требованиям, таких как политики хранения и контроль обмена данными, следует этому потоку. Дополнительные сведения о создании настраиваемого обучаемого классификатора см. в статье Создание пользовательского классификатора.
Переобучение классификаторов
Вы можете повысить точность всех настраиваемых обучаемых классификаторов, предоставив им отзывы о точности выполняемой классификации. Это называется переобучением и следует за этим рабочим процессом.
Примечание.
Предварительно обученные классификаторы не могут быть переобучены.
Предоставление обратной связи о соответствии или не точности соответствия в обучаемых классификаторах
Количество совпадений для обучаемого классификатора можно просмотреть в обозревателе содержимого и обучаемых классификаторах. Вы также можете предоставить отзыв о том, является ли элемент на самом деле совпадением или нет, используя механизм обратной связи "Соответствие, а не соответствие" , и использовать этот отзыв для настройки классификаторов. Дополнительные сведения см. в статье Повышение точности классификатора .
См. также
Обратная связь
https://aka.ms/ContentUserFeedback.
Ожидается в ближайшее время: в течение 2024 года мы постепенно откажемся от GitHub Issues как механизма обратной связи для контента и заменим его новой системой обратной связи. Дополнительные сведения см. в разделеОтправить и просмотреть отзыв по