Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Если предварительно настроенные типы конфиденциальной информации (SIT) не соответствуют вашим потребностям, можно создать и определить настраиваемые типы SIT, соответствующие вашим потребностям. Вы также можете скопировать, а затем изменить встроенный SIT.
Пользовательские SIT добавляются в Microsoft.SCCManaged.CustomRulePack пакет правил.
Существует два метода создания нового SIT:
Подготовка к работе
Вы должны быть знакомы с типами конфиденциальной информации и их составом. Чтобы получить это представление, см . статью Сведения о типах конфиденциальной информации. Очень важно понимать роли:
- регулярных выражений: типы конфиденциальной информации Microsoft 365 используют модуль Boost.RegEx 5.1.3;
- списков ключевых слов: вы можете создать собственный список при определении своего типа конфиденциальной информации или выбрать из существующих списков ключевых слов.
- словаря ключевых слов
- Функции типов конфиденциальной информации
- доверительных уровней
Ознакомьтесь с ограничениями типов конфиденциальной информации.
Сведения о лицензировании см. в разделе
Важно!
Центр обслуживания клиентов Майкрософт не может оказывать помощь при создании пользовательских категорий или шаблонов регулярных выражений. Инженеры службы поддержки могут предоставлять ограниченную поддержку этой функции, например предоставлять образцы шаблонов регулярных выражений для имитации или помогать устранять неполадки с существующим шаблоном регулярного выражения, который не активируется должным образом. Однако они не могут гарантировать, что какая-либо пользовательская разработка, соответствующая содержимому, соответствует вашим требованиям или обязательствам.
Создание пользовательского SIT с нуля
Примечание.
Microsoft Purview поддерживает создание пользовательских SIT, использующих двубайтовые языки символов, такие как китайский, японский и корейский. Так как эти языки не используют разделители так, как это делают однобайтовые языки, Purview добавляет пробел между каждым словом в языках, использующих двухбайтовые символы. Он также удаляет специальные символы, такие как знаки препинания.
Используйте следующую процедуру, чтобы полностью определить новый тип конфиденциальной информации.
Войдите на портал Microsoft Purview.
На портале Microsoft Purview перейдите к разделу Information Protection>Классификаторы>Типы конфиденциальной информации и выберите Создать тип конфиденциальной информации.
Заполните значения Название и Описание и выберите Далее.
Нажмите кнопку Создать шаблон. При определении нового типа конфиденциальной информации вы можете создать несколько шаблонов, каждый со своими элементами и доверительными уровнями.
Выберите для шаблона значение доверительного уровня по умолчанию. Используются значения Низкий доверительный уровень, Средний доверительный уровень и Высокий доверительный уровень.
Выберите и определите элемент Primary. Первичный элемент может быть регулярным выражением с необязательным проверятелем, списком ключевых слов, словарем ключевых слов или одной из предварительно настроенных функций. Дополнительные сведения о функциях SIT, используемых для защиты от потери данных, см. в разделе Функции типов конфиденциальной информации. Дополнительные сведения о проверяющих элементах даты и контрольной суммы см. в разделе Проверяющие средства регулярного выражения типа конфиденциальной информации.
Важно!
Не используйте позиционные регулярные привязки, такие как
^и$в пользовательских SIT, так как SIT вряд ли будет вести себя должным образом, если эти привязки являются частью регулярного выражения. Если они используются, при проверке содержимого нет никаких гарантий относительно того, где содержимое будет соответствовать начальным и конечным привязкам.Заполните значение Расстояние между символами.
(Необязательно.) Добавьте вспомогательные элементы, если они есть. Вспомогательные элементы могут быть регулярным выражением с необязательным проверяющим элементом, списком ключевое слово, словарем ключевое слово или одной из предопределенных функций. Вспомогательные элементы могут иметь собственную конфигурацию приближения символов .
(Необязательно) Добавьте дополнительные проверки из списка доступных проверок.
Нажмите кнопку Создать.
Нажмите кнопку Далее.
Выберите рекомендуемый доверительный уровень для этого типа конфиденциальной информации.
Проверьте параметры и нажмите кнопку Сохранить.
Важно!
Microsoft 365 использует поисковый сканер для выявления и классификации конфиденциальной информации на сайтах SharePoint и OneDrive. Чтобы определить новый пользовательский тип конфиденциальной информации в существующем содержимом, необходимо повторно раскрасить содержимое. Обход контента выполняется по расписанию, но вы можете вручную перекрашить содержимое для семейства веб-сайтов, списка или библиотеки. Дополнительные сведения см . в статье Ручное сканирование и повторная индексация сайта, библиотеки или списка.
На вкладке Типы конфиденциальной информации на странице Классификаторы перечислены все типы конфиденциальной информации. Выберите Обновить, а затем или воспользуйтесь средством поиска или просмотрите список, чтобы найти новый sit.
Копирование и изменение существующего sit
В этой процедуре объясняется, как скопировать и изменить существующий sit с помощью портала Purview.
Кроме того, можно копировать и изменять настраиваемые sit с помощью PowerShell и возможностей точного сопоставления данных (EDM) Purview. Дополнительные сведения об этих методах см. в следующих статьях:
- Создание пользовательского типа конфиденциальной информации в Microsoft Purview PowerShell
- Подробнее о пользовательских типах конфиденциальной информации с точным совпадением данных
Примечание.
Невозможно скопировать эти SIT:
- Номер водительского удостоверения Канады
- Номер водительского удостоверения ЕС
- Национальный идентификационный номер, ЕС
- Номер паспорта, ЕС
- Номер социального страхования или аналогичный идентификационный номер, ЕС
- Идентификационный номер налогоплательщика в ЕС
- Международная классификация болезней (ICD-10-CM)
- Международная классификация болезней (ICD-9-CM)
- Номер водительского удостоверения США
Если у вас есть 10 текстовых процессоров или ограниченных текстовых процессоров, таких как ключевое слово списки, регулярные выражения, словари ключевое слово или функции, вы не сможете копировать SIT напрямую из пользовательского интерфейса. Вместо этого для этой задачи необходимо использовать PowerShell. Дополнительные сведения о том, как клонировать или копировать SIT с помощью PowerShell, см. в статье Изменение пользовательского типа конфиденциальной информации с помощью PowerShell.
Копирование и изменение существующего sit с помощью портала Microsoft Purview
Войдите на портал Microsoft Purview.
> Information Protection Classifiers>Типы конфиденциальной информации и выберите тип конфиденциальной информации, который требуется скопировать.
Откроется страница обзора для типа конфиденциальной информации. Выберите параметр Копировать. Когда копия будет готова, появится сообщение о том, что копия создана с возможностью ее редактирования. Нажмите кнопку Yes (Да).
Задайте новому типу конфиденциальной информации новое Название и добавьте Описание
Вы можете создать новый шаблон или изменить или удалить некоторые или все существующие шаблоны.
- Чтобы создать новый шаблон, нажмите кнопку Создать.
- Чтобы изменить существующий шаблон, щелкните значок Изменить (карандаш) рядом с шаблоном, который требуется изменить.
- Чтобы удалить шаблон, щелкните значок Удалить рядом с шаблоном, который нужно удалить.
При создании или редактировании шаблона выберите уровень доверия по умолчанию для шаблона. Используются значения Низкий доверительный уровень, Средний доверительный уровень и Высокий доверительный уровень.
Выберите и определите Основной элемент. Основным элементом может быть регулярное выражение, список ключевых слов, словарь ключевых слов или одна из предварительно настроенных функций. См. раздел Функции типов конфиденциальной информации.
Заполните значение Расстояние между символами.
(Необязательно) Если у вас есть вспомогательные элементы или какие-либо дополнительные проверки , которые вы хотите выполнить, добавьте их. При необходимости вспомогательные элементы можно упорядочить по группам.
Если вы создаете новый шаблон, нажмите кнопку Создать. Если вы редактировать существующий шаблон, нажмите кнопку Обновить.
Нажмите кнопку Далее.
Подтвердите выбор уровня достоверности для этого типа конфиденциальной информации и нажмите кнопку Далее.
Просмотрите параметры и нажмите кнопку Сохранить.
Будет создан новый тип конфиденциальной информации. В сообщении подтверждения выберите *Готово.
Примечание.
Защита информации Microsoft Purview поддерживает языки двухбайтового набора символов для:
- Китайский (упрощенное письмо)
- Китайский (традиционное письмо)
- Корейский
- Японский
Эта поддержка доступна для конфиденциальных типов информации. Дополнительные сведения см. в статьеПоддержка защиты информации для двойных байтовых наборов символов заметки о выпуске (предварительная версия).
Совет
Чтобы обнаружить шаблоны, содержащие китайские/японские символы и однобайтовые символы, или для обнаружения шаблонов, содержащих китайский/японский и английский языки, определите два варианта ключевое слово или регулярного выражения.
- Например, для выявления такого ключевого слова, как "机密的document", используйте два варианта ключевого слова: один с пробелом между японским и английским текстом, а другой без пробела между японским и английским текстом. Поэтому в SIT следует добавить ключевые слова "机密的 document" и "机密的document". Аналогично, для выявления фразы "東京オリンピック2020" следует использовать два варианта: "東京オリンピック 2020" и "東京オリンピック2020".
Наряду с китайскими, японскими или двойными байтами, если список ключевых слов или фраз также содержит слова, отличные от китайского или японского языка (например, только на английском языке), рекомендуется создать два словаря или списки ключевое слово. Создайте одно для ключевых слов, содержащих символы китайского/японского/двойного байта, а другое — только для английского языка.
- Например, если вы хотите создать словарь или список ключевое слово с тремя фразами "Строго конфиденциальный", "機密性が高い" и "机密的document", необходимо создать два списка ключевое слово.
- Строго конфиденциально
- 機密性が高い, 机密的документ и 机密的 документ
При создании регулярного выражения с помощью двухбайтового дефиса или двойной байтовой точки убедитесь, что оба символа экранироваться так же, как и дефис или точка в регулярном экземпляре. Вот пример регулярного выражения для справки:
(?<!\d)([4][0-9]{3}[\-?\-\t]*[0-9]{4})
В ключевое слово не следует использовать двухбайтовые специальные символы.
В списке ключевых слов рекомендуется использовать соответствие по строкам вместо соответствия по словам.