Поделиться через


Пользовательские классификации в Microsoft Purview

В этой статье описывается создание пользовательских классификаций для определения типов данных в пространстве данных, которые являются уникальными для вашей организации. В нем также описывается создание настраиваемых правил классификации, которые позволяют находить указанные данные в пространстве данных.

Важно!

Для создания настраиваемой классификации требуется разрешение куратора данных или администратора источника данных на коллекцию. Разрешений на любом уровне коллекции достаточно. Дополнительные сведения о разрешениях см. в статье Разрешения Microsoft Purview.

Системные классификации по умолчанию

Каталог данных Microsoft Purview предоставляет большой набор системных классификаций по умолчанию, представляющих типичные типы персональных данных, которые могут быть в вашем пространстве данных. Полный список доступных системных классификаций см. в разделе Поддерживаемые классификации в Microsoft Purview.

выбор классификации

Вы также можете создавать пользовательские классификации, если какая-либо из классификаций по умолчанию не соответствует вашим потребностям.

Примечание.

Наши правила выборки данных применяются как к системным, так и к пользовательским классификациям.

Примечание.

Пользовательские классификации Microsoft Purview применяются только к структурированным источникам данных, таким как SQL и CosmosDB, а также к структурированным типам файлов, таким как CSV, JSON и Parquet. Пользовательская классификация не применяется к неструктурированным типам файлов данных, таким как DOC, PDF и XLSX.

Действия по созданию пользовательской классификации

Чтобы создать пользовательскую классификацию, выполните следующие действия.

  1. Для создания настраиваемой классификации вам потребуются разрешения куратораданных или администратора источников данных для любой коллекции.

  2. В каталоге выберите Карта данных в меню слева.

  3. Выберите Классификации в разделе Управление заметками.

  4. Выберите + Создать

    Новая классификация

Откроется панель Добавление новой классификации , где можно указать имя и описание для классификации. Рекомендуется использовать соглашение о интервале между именами, например your company name.classification name.

Системные классификации Майкрософт группируются в зарезервированное MICROSOFT. пространство имен. Например, корпорация Майкрософт. ПРАВИТЕЛЬСТВО. НАМ. SOCIAL_SECURITY_NUMBER.

Имя классификации должно начинаться с буквы, за которой следует последовательность букв, цифр и точки (.) или символов подчеркивания. При вводе пользовательского интерфейса автоматически создается понятное имя. Это понятное имя отображается пользователями при его применении к ресурсу в каталоге.

Чтобы оставить имя коротким, система создает понятное имя на основе следующей логики:

  • Все сегменты пространства имен, кроме двух последних, обрезаются.

  • Регистр корректируется таким образом, чтобы первая буква каждого слова была прописной.

  • Все символы подчеркивания (_) заменяются пробелами.

Например, если вы назвали классификацию contoso.hr.employee_ID, понятное имя сохраняется в системе как Hr.Employee ID.

Contoso.hr.employee_id

Нажмите кнопку ОК, и новая классификация будет добавлена в список классификаций.

Настраиваемая классификация

При выборе классификации в списке откроется страница сведений о классификации. Здесь вы найдете все сведения о классификации.

Эти сведения включают количество экземпляров, формальное имя, связанные правила классификации (если таковые имеются) и имя владельца.

Выбор классификации

Пользовательские правила классификации

Служба каталога предоставляет набор правил классификации по умолчанию, которые используются сканером для автоматического обнаружения определенных типов данных. Вы также можете добавить собственные настраиваемые правила классификации для обнаружения других типов данных, которые могут быть заинтересованы в поиске в пространстве данных. Эта возможность может быть эффективной при попытке найти данные в пространстве данных.

Примечание.

Настраиваемые правила классификации поддерживаются только на английском языке.

Например, предположим, что у компании с именем Contoso есть идентификаторы сотрудников, которые стандартизированы во всей компании со словом "Сотрудник", за которым следует GUID для создания EMPLOYEE{GUID}. Например, один экземпляр идентификатора сотрудника выглядит как EMPLOYEE9c55c474-9996-420c-a285-0d0fc23f1f55.

Компания Contoso может настроить систему сканирования для поиска экземпляров этих идентификаторов, создав пользовательское правило классификации. Они могут предоставить регулярное выражение, соответствующее шаблону данных, в данном случае \^Employee\[A-Za-z0-9\]{8}-\[A-Za-z0-9\]{4}-\[A-Za-z0-9\]{4}-\[A-Za-z0-9\]{4}-\[A-Za-z0-9\]{12}\$. При необходимости, если данные обычно есть в столбце, имя которому известно, например Employee_ID или EmployeeID, можно добавить регулярное выражение шаблона столбца, чтобы сделать сканирование еще более точным. Примером регулярного выражения является Employee_ID|EmployeeID.

Затем система сканирования может использовать это правило для проверки фактических данных в столбце и имени столбца, чтобы попытаться определить каждый экземпляр, где найден шаблон идентификатора сотрудника.

Действия по созданию настраиваемого правила классификации

Чтобы создать пользовательское правило классификации, выполните приведенные далее действия.

  1. Создайте пользовательскую классификацию, следуя инструкциям в предыдущем разделе. Вы добавите эту пользовательскую классификацию в конфигурацию правила классификации, чтобы система применяла ее при поиске совпадения в столбце.

  2. Щелкните значок Карта данных .

  3. Выберите раздел Правила классификаций .

    Плитка правил классификации

  4. Выберите Создать.

    Добавление нового правила классификации

  5. Откроется диалоговое окно Новое правило классификации . Заполните поля и решите, следует ли создать правило регулярныхвыражений или правило словаря.

    Поле Описание
    Имя Обязательно. Максимальное значение — 100 символов.
    Описание Необязательный параметр. Максимальное значение — 256 символов.
    Имя классификации Обязательно. Выберите имя классификации в раскрывающемся списке, чтобы сообщить сканеру, чтобы применить его при обнаружении совпадения.
    Состояние Обязательно. Параметры включены или отключены. Значение по умолчанию включено.

    Создание нового правила классификации

Создание правила регулярных выражений

Важно!

Регулярные выражения в пользовательских классификациях не учитывают регистр.

  1. При создании правила регулярных выражений отобразится следующий экран. При необходимости можно отправить файл, который будет использоваться для создания рекомендуемых шаблонов регулярных выражений для правила. Поддерживаются только правила английского языка.

    Создание правила регулярных выражений

  2. Если вы решили создать рекомендуемый шаблон регулярных выражений, после отправки файла выберите один из предложенных шаблонов и выберите Добавить в шаблоны , чтобы использовать предлагаемые шаблоны данных и столбцов. Вы можете настроить предлагаемые шаблоны или ввести собственные шаблоны без отправки файла.

    Создание рекомендуемого регулярного выражения

    Поле Описание
    Шаблон данных Необязательный параметр. Регулярное выражение, представляющее данные, хранящиеся в поле данных. Ограничение велико. В предыдущем примере шаблоны данных проверяют идентификатор сотрудника, который буквально является словом Employee{GUID}.
    Шаблон столбца Необязательный параметр. Регулярное выражение, представляющее имена столбцов, которые необходимо сопоставить. Ограничение велико.
  3. В разделе Шаблон данных можно использовать минимальное пороговое значение соответствия , чтобы задать минимальный процент соответствия значений данных в столбце, который должен быть найден сканером для применения классификации. Рекомендуемое значение — 60 %. Если указать несколько шаблонов данных, этот параметр отключается и значение фиксируется на уровне 60 %.

    Примечание.

    Минимальное пороговое значение соответствия должно быть не менее 1 %.

  4. Теперь вы можете проверить правило и создать его.

  5. Протестируйте правило классификации перед завершением процесса создания, чтобы убедиться, что оно будет применять теги к вашим ресурсам. Классификации в правиле будут применяться к образцам данных, переданным так же, как и при сканировании. Это означает, что все системные классификации и настраиваемая классификация будут сопоставлены с данными в файле.

    Входные файлы могут включать файлы с разделителями (CSV, PSV, SSV, TSV), JSON или XML-содержимое. Содержимое будет анализироваться на основе расширения входного файла. Данные с разделителями могут иметь расширение файла, соответствующее любому из указанных типов. Например, данные TSV могут существовать в файле с именем MySampleData.csv. Содержимое с разделителями также должно содержать не менее трех столбцов.

    Тестирование правила перед созданием

    Просмотр примененных классификаций после отправки тестового файла

Создание правила словаря

  1. При создании правила словаря отобразится следующий экран. Отправьте файл, содержащий все возможные значения для создаваемой классификации в одном столбце. Поддерживаются только правила английского языка.

    Создание правила словаря

  2. После создания словаря можно настроить минимальное пороговое значение соответствия и отправить правило.

    Создайте правило словаря с Dictionary-Generated флажком.

Изменение или удаление пользовательской классификации

Чтобы обновить или изменить настраиваемую классификацию, выполните следующие действия.

  1. В учетной записи Microsoft Purview выберите карту данных, а затем — Классификации.

  2. Перейдите на вкладку Настраиваемый .

  3. Выберите классификацию, которую нужно изменить, а затем нажмите кнопку Изменить .

    Снимок экрана: страница пользовательской классификации с выбранной классификацией и выделенной кнопкой

  4. Теперь можно изменить описание этой пользовательской классификации. Нажмите кнопку ОК , чтобы сохранить изменения.

Чтобы удалить настраиваемую классификацию, выполните приведенные далее действия.

  1. Открыв карту данных, а затем — Классификации, перейдите на вкладку Настраиваемая .
  2. Выберите классификацию, которую нужно удалить, или несколько классификаций, которые нужно удалить, а затем нажмите кнопку Удалить . Снимок экрана: страница пользовательской классификации с выбранной классификацией и выделенной кнопкой удаления.

Вы также можете изменить или удалить классификацию из самой классификации. Просто выберите свою классификацию, а затем нажмите кнопки Изменить или Удалить в верхнем меню.

Снимок экрана: страница настраиваемого ресурса классификации с выделенными кнопками редактирования и удаления в верхней части страницы.

Включение или отключение правил классификации

  1. В учетной записи Microsoft Purview выберите карту данных, а затем — Правила классификации.

  2. Перейдите на вкладку Настраиваемый .

  3. Текущее состояние правила классификации можно проверка, просмотрев столбец Состояние в таблице.

  4. Выберите правило классификации или несколько правил классификации, которые необходимо включить или отключить.

  5. Нажмите кнопки Включить или Отключить в верхнем меню.

    Снимок экрана: страница настраиваемого правила классификации с выбранным правилом классификации и выделенными кнопками включения и отключения.

Вы также можете обновить состояние правила при редактировании правила.

Изменение или удаление правила классификации

Чтобы обновить или изменить пользовательское правило классификации, выполните следующие действия.

  1. В учетной записи Microsoft Purview выберите карту данных, а затем — Правила классификации.

  2. Перейдите на вкладку Настраиваемый .

  3. Выберите правило классификации, которое нужно изменить, а затем нажмите кнопку Изменить .

    Снимок экрана: страница настраиваемого правила классификации с выбранным правилом классификации и выделенной кнопкой

  4. Теперь можно изменить состояние, описание и связанное с ним правило классификации.

  5. Нажмите кнопку Продолжить .

  6. Вы можете отправить новый файл для регулярного выражения или правила словаря, чтобы сопоставить с и обновить соответствие порогового значения и шаблона столбца.

  7. Выберите Применить, чтобы сохранить изменения. Для применения изменений к ресурсам потребуется повторно выполнить сканирование с новым правилом.

Чтобы удалить настраиваемую классификацию, выполните приведенные далее действия.

  1. Открыв карту данных, а затем — Правила классификации, перейдите на вкладку Настраиваемые .

  2. Выберите правило классификации, которое нужно удалить, а затем нажмите кнопку Удалить .

    Снимок экрана: страница настраиваемого правила классификации с выбранным правилом классификации и выделенной кнопкой удаления.

Дальнейшие действия

Теперь, когда вы создали правило классификации, оно готово к добавлению в набор правил сканирования, чтобы при проверке оно использовалось при проверке. Дополнительные сведения см. в статье Создание набора правил сканирования.