Поделиться через


Создание примера файла EDM SIT (новый интерфейс)

Создание и обеспечение доступности типа конфиденциальной информации (SIT) на основе точного соответствия данных (EDM) — это многоэтапный процесс. Их можно использовать в политиках защиты от потери данных Microsoft Purview, обнаружении электронных данных и некоторых задачах управления содержимым.

Совет

Если вы не являетесь клиентом E5, используйте 90-дневную пробную версию решений Microsoft Purview, чтобы узнать, как дополнительные возможности Purview могут помочь вашей организации управлять безопасностью данных и соответствием требованиям. Начните сейчас, перейдя в центр пробных версий на портале соответствия требованиям Microsoft Purview. Сведения о регистрации и условиях пробной версии.

Сфера применения

  • Новый интерфейс

Если вы хотите создать EDM SIT с помощью классического интерфейса, см. статью Создание классического интерфейса EDM SIT.

Подготовка к работе

Форматирование примера файла

Система извлекает имена столбцов из примера файла для создания схемы и порекомендует базовые SIT для сопоставления данных образца полей. Он должен быть отформатирован идентично исходному файлу таблицы конфиденциальной информации и содержать искусственные значения, которые представляют фактические данные. Файл можно сохранить в формате.csv (значения, разделенные запятыми), .tsv (значения, разделенные табуляциями) или каналом (|), но он должен совпадать с фактическим файлом таблицы конфиденциальной информации источника. Формат .tsv рекомендуется использовать в тех случаях, когда значения данных включают запятые, например адреса улиц.

  • Используйте около 10–20 строк данных, чтобы убедиться, что в системе достаточно примеров для работы.
  • Значения полей, содержащие запятые, должны быть заключены в кавычки ".
  • Первая строка должна быть строкой заголовка и содержать имена столбцов.
  • Файл должен содержать по крайней мере одну строку данных.
  • Каждая строка данных должна содержать правильное количество полей, соответствующих заголовкам.
  • Пример файла может содержать до 32 столбцов.
  • Размер примера файла не может превышать 2,5 МБ.
  • Имена столбцов (полей) должны начинаться с буквы, содержать не менее трех символов и состоять только из буквенно-цифровых символов (A–Z, a–z, 0–9) и не могут содержать пробелы, символы подчеркивания или другие специальные символы.

Например, если фактические данные используют формат с разделителями табуляции (.tsv) и выглядят следующим образом:

Изображение, на котором показана таблица, разделенная вкладками, с четырьмя столбцами и тремя строками данных искусственных реальных данных

Затем ваш пример файла должен иметь те же заголовки столбцов, но использовать искусственные значения для строк, как показано ниже.

FirstName LastName PatientNumber CreditCardNumber
Эрик Соломон 987-65-4321 9000000000000000
Лиза Тейлор 123-45-6789 500000000000000
Андре Лоусон 234-56-7890 200000000000000

Использование примеров шаблонов файлов

Если вы работаете в сфере здравоохранения США, финансовых услуг США или страховой отрасли США, вы можете начать с следующих примеров шаблонов файлов, чтобы ускорить процесс создания примера файлов. Эти файлы содержат наиболее часто используемые заголовки столбцов в соответствующих отраслях, а также искусственные значения в полях.

Чтобы использовать эти шаблоны, выполните следующие действия:

  1. Скачайте пример шаблона файла для вашей отрасли.
  2. Сравните заголовки столбцов в шаблоне с фактическими исходными данными и выберите те, которые вы хотите использовать в качестве основных полей в настраиваемом примере файла.
  3. Сравните форматирование фактических исходных данных с форматированием искусственных значений. Измените форматирование искусственных значений в соответствии с форматированием значений исходных данных.
  4. Сохраните настроенный пример файла для использования при создании схемы и пакета правил EDM SIT.

Совет

При работе в новом интерфейсе вы можете отправить пример файла или ввести его значения вручную. Рекомендуется создать пример файла.

Следующее действие