Сопоставление данных для запросов прав субъекта

Благодаря сопоставлению данных организации могут предоставить Microsoft Priva возможность определять субъектов данных на основе точных значений данных. Это может помочь повысить точность поиска содержимого субъекта данных, соответствующего этим значениям данных как для вашего внутреннего персонала, так и для внешних пользователей, с которыми вы взаимодействуете. Это также упрощает необходимость предоставления полей вручную во время создания запроса на права субъекта и предоставляет контекст в запросах на права субъекта и для плитки Обзор, которая демонстрирует ваши элементы с наибольшим содержимым субъекта данных. Дополнительные сведения об этом представлении см. в статье Поиск и визуализация персональных данных в Priva.

Чтобы использовать функцию сопоставления данных, необходимо быть членом группы ролей Управление конфиденциальностью. В Priva в Портал соответствия требованиям Microsoft Purview выберите Параметры в верхней панели навигации, а затем — Сопоставление данных. Здесь необходимо определить схему персональных данных и предоставить отправку персональных данных, как показано ниже. Обратите внимание, что вы можете добавлять элементы и удалять добавляемые элементы, но не можете изменять элемент.

Подготовка к импорту данных

Перед определением схемы или отправкой данных необходимо определить источник информации субъекта данных. Требуемый формат файла — .csv, который может считываться приложением, например Microsoft Excel. Структурируйте экспорт таким образом, чтобы заголовки столбцов отображались в первой строке. Эти заголовки должны содержать имена атрибутов для схемы персональных данных. Проверьте формат данных в каждом поле. Если какие-либо данные содержат запятые, заключите эти значения двойными кавычками, чтобы они не были проанализированы в отдельные поля.

Определение схемы персональных данных

Первым шагом в настройке сопоставления данных является определение схемы персональных данных, которая будет описывать атрибуты для субъектов данных. Вы отправите эту схему на первую вкладку в области параметров сопоставления данных. Необходимые файлы включают XML-файл схемы персональных данных и XML-файл пакета правил .

XML-файл схемы персональных данных

Файл схемы персональных данных — это XML-файл, который определяет ожидаемые имена столбцов.

  • Назовите этот файл схемы pdm.xml.
  • Определите имя каждого столбца с помощью тега Имя поля, как показано в приведенном ниже примере.
  • Используйте функцию поиска = "true" для полей, которые должны быть доступны для поиска( максимум до пяти полей). По крайней мере одно из имен полей должно быть доступны для поиска. Пример синтаксиса: \<Field name="" searchable=""/>.
  • Схема персональных данных содержит раздел тега DataStore. Четыре обязательных поля должны быть сопоставлены с именами полей: primaryKeyField, upnField, firstNameField, lastNameField.

Например, следующий XML-файл определяет образец схемы с пятью полями, указанными как доступные для поиска: PatientID, MRN, SSN, Phone и DoB. PrimaryKeyField сопоставляется с PatientID, upnField — с MRN, firstNameField — с FirstName, lastNameField — с LastName.

Вы можете копировать, изменять и использовать наш пример.

<PdmSchema xmlns="http://schemas.microsoft.com/office/2020/pdm">
     <DataStore name="Patientrecords" description="Schema for patient records" version="1" primaryKeyField="PatientID" upnField="MRN" firstNameField="FirstName" lastNameField="LastName">
           <Field name="PatientID" searchable="true"/>
           <Field name="MRN" searchable="true" />
           <Field name="FirstName" />
           <Field name="LastName" />
           <Field name="SSN" searchable="true" />
           <Field name="Phone" searchable="true" />
           <Field name="DOB" searchable="true" />
           <Field name="Gender" />
           <Field name="Address" />
     </DataStore>
</PdmSchema>

XML-код пакета правил

При настройке пакета правил убедитесь, что вы правильно ссылаетесь на файл схемы персональных данных, созданный выше: pdm.xml. В следующем примере XML-файла пакета правил необходимо настроить следующие поля, чтобы создать конфиденциальный тип соответствия данных:

  • Идентификатор RulePack & PrivacyMatch id: используйте New-GUID для создания GUID.
  • Хранилище данных. В этом поле указывается хранилище данных для подстановки для сопоставления персональных данных. Укажите определенное имя хранилища данных для настроенной схемы персональных данных.
  • idMatch: это поле указывает на первичный элемент для сопоставления персональных данных.
    • Соответствует: указывает поле для точного поиска. Укажите имя поля с возможностью поиска из схемы персональных данных.
    • Классификация. Это поле указывает соответствие конфиденциального типа, которое активирует поиск соответствия персональных данных. Вы можете указать имя или GUID существующего встроенного или настраиваемого типа конфиденциальной информации. Чтобы избежать проблем с производительностью, если вы используете пользовательский тип конфиденциальной информации в качестве элемента Классификации в сопоставлении персональных данных, не используйте пользовательский тип конфиденциальной информации, который будет соответствовать большому проценту содержимого (например, "любое число" или "любое слово из пяти букв"). Рекомендуется добавить вспомогательные ключевые слова или включить форматирование в определение типа конфиденциальной информации пользовательской классификации.
  • Соответствие. Это поле указывает на дополнительные доказательства, обнаруженные в непосредственной близости от idMatch.
    • Соответствует. Укажите любое имя поля в схеме персональных данных для DataStore.
  • Ресурс. В этом разделе указываются имя и описание конфиденциального типа в нескольких языковых стандартах.
    • idRef: укажите GUID для ExactMatch ID.
    • Имена & описания: настройте по мере необходимости.

В приведенном ниже xml-примере пакета правил мы ссылаемся на pdm.xml пример файла из предыдущего шага, который создает XML-файл схемы персональных данных:

  • Хранилище данных. Имя dataStore ссылается на файл схемы, который мы создали ранее: dataStore = "PatientRecords".
  • idMatch: значение idMatch ссылается на поле, доступное для поиска, которое указано в файле pdm.xml, который мы создали ранее: idMatch соответствует = "SSN".
    • Классификация. Значение классификации ссылается на существующий или настраиваемый тип конфиденциальной информации: classification = "номер социального страхования США (SSN)". (В этом случае мы используем существующий тип конфиденциальной информации для номера социального страхования США.)

Создайте пакет правил в формате XML (с кодировкой Юникода), как показано в следующем примере кода. Этот пример можно скопировать, изменить и использовать.

<RulePackage xmlns="http://schemas.microsoft.com/office/2020/pdm">
 <RulePack id="fd098e03-1796-41a5-8ab6-198c93c62b21">
   <Version build="0" major="2" minor="0" revision="0" />
   <Publisher id="eb553734-8306-44b4-9ad5-c388ad970528" />
   <Details defaultLangCode="en-us">
     <LocalizedDetails langcode="en-us">
       <PublisherName>IP DLP</PublisherName>
       <Name>Health Care PDM Rulepack</Name>
       <Description>This rule package contains the Personal Data Match sensitive type for health care sensitive types.</Description>
     </LocalizedDetails>
   </Details>
 </RulePack>
 <Rules>
   <PrivacyMatch id = "E1CC861E-3FE9-4A58-82DF-4BD259EAB381" patternsProximity = "300" dataStore ="PatientRecords" recommendedConfidence = "65" >
     <Pattern confidenceLevel="65">
       <idMatch matches = "SSN" classification = "U.S. Social Security Number (SSN)" />
     </Pattern>
     <Pattern confidenceLevel="75">
       <idMatch matches = "SSN" classification = "U.S. Social Security Number (SSN)" />
       <Any minMatches ="3" maxMatches ="6">
         <match matches="PatientID" />
         <match matches="MRN"/>
         <match matches="FirstName"/>
         <match matches="LastName"/>
         <match matches="Phone"/>
         <match matches="DOB"/>
       </Any>
     </Pattern>
   </PrivacyMatch>
   <LocalizedStrings>
     <Resource idRef="E1CC861E-3FE9-4A58-82DF-4BD259EAB381">
       <Name default="true" langcode="en-us">Patient SSN Exact Match.</Name>
       <Description default="true" langcode="en-us">PDM Sensitive type for detecting Patient SSN.</Description>
     </Resource>
   </LocalizedStrings>
 </Rules>
</RulePackage>

Типы конфиденциальной информации

Второй этап настройки сопоставления данных — создание уникальных типов конфиденциальной информации для сопоставления персональных данных (PDM). Типы конфиденциальной информации (SIT) — это классификаторы на основе шаблонов, которые обнаруживают конфиденциальные сведения, такие как социальное обеспечение или кредитные карта номера. Настройка типа конфиденциальной информации PDM позволяет использовать точные значения данных, а не универсальные значения для обнаружения совпадений. Чтобы начать этот шаг, выберите Создать тип конфиденциальной информации PDM , чтобы запустить мастер создания.

Отправка персональных данных

После определения схемы персональных данных и типов конфиденциальной информации третьим шагом является отправка персональных данных. Перейдите на вкладку Отправка персональных данных , нажмите кнопку Добавить и выберите личную схему, определенную на первом шаге, а затем отправьте файл, содержащий персональные данные.

Вы можете отправить эти персональные данные, выбрав локальный файл или указав URL-адрес SAS в существующее служба хранилища Microsoft Azure расположение, содержащее файл ваших персональных данных. Если вы подготовили файл в качестве первого шага в этом процессе, который соответствует созданной схеме, его можно использовать для отправки.

Microsoft Priva юридическое заявление об отказе от ответственности