主旨權利要求的數據比對
透過數據比對,組織可以讓 Microsoft Priva 根據確切提供的數據值來識別數據主體。 這有助於提高數據主體內容的準確性,同時針對您的內部人員和與您互動的外部使用者找到與這些數據值相對應的數據主體內容。 它也簡化了建立主旨權利要求期間手動提供欄位的需求,並在主體權利要求和概觀磚中提供內容,以顯示您具有最多數據主體內容的專案。 若要深入瞭解該檢視,請參閱 在 Priva 中尋找及可視化個人資料。
若要使用數據比對功能,您必須是隱私權管理角色群組的成員。 從 [Microsoft檢視合規性入口網站中的 [Priva],選取上方導覽中的 [ 設定 ],然後選取 [數據比對]。 從這裡開始,您需要定義個人資料架構並提供個人資料上傳,如下所示。 請注意,您可以新增專案,而且可以刪除新增的專案,但無法修改專案。
準備數據匯入
在定義架構或上傳數據之前,您必須先識別數據主體資訊的來源。 必要檔案格式為 .csv,可由 Microsoft Excel 等應用程式讀取。 建立此導出結構,讓欄標題出現在第一列。 這些標題應該會包含您個人資料架構的屬性名稱。 檢查每個欄位中數據的格式。 如果有任何數據包含逗號,請以雙引弧括住這些值,以確保不會剖析成不同的欄位。
定義個人資料架構
設定數據比對的第一個步驟是定義個人資料架構,它會描述數據主體的屬性。 您將在資料相符設定區域的第一個索引標籤上傳此架構。 必要檔案包括 個人資料架構 XML 檔案和 規則套 件 XML 檔案。
個人資料架構 XML
個人資料架構檔案是一個 XML 檔案,可定義預期的數據行名稱。
- 將此架構檔案 命名pdm.xml。
- 使用 [功能變數名稱] 標籤定義每個欄的名稱,如下列範例所示。
- 針對您想要搜尋的欄位使用可搜尋 = “true”,最多五個字段。 至少必須要搜尋其中一個功能變數名稱。 範例語法:
\<Field name="" searchable=""/>
。 - 個人資料架構有 DataStore 卷標區段。 四個必要欄位必須對應到功能變數名稱:primaryKeyField、upnField、firstNameField、lastNameField。
例如,下列 XML 檔案定義範例架構,其中五個字段指定為可搜尋:PatientID、MRN、SSN、手機和 DOB。 primaryKeyField 對應至 PatientID,upnField 對應至 MRN,firstNameField 對應至 FirstName,而 lastNameField 對應至 LastName。
您可以複製、修改及使用我們的範例。
<PdmSchema xmlns="http://schemas.microsoft.com/office/2020/pdm">
<DataStore name="Patientrecords" description="Schema for patient records" version="1" primaryKeyField="PatientID" upnField="MRN" firstNameField="FirstName" lastNameField="LastName">
<Field name="PatientID" searchable="true"/>
<Field name="MRN" searchable="true" />
<Field name="FirstName" />
<Field name="LastName" />
<Field name="SSN" searchable="true" />
<Field name="Phone" searchable="true" />
<Field name="DOB" searchable="true" />
<Field name="Gender" />
<Field name="Address" />
</DataStore>
</PdmSchema>
規則套件 XML
設定規則套件時,請務必正確參照上述建立的個人資料架構檔案:pdm.xml。 在下列範例規則套件 XML 中,必須自定義下列欄位,才能建立數據比對機密類型:
- RulePack id & PrivacyMatch id:使用 New-GUID 產生 GUID。
- 數據存放區:此欄位指定要使用的個人資料比對查閱資料存放區。 提供已設定之個人資料架構的已定義DataStore名稱。
- idMatch:此字段會指向個人資料比對的主要元素。
- 相符專案:指定要用於確切查閱的欄位。 從個人資料架構提供可搜尋的功能變數名稱。
- 分類:此欄位指定觸發個人資料比對查閱的機密類型比對。 您可以提供現有內建或自定義機密資訊類型的名稱或 GUID。 為了避免造成效能問題,如果您在個人資料比對中使用自定義機密資訊類型做為 Classification 元素,請不要使用符合大量內容的自定義機密資訊類型 (,例如「任何數位」或「任何五個字母的字」) 。 建議您新增支持關鍵詞,或在自定義分類機密資訊類型的定義中加入格式設定。
- 相符:此欄位指向在 idMatch 附近找到的其他證據。
- 相符專案:在 DataStore 的個人資料架構中提供任何功能變數名稱。
- 資源:本節會針對多個地區設定中的機密類型指定名稱和描述。
- idRef:提供 EXACTMatch ID 的 GUID。
- 名稱 & 描述:視需要自定義。
在下面的規則套件 XML 範例中,我們參照了上一個步驟建立個人資料架構 XML 的 pdm.xml 範例檔案:
- Datastore:d ataStore 名稱參照我們先前建立的架構檔案:dataStore = “PatientRecords”。
- idMatch:idMatch 值會參照列出在我們先前建立之 pdm.xml 檔案中所列的可搜尋欄位:idMatch 會比對 = “SSN”。
- 分類:分類值會參照現有的或自定義的機密資訊類型:classification = “U.S. Social Security Number (SSN) ”。。 (在此情況下,我們會使用美國社會安全號碼.) 的現有機密資訊類型
以 XML 格式建立規則套件, (使用 Unicode 編碼) ,例如下列範例程式代碼。 您可以複製、修改及使用此範例。
<RulePackage xmlns="http://schemas.microsoft.com/office/2020/pdm">
<RulePack id="fd098e03-1796-41a5-8ab6-198c93c62b21">
<Version build="0" major="2" minor="0" revision="0" />
<Publisher id="eb553734-8306-44b4-9ad5-c388ad970528" />
<Details defaultLangCode="en-us">
<LocalizedDetails langcode="en-us">
<PublisherName>IP DLP</PublisherName>
<Name>Health Care PDM Rulepack</Name>
<Description>This rule package contains the Personal Data Match sensitive type for health care sensitive types.</Description>
</LocalizedDetails>
</Details>
</RulePack>
<Rules>
<PrivacyMatch id = "E1CC861E-3FE9-4A58-82DF-4BD259EAB381" patternsProximity = "300" dataStore ="PatientRecords" recommendedConfidence = "65" >
<Pattern confidenceLevel="65">
<idMatch matches = "SSN" classification = "U.S. Social Security Number (SSN)" />
</Pattern>
<Pattern confidenceLevel="75">
<idMatch matches = "SSN" classification = "U.S. Social Security Number (SSN)" />
<Any minMatches ="3" maxMatches ="6">
<match matches="PatientID" />
<match matches="MRN"/>
<match matches="FirstName"/>
<match matches="LastName"/>
<match matches="Phone"/>
<match matches="DOB"/>
</Any>
</Pattern>
</PrivacyMatch>
<LocalizedStrings>
<Resource idRef="E1CC861E-3FE9-4A58-82DF-4BD259EAB381">
<Name default="true" langcode="en-us">Patient SSN Exact Match.</Name>
<Description default="true" langcode="en-us">PDM Sensitive type for detecting Patient SSN.</Description>
</Resource>
</LocalizedStrings>
</Rules>
</RulePackage>
敏感性信息類型
設定數據比對的第二個步驟是建立個人資料 (PDM) 的唯一機密信息類型。 (SIT) 的機密資訊類型 ,是偵測身分證或信用卡號碼等機密資訊的模式型分類器。 設定 PDM 機密資訊類型可讓您使用精確的數據值,而非一般值來偵測相符專案。 若要開始此步驟,請選 取 [建立 PDM 機密資訊類型 ] 以啟動建立精靈。
上傳個人資料
定義個人資料架構和機密資訊類型之後,第三個步驟是上傳個人資料。 移至 [ 個人資料上傳] 索引 標籤,選取 [ 新增],然後選擇您在第一個步驟中定義的個人架構,然後上傳包含個人資料的檔案。
您可以選擇本機檔案,或將 SAS URL 提供給包含您個人資料檔案的現有 Microsoft Azure 儲存位置,藉此上傳此個人資料。 如果您準備的檔案是此程式中第一個符合所建立架構的步驟,您可以使用該檔案進行上傳。