分享方式:


測試與敏感性資訊類型完全相符的資料

提示

如果您不是 E5 客戶,請使用 90 天Microsoft Purview 解決方案試用版來探索其他 Purview 功能如何協助貴組織管理數據安全性與合規性需求。 立即從 Microsoft Purview 合規性入口網站 試用中樞開始。 瞭解 有關註冊和試用版條款的詳細數據

適用於

在您的確切數據符合 (EDM) 敏感性資訊類型 (SIT) 之後,以及確認敏感性資訊數據表已完成上傳和編製索引的一小時后,您可以使用 Microsoft Purview 合規性入口網站的 [敏感性資訊類型] 區段中的 Test 函式來測試是否偵測您想要保護的資訊。

注意事項

現有EDM SIT中的變更可能需要一些時間才能傳播到整個系統。 如果您要變更 EDM SIT 以針對偵測問題進行疑難解答,請務必在進行這些變更之後至少等候一小時,再使用 Test 函式來驗證其影響。

不論您用於測試的方法為何,測試結果都會包含特定EDM SIT和針對該EDM SIT 設定之主要元素的相符專案。

測試 EDM SIT 的方法

您可以使用兩種方法來測試EDM SIT。

方法 可在新的EDM體驗中使用 適用於全新和傳統EDM體驗
SIT) 方法 (敏感性資訊類型
EDM 分類器方法

注意事項

如果您使用傳統EDM體驗,則必須使用SIT方法。

使用敏感性資訊類型方法測試EDM SIT

若要使用 敏感性資訊類型 方法測試EDM SIT,請採取下列步驟。

針對您使用的入口網站選取適當的索引標籤。 若要深入瞭解 Microsoft Purview 入口網站,請 參閱 Microsoft Purview 入口網站。 若要深入瞭解合規性入口網站,請參閱 Microsoft Purview 合規性入口網站

  1. 登入 Microsoft Purview 入口網站>資訊保護>Classifiers>敏感性信息類型

  2. 從清單中選取您的EDM SIT,然後選取 [測試] 圖示。

  3. 在飛出視窗窗格中,上傳包含您想要偵測之數據的檔案。 例如,建立檔案,其中包含敏感性信息數據表中的數據列子集。 如果您在架構中使用 可設定的比 對功能來定義忽略的分隔符,請確定範例檔案包含具有和不含這些分隔符的範例。

  4. 選擇 [測試]

  5. 上傳並掃描檔案之後,請檢查 EDM SIT 的相符項目。

  6. 如果 SIT 中的 Test 函式偵測到相符專案,請確認 SIT 並未修剪它,或是不正確地擷取相符的專案。 常見問題包括下列的 SIT:

    • 只擷取應該偵測到之完整字串的子字串
    • 只挑選多字字串中的第一個字
    • 在擷取中包含額外的符號或字元

如需使用正則表達式的詳細資訊,請參閱 正則表達式語言 - 快速參考

使用 EDM 分類器方法測試您的 EDM SIT

針對您使用的入口網站選取適當的索引標籤。 若要深入瞭解 Microsoft Purview 入口網站,請 參閱 Microsoft Purview 入口網站。 若要深入瞭解合規性入口網站,請參閱 Microsoft Purview 合規性入口網站

  1. 登入 Microsoft Purview 入口網站>資訊保護>Classifiers>EDM 分類器

  2. 請確定 [新增 EDM 體驗 ] 切換已設定為 [ 開啟]

  3. 從清單中選取您的EDM SIT,然後選取 [測試] 圖示。

  4. 上傳包含您想要偵測之數據的檔案。 例如,建立檔案,其中包含敏感性信息數據表中的數據列子集。 如果您在架構中使用 可設定的 比對功能來定義忽略的分隔符,請確定您的範例檔案包含具有和不含這些分隔符的範例。

  5. 上傳並掃描檔案之後,請檢查 EDM SIT 的相符項目。

  6. 如果 SIT 中的 Test 函式偵測到相符專案,請確認 SIT 並未修剪它,或是不正確地擷取相符的專案。 常見問題包括下列的 SIT:

    • 只擷取應該偵測到之完整字串的子字串
    • 只挑選多字字串中的第一個字
    • 在擷取中包含額外的符號或字元

使用 PowerShell 測試您的 EDM SIT

若要使用PowerShell進行測試,請使用下列PowerShell Cmdlet:

Test-DataClassification  -ClassificationNames “[Your EDM sensitive info type]” -TexttoClassify “[your own text to scan for matches]” 

不論您用於測試的方法為何,測試結果都會包含特定EDM SIT和針對該EDM SIT 設定之主要元素的相符專案。

注意事項

當您建立或編輯 EDM 敏感性資訊類型或 EDM 類型所依據的主要 SIT 時,會針對符合新定義的內容編目所有新內容 (以及變更 SIT 之後修改的內容) 。 不過,在修改或重新編製索引之前,不會編目預先存在的內容。

若要強制重新編目 SharePoint 網站或文檔庫中的現有內容,或在 OneDrive 中,請遵循 手動要求網站、文檔庫或清單的編目和重新編製索引中的指示。

使用資訊保護原則測試您的EDM SIT

您可以在原則中使用EDM SIT,以查看EDM SIT的使用位置,以及它在生產環境中的精確度:

  1. 建立自動標籤原則,並在 [模擬概觀] 中執行。

  2. 將一些將觸發EDM SIT的內容,以及不會觸發EDM SIT的內容,新增到您原則正在監視的位置。

  3. 開啟 [要檢閱的項目] 以檢查符合專案。

  4. 適當調整您的原則。

當您滿意測試和微調的結果之後,以EDM為基礎的自定義SIT就已準備好用於資訊保護原則,例如:

疑難排解提示

如果您的EDM SIT偵測不到資料中的任何相符專案,下列秘訣可能有助於您診斷問題。

問題 疑難排解秘訣
找不到相符專案 使用雜湊並上傳敏感性資訊來源表格,以取得資料完全相符資訊類型中說明的命令確認您的敏感性資料正確上傳。
找不到相符專案 測試您在每個模式中設定主要元素時所使用的 SIT。 這項測試會驗證 SIT 是否可以符合專案中的範例。 使用定義不正確的 SIT 作為 EDM SIT 的分類元素,是 EDM 中偵測失敗的最常見原因。
您在 EDM 類型中為主要元素選取的 SIT 在專案中找不到相符專案,或尋找比您預期少的相符專案 確認 SIT 支援內容中發生的分隔符和分隔符。 請務必在結構描述中包含定義的忽略分隔符號。
與主要元素相關聯的 SIT 會在您的內容中尋找相符專案,但 EDM SIT 則不會。
  • 檢查您的 REGEX 語句是否在您想要偵測的項目開頭或結尾攔截空格分隔符。 例如,尋找包含分隔符的 \s 語句。 如果包含空格分隔符,空格符將不符合數據表中的哈希值。 請改用單字分隔符,例如 \b
  • 檢查您的 REGEX 語句,以確保它們擷取您想要偵測的整個字串,而不只是子字串。 例如,針對電子郵件地址考慮此模式: \b[a-zA-Z]{2,30}@[a-zA-Z]{2,20}.[a-zA-Z]{2,3}\b。 此模式會正確比對 user@contoso.com,但只會以不完整的形式擷取 user@contoso.co.jp
具有主要元素但未定義次要元素的EDM SIT會偵測專案,但不會偵測 (相符專案,或在需要主要和次要專案時偵測比對) 少於預期的相符專案。 如果用於次要辨識項之數據行中的值不是由單一字組或不包含空格、逗號或其他文字分隔符的字串所組成,則有兩種方式可以測試:
  1. 選取 多重令牌比對 選項。
  2. 將值與 SIT 產生關聯,該 SIT 使用設計來偵測遵循所需模式的多字字串 (例如,以大寫字元開頭的固定連續字數) ,或列出該數據行中所有唯一值的關鍵詞字典。 例如,如果個人的城市或居住區有額外的辨識項數據行,您可以建立具有數據表中所有唯一城市名稱的清單,然後使用它來建立以字典為基礎的敏感性信息類型。

使用此 SIT 作為 EDM SIT 中對應資料行的分類元素,方法是匯出和編輯 XML 中的 EDM SIT 定義。 如需詳細資訊,請 參閱手動建立規則套件
SIT 測試函式完全不會偵測到任何相符專案。 確認您選取的 SIT 包含其他關鍵字或其他驗證的需求。 針對內建 SIT,請參閱 敏感性資訊類型實體定義 ,以判斷比對每個類型的最小需求。
測試功能可運作,但未在 DLP 或自動套用標籤規則中偵測到您的 SharePoint 或 OneDrive 專案 確認您預期在 中找到相符專案的文件實際顯示在內容總管中。 只有在套用 SIT 變更 之後 所建立的內容中,才會偵測到相符專案。 因此,如果未出現預期的相符專案,請針對任何預先存在的專案重新編目網站和連結庫。 如需重新編目 SharePoint 和 OneDrive 的詳細資訊,請 參閱手動要求網站、文檔庫或清單的編目和重新編製索引。
需要多個相符專案的 DLP 或自動套用標籤規則不會觸發 請確定符合 EDM SIT 和基底 SIT 的鄰近需求。 例如,如果主要元素與支援關鍵詞之間的最大距離是 300 個字元,但關鍵詞只存在於長數據表的第一個數據列中,則只有前幾個相符值的數據列可能符合鄰近需求。 修改您的 SIT 定義以支援更寬鬆的鄰近性規則,或針對其他辨識項條件使用 [檔中的任何 位置] 選項。
偵測EDM SIT不一致或不穩定 請確定您用來作為 EDM SIT 中主要元素基底的 SIT 不會偵測到不必要的內容。 使用符合太多不相關內容的 SIT,例如 任何 單字、 任何 數位或 所有 電子郵件位址,都可能導致服務忽略相關的相符專案。 檢查 [內容總管] 中用於主要元素之敏感性類型的內容片段數目。

若要估計 SIT 是否比對太多內容:
  1. 將 Microsoft Purview 內容總管中的內容項目數除以建立敏感性類型後的天數。
  2. 如果每天的相符項目數目在數十萬或以上的範圍內,則主要 SIT 可能過於廣泛。

如需針對EDM SIT 選取正確敏感性資訊類型的建議和最佳做法,請參閱 瞭解以精確數據比對為基礎的敏感性資訊類型