分享方式:


敏感性資訊類型 REGEX 驗證程式和其他檢查

重要事項

Microsoft 客戶服務及支援無法協助您建立自訂分類或規則運算式模式。 支持工程師可以提供有限的功能支援,例如提供測試功能的範例正則表示式模式,或協助針對未如預期觸發的現有正則表達式模式進行疑難解答。 不過,支援工程師無法確保任何自定義內容比對開發都符合您的需求或義務。

提示

如果您不是 E5 客戶,請使用 90 天的 Microsoft Purview 解決方案試用版來探索其他 Purview 功能如何協助貴組織管理數據安全性與合規性需求。 立即從 Microsoft Purview 合規性入口網站 試用中樞開始。 瞭解 有關註冊和試用版條款的詳細數據

敏感性資訊類型正則表示式驗證程式

總和檢查碼驗證程式

若要對正則表示式中的數字執行總和檢查碼,您可以使用 總和檢查碼驗證程式。 例如,如果您需要為八位數授權號碼建立 SIT,其中最後一個數位是使用 mod 9 計算驗證的總和檢查碼數位,請設定總和檢查碼演算法,如下所示:

Sum = digit 1 * Weight 1 + digit 2 * weight 2 + digit 3 * weight 3 + digit 4 * weight 4 + digit 5 * weight 5 + digit 6 * weight 6 + digit 7 * weight 7 + digit 8 * weight 8
Mod value = Sum % 9
If Mod value == digit 8
    Account number is valid
If Mod value != digit 8
    Account number is invalid
  1. 使用這個正規表示式定義主要元素:

    \d{8}
    
  2. 新增總和檢查碼驗證程式。

  3. 新增以逗號分隔的加權值、檢查數位的位置,以及mod值。 如需模數作業的詳細資訊,請參閱 模數作業

    注意事項

    如果檢查數位不是總和檢查碼計算的一部分,請使用 0 做為檢查數位的加權。 例如,在上一個案例中,如果檢查數位不會用於計算複選數位,加權 8 會等於 0。

    已設定總和檢查碼驗證程序的螢幕快照。

日期驗證程式

如果內嵌在正則表示式中的日期值是您要建立之新模式的一部分,您可以使用 日期驗證程式 來測試該日期值是否符合您的準則。 例如,您想要為九位數的員工標識碼建立 SIT。 前六個數位是 DDMMYY 格式的雇用日期,最後三個數位是隨機產生的數位。 請採取下列步驟來驗證前六個數位的格式是否正確:

  1. 使用這個正規表示式定義主要元素:

    \d{9}
    
  2. 新增日期驗證程式。

  3. 選取日期格式和開始位移。 因為日期字串是前六個數位,所以位移是 0

    已設定日期驗證程式的螢幕快照。

作為驗證程式的功能處理器

您可以針對一些最常用的 SIT 使用函式處理器作為驗證程式。 使用函式處理器可讓您定義自己的正則表達式,同時確保它們通過 SIT 所需的額外檢查。 例如,Func_India_Aadhar確保您定義的自定義正則表示式會通過印度 Aadhar 卡片所需的驗證邏輯。 如需可用來作為驗證程式之 DLP 函式的詳細資訊,請參閱 敏感性資訊類型函式

Luhn 檢查驗證程式

如果您有包含正則表達式的自定義敏感性資訊類型,而正則表示式應該傳遞 Luhn 演算法,您可以使用 Luhn 檢查驗證程式。

敏感性資訊類型其他檢查

以下是可用其他檢查的定義和一些範例。

排除特定相符專案:這項檢查可讓您在偵測您所編輯模式的相符專案時,定義要排除的關鍵詞。 例如,您可以排除測試信用卡號碼 (例如 '4111111111111111'),讓這些號碼無法相符為有效的號碼。

以字元開頭或不以字元開頭:這項檢查可讓您定義相符項目必須或不能以哪些字元開頭。 例如,如果您希望模式只偵測開頭為 41、42 或 43 的信用卡號碼,請選取 [開頭為],然後新增 41、42 和 43 到清單中,以逗號分隔。

以字元結束或不以字元結束:這項檢查可讓您定義相符項目必須或不能以哪些字元結束。 例如,如果您的員工識別碼的結尾不能是 0 或 1,請選取 [結尾不是],然後新增 0 和 1 到清單中,以逗號分隔。

排除重複字元:此檢查可讓您忽略所有數字都相同的相符項目。 例如,如果六位數的員工識別碼不能使用所有數字都相同的識別碼,您可以選取 [排除重複字元],從員工識別碼的有效相符項目清單中排除 111111、222222、333333、444444、555555、666666、777777、888888、999999 和 000000。

包含或排除首碼:此檢查可讓您定義在相符實體之前必須立即找到或不能立即找到的關鍵字。 根據您的選項,如果實體前面有您在這裡指定的首碼,則實體會相符或不相符。 例如,如果您 排除 前置 詞 GUID:,前面加上 GUID 的任何實體: 將不相符。

包含或排除尾碼:此檢查可讓您定義在相符實體之後必須立即找到或不能立即找到的關鍵字。 根據您的選擇,如果實體後面接著您在此處包含的後綴,則實體會相符或不相符。 例如,如果您 排除 後綴 :GUID,則後面接著 :GUID 的任何文字都不會相符。