分享方式:


建立 EDM SIT 範例檔案 (新體驗)

建立和提供資料完全相符 (EDM) 型敏感性資訊類型 (SIT) 是一個多階段過程。 它們可用於 Microsoft Purview 數據外洩防護原則、電子檔探索和特定內容控管工作。

提示

如果您不是 E5 客戶,請使用 90 天的 Microsoft Purview 解決方案試用版來探索其他 Purview 功能如何協助貴組織管理數據安全性與合規性需求。 立即從 Microsoft Purview 合規性入口網站 試用中樞開始。 瞭解 有關註冊和試用版條款的詳細數據

適用於

  • 新體驗

如果您想要使用傳統體驗建立EDM SIT,請參閱 建立EDM SIT傳統體驗

開始之前

格式化範例檔案

系統會從範例檔案擷取數據行名稱來建立架構,並建議基底 SIT 將範例字段數據對應至其中。 其格式必須與您的來源敏感性資訊數據表檔案相同,而且應該包含代表實際數據的綜合值。 檔案可以 儲存 .csv(逗號分隔值) 、 .tsv (tab 分隔值) ,或管線分隔 () | 格式,但應該與實際的來源敏感性資訊數據表檔案相同。 如果您的數據值包含逗號,例如街地道址,建議使用 .tsv 格式。

  • 使用大約 10-20 個數據列的數據,以確保系統有足夠的範例可供使用。
  • 包含逗號的域值必須以引號括住
  • 第一個數據列必須是標頭數據列,且包含數據行名稱。
  • 檔案必須包含至少一個數據列。
  • 每個數據列都必須包含與標頭對應的正確欄位數目。
  • 範例檔案最多可以包含 32 個數據行。
  • 範例檔案的大小不能超過 2.5 MB。
  • 欄位 (字段) 名稱必須以字母開頭、長度至少為三個字元,且只包含 (A-Z、a-z、0-9) 的英數位元,且不能包含空格、底線或其他特殊字元。

例如,如果您的實際數據使用索引標籤分隔 (.tsv) 格式,如下所示:

顯示索引標籤分隔數據表的影像,其中包含四個數據行和三個數據列的人工實例數據

然後,您的範例檔案必須具有相同的數據行標頭,但針對數據列使用綜合值,如下所示

FirstName LastName PatientNumber CreditCardNumber
埃裡克 所羅 門 987-65-4321 9000000000000000
麗莎 泰勒 123-45-6789 500000000000000
安德列 勞森 234-56-7890 200000000000000

如何使用範例檔案範本

如果您位於美國醫療保健、美國金融服務或美國保險業垂直,您可以從下列範例檔案範本開始,以加速檔案建立程式範例。 這些檔案包含各產業中最常用的數據行標頭,以及欄位中的綜合值。

若要使用這些範本:

  1. 下載您產業的範例檔案範本。
  2. 比較範本中的數據行標頭與實際的源數據,並挑選您想要在自定義範例檔案中作為主要字段的數據。
  3. 比較實際源數據的格式與綜合值的格式設定。 變更綜合值的格式設定,以符合源數據值的格式設定。
  4. 儲存自定義的範例檔案,以在 建立EDM SIT架構和規則套件時使用。

提示

在新的體驗中工作時,您可以選擇上傳範例檔案,或手動輸入範例檔案值。 建議您建立範例檔案。

下一步