共用方式為


在資料對應中建立掃描規則集

在 Microsoft Purview 資料對應中,您可以建立掃描規則集,讓您自定義組織中的資料來源掃描

掃描規則集是將一組掃描規則分組在一起的容器,以便您可以輕鬆地將它們與掃描相關聯。 例如,您可以為每一個資料來源類型建立預設掃描規則集,然後依預設對公司內的所有掃描使用這些掃描規則集。 您可能也希望具有適當權限的使用者,根據業務需求建立具有不同組態的其他掃描規則集。

建立掃描規則集的步驟

若要建立掃描規則集:

  1. 在 Microsoft Purview 入口網站中,選取 [ 數據對應 解決方案]。

  2. 在 [ 來源管理 ] 區段下,選取 [掃描規則集],然後選取 [ 新增]。

  3. 「新增掃描規則集 」頁面中,從「 來源類型 」下拉式清單中選取目錄掃描器支援的資料來源。 您可以為要掃描的每種資料來源類型建立掃描規則集。

  4. 輸入掃描規則集的 名稱 。 長度上限為 63 個字元,不允許空格。 或者,輸入 描述。 最大長度為 256 個字元。

  5. 選取網域。

    重要事項

    您只能在建立掃描規則的網域中使用掃描規則集。

  6. 選取 [繼續]

    選取 檔案類型 頁面隨即顯示。 請注意,此頁面上的檔案類型選項會根據您在上一頁上選擇的資料來源類型而有所不同。 預設情況下,所有檔案類型都處於啟用狀態。

    顯示 [選取檔案類型] 頁面的螢幕擷取畫面。

    此頁面上的 [文件檔案類型] 選項可讓您包含或排除下列辦公室檔案類型: .doc; .docm; .docx; .dot; .odp; .ods; .odt; .pdf; .pot; .pps; .ppsx; .ppt; .pptm; .pptx; .xlc; .xls; .xlsb; .xlsm; .xlsx; xlt

  7. 選取或清除綱目和分類的檔案類型,以啟用或停用其核取方塊。 如果您選擇 Data Lake 類型的資料來源 (例如 Azure Data Lake Storage Gen2 或 Azure Blob) ,請啟用您想要擷取和分類結構描述的檔案類型。

    重要事項

    取消選取檔案類型 並不 表示不會擷取檔案類型。 檔案的資訊仍會擷取,但不會擷取其結構描述和分類。

  8. 對於某些資料來源類型,您也可以 建立自訂檔案類型

  9. 選取 [繼續]

    選取 分類規則 頁面隨即顯示。 此頁面會顯示選取的 系統規則自訂規則,以及選取的分類規則總數。 依預設,會選取所有 系統規則 核取方塊

  10. 對於您要包含或排除的規則,您可以選取或清除 系統規則 分類規則 依類別全域核取方塊。

    顯示 [選取分類規則] 頁面的螢幕擷取畫面。

  11. 您可以展開種類節點,並選取或清除個別核取方塊。 例如,如果 Argentina.DNI 號碼 的規則有高誤報,您可以清除該特定核取方塊。

    螢幕擷取畫面顯示如何選取系統規則。

  12. 選取 建立 以完成掃描規則集的建立。

建立自訂檔案類型

Microsoft Purview 支援在掃描規則集中新增自訂延伸模組,以及定義自訂資料行分隔符號。

若要建立自訂檔案類型:

  1. 請依照步驟中的步驟 1-5 建立 掃描規則集 或編輯現有的掃描規則集。

  2. [ 選取檔案類型 ] 頁面上,選取 [新增檔案類型 ] 以建立新的自訂檔案類型。

    螢幕擷取畫面顯示如何從 [選取檔案類型] 頁面選取 [新增檔案類型]。

  3. 輸入副 檔名 和選用的 描述

    顯示 [新增自訂檔案類型] 頁面的螢幕擷取畫面。

  4. 針對 [ 檔案內容 ] 進行下列其中一個選取,以指定檔案內的檔案內容類型:

    • 選取 自訂分隔符號 並輸入您自己的 自訂分隔符號 ( 僅) 單一字元。

    • 選取 [系統檔案型別 ],然後從 [系統檔案型別 ] 下拉式清單中選擇系統檔案型別 (例如 XML) 。

  5. 選取 建立 以儲存自訂檔案。

    系統會返回 [選取檔案類型 ] 頁面,並將新的自訂檔案類型插入為新的磚。

    螢幕擷取畫面顯示 [選取檔案類型] 頁面上的新自訂檔案類型磚。

  6. 如果您想要變更或刪除新檔案類型磚,請選取 [編輯]。

  7. 選取 繼續以 完成設定掃描規則集。

忽略模式

Microsoft Purview 支援定義規則運算式 (規則運算式) ,以在掃描期間排除資產。 在掃描期間,Microsoft Purview 會將資產的 URL 與這些規則運算式進行比較。 掃描時,所有與上述任何正則表達式相符的資產都將被忽略。

[ 忽略型樣] 窗格會預先填入 Spark 交易檔案的一個規則運算式。 如果不需要,您可以移除預先存在的模式。 您最多可以定義 10 個忽略型樣。

螢幕擷取畫面顯示具有四個已定義的規則運算式的忽略模式刀鋒視窗。第一個是預先填入的 spark 交易正則表達式,第二個是 \\.txt$,第三個是 \\.csv$,最後是 .folderB/.*。

在上面的範例中:

  • 正則表達式 2 和 3 在掃描期間會忽略所有以 .txt 結尾的檔案和 .csv。
  • Regex 4 在掃描期間忽略 /folderB/ 及其所有內容。

以下是您可以用來忽略模式的更多提示:

  • 處理規則運算式時,Microsoft Purview 預設會將 $ 新增至規則運算式。

  • 要瞭解掃描代理程式將與您的正規表示式進行比較的 URL,一個好方法是瀏覽Microsoft Purview 整合式目錄,尋找您未來要忽略的資產,並在 概 索引標籤中查看其完整名稱 (FQN) 。

    螢幕擷取畫面顯示資產概觀索引標籤上的完整名稱。

系統掃描規則集

系統掃描規則集是 Microsoft 定義的掃描規則集,會針對每個 Microsoft Purview 目錄自動建立。 每一個系統掃描規則集都與特定資料來源類型相關聯。 建立掃描時,您可以將它與系統掃描規則集相關聯。 每次 Microsoft 更新這些系統規則集時,您都可以在目錄中更新它們,並將更新套用至所有相關聯的掃描。

  1. 若要檢視系統掃描規則集的清單,請在 管理中心 中選取掃描規則集,然後選擇系統索引標籤。

    顯示系統掃描規則集清單的螢幕擷取畫面。

  2. 每個系統掃描規則集都有「名稱」、「來源類型」和「版本」。 如果您在 「版本」 欄中選取掃描規則集的版本號碼,您會看到與目前版本和先前版本相關聯的規則,如果有的話, () 。

    顯示系統掃描規則集頁面的螢幕擷取畫面。

  3. 如果系統掃描規則集有可用的更新,您可以在版本欄中選取更新。 在系統掃描規則頁面中,從 選取要更新的新版本 下拉式清單中選擇版本。 此頁面提供與新版本及現行版本相關聯的系統分類規則清單。

    螢幕擷取畫面顯示如何變更系統掃描規則集的版本。

將掃描與系統掃描規則集建立關聯

當您建立掃描時,您可以選擇將它與系統掃描規則集相關聯,如下所示:

  1. [選取掃描規則集 ] 頁面上,選取系統掃描規則集。

    螢幕擷取畫面顯示如何選取掃描的系統掃描規則集。

  2. 選取 [繼續],然後選取 [儲存並執行]。