建立掃描規則集

在 Microsoft Purview 目錄中,您可以建立掃描規則集,讓您可以快速掃描組織中的資料來源。

掃描規則集是將一組掃描規則群組在一起的容器,讓您可以輕鬆地將它們與掃描產生關聯。 例如,您可以為每個資料來源類型建立預設掃描規則集,然後依預設針對公司內的所有掃描使用這些掃描規則集。 您也可能希望具有正確許可權的使用者根據商務需求,建立具有不同設定的其他掃描規則集。

建立掃描規則集的步驟

若要建立掃描規則集:

  1. 從您的 Azure Microsoft Purview 治理入口網站中,選取 [資料對應]

  2. 從左窗格選取 [掃描規則集 ],然後選取 [ 新增]

  3. 從 [ 新增掃描規則集] 頁面,從 [ 來源類型 ] 下拉式清單中選取目錄掃描器支援的資料來源。 您可以為您想要掃描的每種資料來源類型建立掃描規則集。

  4. 為掃描規則集命名。 最大長度為 63 個字元,不允許空格。 選擇性地輸入 描述。 最大長度為 256 個字元。

    顯示 [掃描規則集] 頁面的螢幕擷取畫面。

  5. 選取 [繼續]

    [ 選取檔案類型] 頁面隨即出現。 請注意,此頁面上的檔案類型選項會根據您在上一頁上選擇的資料來源類型而有所不同。 預設會啟用所有檔案類型。

    顯示 [選取檔案類型] 頁面的螢幕擷取畫面。

    此頁面上的 [檔檔案類型 ] 選取專案可讓您包含或排除下列 Office 檔案類型:.doc、 .docm、.docx、.dot、.odp、.ods、.odt、.pdf、.pot、.pps、.ppsx、.ppt、.pptm、.pptx、.xlc、.xls、.xlsb、.xlsm、.xlsx 和 .xlt。

  6. 選取或清除其核取方塊,以啟用或停用檔案類型磚。 如果您選擇 Data Lake 類型資料來源 (例如,Azure Data Lake Storage Gen2或 Azure Blob) ,請啟用您想要擷取和分類架構的檔案類型。

  7. 針對特定資料來源類型,您也可以 建立自訂檔案類型

  8. 選取 [繼續]

    [ 選取分類規則] 頁面隨即出現。 此頁面會顯示選取的 [系統規則 ] 和 [ 自訂規則],以及選取的分類規則總數。 預設會選取所有 系統規則 核取方塊

  9. 針對您想要包含或排除的規則,您可以依類別全域選取或清除 [系統規則 分類規則] 核取方塊。

    顯示 [選取分類規則] 頁面的螢幕擷取畫面。

  10. 您可以展開類別節點,然後選取或清除個別核取方塊。 例如,如果 阿根廷的規則 DNI 數位 有高誤判,您可以清除該特定核取方塊。

    顯示如何選取系統規則的螢幕擷取畫面。

  11. 取 [建立 ] 以完成掃描規則集的建立。

建立自訂檔案類型

Microsoft Purview 支援新增自訂延伸模組,並在掃描規則集中定義自訂資料行分隔符號。

若要建立自訂檔案類型:

  1. 請遵循步驟中的步驟 1–5 來建立掃描規則集 ,或編輯現有的掃描規則集。

  2. 在 [ 選取檔案類型 ] 頁面上,選取 [新增檔案類型 ] 以建立新的自訂檔案類型。

    顯示如何從 [選取檔案類型] 頁面選取 [新增檔案類型] 的螢幕擷取畫面。

  3. 輸入 副檔名 和選擇性的 [描述]

    顯示 [新增自訂檔案類型] 頁面的螢幕擷取畫面。

  4. 針對 內的 [檔案] 內容 進行下列其中一個選取,以指定檔案內的檔內容類型:

    • 取 [自訂分隔符號 ],然後輸入您自己的 自訂分隔符號 (僅限單一字元) 。

    • 取 [系統檔案類型 ],然後從 [系統檔案類型] 下拉式清單中選擇系統 檔案類型 (例如 XML) 。

  5. 取 [建立 ] 以儲存自訂檔案。

    系統會返回 [ 選取檔案類型 ] 頁面,並將新的自訂檔案類型插入為新的磚。

    顯示 [選取檔案類型] 頁面上新自訂檔案類型圖格的螢幕擷取畫面。

  6. 如果您想要變更或刪除新檔案類型磚,請選取 [ 編輯 ]。

  7. 選取 [繼續 ] 以完成掃描規則集的設定。

忽略模式

Microsoft Purview 支援定義正則運算式 (RegEx) ,以在掃描期間排除資產。 在掃描期間,Microsoft Purview 會比較資產的 URL 與這些正則運算式。 掃描時,將會忽略所有符合所提及之任何 RegExes 的資產。

[ 忽略模式] 刀鋒 視窗會預先填入一個 Spark 交易檔案的 Regex。 如果不需要,您可以移除預先存在的模式。 您最多可以定義 10 個忽略模式。

顯示 [忽略模式] 刀鋒視窗的螢幕擷取畫面,其中包含四個已定義的正則運算式。第一個為預先填入的 Spark 交易 RegEx,第二個為 \\.txt$,第三個為 \\.csv$,最後是 .folderB/.*。

在上述範例中:

  • Regexes 2 和 3 會忽略掃描期間以 .txt 和 .csv 結尾的所有檔案。
  • Regex 4 會在掃描期間忽略 /folderB/ 及其所有內容。

以下是您可以用來忽略模式的一些其他秘訣:

  • 處理 RegEx 時,Microsoft Purview 預設會將 $ 新增至 RegEx。

  • 若要瞭解掃描代理程式將與您的正則運算式比較的 URL,一個好方法是流覽 Microsoft Purview 資料目錄、尋找您想要在未來忽略的資產,以及在 [概 ] 索引標籤中查看其完整名稱 (FQN) 。

    顯示資產 [概觀] 索引標籤上完整名稱的螢幕擷取畫面。

系統掃描規則集

系統掃描規則集是針對每個 Microsoft Purview 目錄自動建立的 Microsoft 定義掃描規則集。 每個系統掃描規則集都與特定資料來源類型相關聯。 當您建立掃描時,可以將它與系統掃描規則集產生關聯。 每次 Microsoft 更新這些系統規則集時,您都可以在目錄中更新它們,並將更新套用至所有相關聯的掃描。

  1. 若要檢視系統掃描規則集的清單,請選取[管理中心] 中的 [掃描規則集],然後選擇 [系統] 索引標籤。

    顯示系統掃描規則集清單的螢幕擷取畫面。

  2. 每個系統掃描規則集都有 [名稱]、[ 來源類型] 和 [ 版本]。 如果您在 [版本] 資料行中選取掃描規則集的版本號碼,您會看到與目前版本相關聯的規則,如果有任何) ,則會 (舊版。

    顯示系統掃描規則集頁面的螢幕擷取畫面。

  3. 如果系統掃描規則集有可用的更新,您可以在 [版本] 資料行中選取 [更新]。 在系統掃描規則頁面中,從 [ 選取新版本以更新 ] 下拉式清單中選擇版本。 此頁面提供與新版本和目前版本相關聯的系統分類規則清單。

    顯示如何變更系統掃描規則集版本的螢幕擷取畫面。

建立掃描與系統掃描規則集的關聯

當您 建立掃描時,可以選擇將它與系統掃描規則集產生關聯,如下所示:

  1. 在 [ 選取掃描規則集] 頁面上,選取系統掃描規則集。

    顯示如何選取掃描系統掃描規則集的螢幕擷取畫面。

  2. 選取 [繼續],然後選取 [ 儲存並執行]