分享方式:


快速入門:電子檔探索中的預測編碼 (進階版) (預覽版)

重要事項

經典的電子檔探索體驗已 於 2025 年 8 月 31 日淘汰。 此淘汰包括傳統內容搜尋、傳統電子檔探索 (Standard) ,以及傳統電子檔探索 (進階) 。 這些選項無法作為 Microsoft Purview 入口網站中的體驗選項使用。

除非您在針對特定短期轉換案例使用這些舊版功能時直接與 Microsoft 合作,否則請使用 Microsoft Purview 入口網站新電子檔探索體驗的指引。

本文提供在 Microsoft Purview 電子文件探索 (Premium) 中使用預測編碼的快速入門。 預測編碼模組使用智慧型機器學習功能來協助您剔除與調查無關的大量案例內容。 這是透過建立和訓練您自己的預測編碼模型來實現的,這些模型可協助您確定最相關的專案的優先順序以供檢閱。

以下是預測編碼過程的快速概述:

預測編碼的快速入門過程。

若要開始使用,您可以建立模型,將最少 50 個項目標記為相關或不相關。 然後,系統會使用此定型,將預測分數套用至檢閱集中的每個專案。 這可讓您根據預測分數篩選項目,讓您先檢閱最相關的 (或不相關的) 項目。 如果您想要訓練具有更高準確度和召回率的模型,您可以在後續的訓練輪次中繼續標記項目,直到模型穩定為止。 模型穩定之後,您可以套用最終預測篩選器,以排定要檢閱的項目的優先順序。

如需預測編碼的詳細概觀,請參閱 瞭解電子檔探索 (進階) 中的預測編碼

步驟 1:建立新的預測編碼模型

第一個步驟是在檢閱集中建立新的預測編碼模型:

  1. 在 Microsoft Purview 入口網站中,開啟電子檔探索 (進階版) 案例,然後選取 [ 檢閱集 ] 索引標籤。

  2. 開啟檢閱集,然後選取 [分析][管理>預測編碼] ([預覽) ]。

    選取檢閱集中的 [分析] 下拉式功能表,以移至 [ 預測編碼 ] 頁面。

  3. 預測編碼模型 (預覽) 頁面上,選取 新增模型

  4. 在飛出視窗頁面上,輸入模型的名稱和選擇性描述。

  5. 選取 [儲存] 以建立模型。

    系統需要幾分鐘的時間來準備您的模型。 準備就緒後,您可以進行第一輪訓練。

如需更詳細的指示,請參閱 建立預測編碼模型

第 2 步:執行第一輪訓練

建立模型之後,下一步是將項目標示為相關或不相關,以完成第一輪訓練。

  1. 開啟檢閱集,然後選取 [分析]>[管理預測編碼] ([預覽) ]。

  2. 在預測 編碼模型 (預覽) 頁面上,選取您要定型的模型。

  3. 在 [ 概觀 ] 索引標籤的 [第 1 輪] 底下,選取 [ 開始下一個訓練回合]。

    訓練」 標籤隨即顯示,其中包含 50 個項目供您標記。

  4. 檢閱每個文件,然後選取閱讀窗格底部的 [相關 ] 或 [ 不相關 ] 以標記它。

    將每個文件標記為相關或不相關。

  5. 標記所有 50 個項目之後,請選取 [完成]。

    系統需要幾分鐘的時間才能從您的標籤中「學習」並更新模型。 當此程序完成時,預測編碼模型 (預覽) 頁面上會顯示模型的就緒狀態

如需更詳細的指示,請參閱 定型預測編碼模型

步驟 3:將預測分數篩選套用至檢閱集中的專案

至少執行一輪訓練之後,您可以將預測分數篩選套用至檢閱集中的專案。 這可讓您檢閱模型預測為相關或不相關的項目。

  1. 開啟檢閱集。

    選取 [篩選] 以顯示 [篩選] 飛出視窗頁面。

    預先載入的預設篩選會顯示在檢閱集頁面頂端。 您可以將這些設定保留為「任何」。

  2. 選取 [篩選] 以顯示 [篩選] 飛出視窗頁面。

  3. 展開 Analytics & 預測編碼 區段以顯示一組篩選器。

    Analytics & 預測編碼區段中的預測分數篩選器。

    預測分數篩選器的命名慣例是 預測分數 (模型名稱) 。 例如,名為 模型 A 的模型的預測分數篩選器名稱是 模型 A (預測分數)

  4. 選取您要使用的預測分數篩選,然後選取 [完成]。

  5. 在檢閱集頁面上,選取預測分數篩選的下拉式清單,並輸入預測分數範圍的最小值和最大值。 例如,下列螢幕擷取畫面顯示介於 .51.0 之間的預測分數範圍。

    預測分數篩選的最小值和最大值。

  6. 選取篩選外部,以自動將篩選套用至檢閱集。

預測分數在您指定的範圍內的文件清單會顯示在檢閱集頁面上。

如需更詳細的指示,請參閱 將預測篩選套用至檢閱集

第 4 步:進行更多訓練輪次

您很可能必須執行更多訓練輪次,才能訓練模組,以更好地預測檢閱集中的相關和不相關專案。 一般而言,您將訓練模型足夠的次數,直到它穩定到足以滿足您的需求為止。

如需詳細資訊,請參閱 執行其他訓練輪次

步驟 5:套用最終預測分數篩選器以排定審查的優先順序

重複步驟 3 中的指示,將最終預測分數套用至檢閱集,以在完成所有訓練輪次並穩定模型之後,排定相關和不相關專案檢閱的優先順序。