將預測性編碼模型定型 (預覽)

在 Microsoft Purview 電子文件探索 (Premium) 中建立預測性程式代碼撰寫模型之後,下一個步驟是執行第一個訓練回合,以針對您檢閱集中的相關內容和非相關內容來定型模型。 完成第一輪定型之後,您可以執行後續的訓練回合,以改善模型預測相關和非相關內容的能力。

若要檢閱預測性編碼工作流程,請參閱 瞭解 eDiscovery (Premium) 中的預測性編碼

提示

如果您不是 E5 客戶,請使用 90 天的 Microsoft Purview 解決方案試用版來探索其他 Purview 功能如何協助貴組織管理數據安全性與合規性需求。 立即從 Microsoft Purview 合規性入口網站 試用中樞開始。 瞭解 有關註冊和試用版條款的詳細數據

在定型模型之前

  • 在定型回合期間,根據文件中內容的相關性,將項目標示為 [ 相關 ] 或 [ 不相關 ]。 請勿根據元數據欄位中的值來決定。 例如,針對電子郵件訊息或 Teams 交談,請勿將您的標籤決策以郵件參與者為基礎。

第一次定型模型

  1. 在 Microsoft Purview 合規性入口網站 中,開啟 eDiscovery (Premium) 案例,然後選取 [檢閱集] 索引卷標。

  2. 開啟檢閱集,然後選 取 [分析]>[管理預測性編碼 (預覽)

  3. 在 [ 預測性編碼模型 (預覽) 頁面上,選取您要定型的模型。

  4. 在 [ 概觀] 索引 標籤的 [第 1 輪] 底下,選取 [ 開始下一個訓練回合]

    [ 訓練] 索引標籤隨即顯示,並包含 50 個專案供您加上標籤。

  5. 檢閱每份文件,然後選取閱讀窗格底部的 [ 相關 ] 或 [ 不相關 ] 按鈕來標記它。

    將每份文件標記為相關或不相關。

  6. 標示所有 50 個項目之後,請選取 [ 完成]

    系統需要幾分鐘的時間,才能從您的標籤「學習」並更新模型。 此程式完成時,[預測性編碼模型] (預覽) 頁面上會顯示模型的 [就緒] 狀態。

執行其他訓練回合

執行第一輪訓練之後,您可以遵循上一節中的步驟來執行後續的訓練回合。 唯一的差異是在模型 [概 ] 索引標籤上更新定型回合的數目。例如,執行第一個訓練回合之後,您可以選取 [ 開始下一個訓練回合 ] 來開始第二個訓練回合。 依此類推。

每個訓練回合 (進行中和完成) 的定型 (都會顯示在模型的 [ 型] 索引標籤上。 當您選取訓練回合時,會顯示包含該回合資訊和計量的飛出視窗頁面。

執行訓練回合之後會發生什麼事

執行第一個訓練回合之後,就會啟動執行下列作業的工作:

  • 根據您在定型集中標記 40 個專案的方式,模型會從您的標籤學習,並更新本身以變得更精確。

  • 模型接著會處理整個檢閱集中的每個專案,並指派 介於0 (不相關) 和 1 個 (相關) 之間的預測分數。

  • 模型會將預測分數指派給您在定型回合期間標記的控件集中的10個專案。 模型會比較這 10 個專案的預測分數與您在定型回合期間指派給專案的實際標籤。 根據此比較,模型會識別下列分類 (稱為 控制集混淆矩陣) ,以評估模型的預測效能:



標籤 模型預測項目相關 模型預測專案不相關
檢閱者將項目標示為相關 確判為真 誤判
檢閱者將項目標記為不相關 誤判為負 True 負數

根據這些比較,模型會衍生 F 分數、有效位數和召回率計量的值,以及每個分數的錯誤邊界。 這些模型效能計量的分數會顯示在訓練回合的飛出視窗頁面上。 如需這些計量的描述,請參閱 預測性編碼參考

  • 最後,模型會決定接下來將用於下一個定型回合的50個專案。 這次,模型可能會從控件集選取 20 個專案,從檢閱集選取 30 個新專案,並將它們指定為下一個回合的訓練集。 下一個定型回合的取樣並未統一取樣。 模型會優化檢閱集中專案的取樣選取,以選取預測模棱兩可的專案,這表示預測分數在0.5範圍內。 此程序稱為偏差選取。

執行後續訓練回合之後會發生什麼事

在第一個訓練回合) 之後,執行後續的訓練回合 (之後,模型會執行下列動作:

  • 模型會根據您在該回合定型中套用至定型集的標籤來更新。
  • 系統會評估控制項集中專案的模型預測分數,並檢查分數是否與您在控件集中標記專案的方式一致。 評估會針對所有定型回合的控制集內的所有標記項目執行。 此評估的結果會併入模型 [ 概觀 ] 索引標籤上的儀錶板中。
  • 更新的模型會重新處理檢閱集中的每個專案,併為每個專案指派更新的預測分數。

後續步驟

執行第一個訓練回合之後,您可以執行更多訓練回合,或將模型的預測分數篩選套用至檢閱集,以檢視模型預測為相關或不相關的專案。 如需詳細資訊,請 參閱將預測分數篩選套用至檢閱集