將預測性編碼模型定型 (預覽)

在 Microsoft Purview 電子文件探索 (Premium) 中建立預測性程式代碼撰寫模型之後，下一個步驟是執行第一個訓練回合，以針對您檢閱集中的相關內容和非相關內容來定型模型。完成第一輪定型之後，您可以執行後續的訓練回合，以改善模型預測相關和非相關內容的能力。

若要檢閱預測性編碼工作流程，請參閱瞭解 eDiscovery (Premium) 中的預測性編碼

提示

如果您不是 E5 客戶，請使用 90 天的 Microsoft Purview 解決方案試用版來探索其他 Purview 功能如何協助貴組織管理數據安全性與合規性需求。立即從 Microsoft Purview 合規性入口網站試用中樞開始。瞭解有關註冊和試用版條款的詳細數據。

在定型模型之前

在定型回合期間，根據文件中內容的相關性，將項目標示為 [ 相關 ] 或 [ 不相關 ]。請勿根據元數據欄位中的值來決定。例如，針對電子郵件訊息或 Teams 交談，請勿將您的標籤決策以郵件參與者為基礎。

在 Microsoft Purview 合規性入口網站中，開啟 eDiscovery (Premium) 案例，然後選取 [檢閱集] 索引卷標。
開啟檢閱集，然後選 取 [分析]>[管理預測性編碼 (預覽) 。
在 [ 預測性編碼模型 (預覽) 頁面上，選取您要定型的模型。
在 [ 概觀] 索引 標籤的 [第 1 輪] 底下，選取 [ 開始下一個訓練回合]。

[ 訓練] 索引標籤隨即顯示，並包含 50 個專案供您加上標籤。
檢閱每份文件，然後選取閱讀窗格底部的 [ 相關 ] 或 [ 不相關 ] 按鈕來標記它。
標示所有 50 個項目之後，請選取 [ 完成]。

系統需要幾分鐘的時間，才能從您的標籤「學習」並更新模型。此程式完成時，[預測性編碼模型] (預覽) 頁面上會顯示模型的 [就緒] 狀態。

執行第一輪訓練之後，您可以遵循上一節中的步驟來執行後續的訓練回合。唯一的差異是在模型 [概觀 ] 索引標籤上更新定型回合的數目。例如，執行第一個訓練回合之後，您可以選取 [ 開始下一個訓練回合 ] 來開始第二個訓練回合。依此類推。

每個訓練回合 (進行中和完成) 的定型 (都會顯示在模型的 [ 定型] 索引標籤上。當您選取訓練回合時，會顯示包含該回合資訊和計量的飛出視窗頁面。

執行第一個訓練回合之後，就會啟動執行下列作業的工作：

根據您在定型集中標記 40 個專案的方式，模型會從您的標籤學習，並更新本身以變得更精確。
模型接著會處理整個檢閱集中的每個專案，並指派 介於0 (不相關) 和 1 個 (相關) 之間的預測分數。
模型會將預測分數指派給您在定型回合期間標記的控件集中的10個專案。模型會比較這 10 個專案的預測分數與您在定型回合期間指派給專案的實際標籤。根據此比較，模型會識別下列分類 (稱為 控制集混淆矩陣) ，以評估模型的預測效能：

根據這些比較，模型會衍生 F 分數、有效位數和召回率計量的值，以及每個分數的錯誤邊界。這些模型效能計量的分數會顯示在訓練回合的飛出視窗頁面上。如需這些計量的描述，請參閱預測性編碼參考。

最後，模型會決定接下來將用於下一個定型回合的50個專案。這次，模型可能會從控件集選取 20 個專案，從檢閱集選取 30 個新專案，並將它們指定為下一個回合的訓練集。下一個定型回合的取樣並未統一取樣。模型會優化檢閱集中專案的取樣選取，以選取預測模棱兩可的專案，這表示預測分數在0.5範圍內。此程序稱為偏差選取。

在第一個訓練回合) 之後，執行後續的訓練回合 (之後，模型會執行下列動作：

模型會根據您在該回合定型中套用至定型集的標籤來更新。
系統會評估控制項集中專案的模型預測分數，並檢查分數是否與您在控件集中標記專案的方式一致。評估會針對所有定型回合的控制集內的所有標記項目執行。此評估的結果會併入模型 [ 概觀 ] 索引標籤上的儀錶板中。
更新的模型會重新處理檢閱集中的每個專案，併為每個專案指派更新的預測分數。

執行第一個訓練回合之後，您可以執行更多訓練回合，或將模型的預測分數篩選套用至檢閱集，以檢視模型預測為相關或不相關的專案。如需詳細資訊，請參閱將預測分數篩選套用至檢閱集。