重要事項
經典的電子檔探索體驗已 於 2025 年 8 月 31 日淘汰。 此淘汰包括傳統內容搜尋、傳統電子檔探索 (Standard) ,以及傳統電子檔探索 (進階) 。 這些選項無法作為 Microsoft Purview 入口網站中的體驗選項使用。
除非您在針對特定短期轉換案例使用這些舊版功能時直接與 Microsoft 合作,否則請使用 Microsoft Purview 入口網站中新電子檔探索體驗的指引。
在電子檔探索 (進階) 中使用預測性編碼的機器學習功能的第一個步驟是建立預測性編碼模型。 建立模型之後,您可以定型它來識別檢閱集中的相關和不相關內容。
若要檢閱預測性編碼工作流程,請參閱 瞭解電子檔探索 (進階版中的預測編碼)
建立模型之前
- 檢閱集中必須至少有 2,000 個專案,才能建立預測性編碼模型。
- 請務必在建立模型之前,將所有集合認可至檢閱集。 建立模型之後新增至檢閱集的專案將不會被處理,並指派模型所產生的預測分數。
- 檢閱集中任何不包含文字的專案都不會由模型處理或指派預測分數。 帶有文本的項目將包含在控制集或訓練集中。
建立模型
在 Microsoft Purview 入口網站中,開啟電子檔探索 (進階版) 案例,然後選取 [ 檢閱集 ] 索引標籤。
開啟檢閱集,然後選取 [分析][管理>預測編碼] ([預覽) ]。
在 預測編碼模型 (預覽) 頁面上,選取 新增模型。
在飛出視窗頁面上,輸入模型的名稱和選擇性描述。
或者,您可以選取飛出視窗頁面上的進 階選項 , (設定進階設定,) 與信賴等級和誤差幅度相關。 這些設定會影響控制項集中包含的項目數目。 控制集會在訓練程序期間用來評估模型指派給具有您在訓練回合期間執行的標籤項目的預測分數。 如果您的組織有文件檢閱信賴水準和誤差範圍的指導方針,請在適當的方塊中指定它們。 否則,請使用預設設定。
選取 [儲存] 以建立模型。
系統需要幾分鐘的時間來準備您的模型。 準備就緒後,您可以進行第一輪訓練。
建立模型之後會發生什麼事
建立模型之後,在建立和準備模型期間,背景會發生下列事:
- 系統會計算控制集的項目數。 此大小是根據檢閱集中的專案數目,以及信賴水準和誤差幅度的設定。 控制集的項目是隨機選擇的,並指定為控制集項目。 該系統包括第一輪訓練中控制集中的 10 個項目。
- 系統會從檢閱集中隨機選取 40 個項目,以包含在第一輪訓練的訓練集中。 因此,第一輪訓練包括 50 個用於標記的項目:訓練集中的 40 個項目和控制集中的 10 個項目。
後續步驟
建立檢閱集的模型之後,下一個步驟是執行定型輪次,以「教導」模型,以識別與您的調查相關的內容。 如需詳細資訊,請參閱 定型預測編碼模型。