予測コーディングモデルの作成 (プレビュー)

注意

Microsoft は、2025 年 8 月 31 日にすべてのクラシック電子情報開示エクスペリエンスを廃止しました。この廃止には、従来のコンテンツ検索、クラシック電子情報開示 (Standard)、クラシック電子情報開示 (Premium) が含まれます。

この記事のガイダンスは、21Vianet (中国) が運営する Microsoft 365 でホストされている組織にのみ適用されます。 organizationが 21Vianet によってホストされていない場合は、Microsoft Purview ポータルの新しい電子情報開示エクスペリエンスのガイダンスを使用します。

電子情報開示 (Premium) で予測コーディングの機械学習機能を使用する最初の手順は、予測コーディングモデルを作成することです。モデルを作成した後、レビューセット内の関連コンテンツと関連性のないコンテンツをトレーニングできます。

予測コーディングワークフローを確認するには、「電子情報開示 (Premium) での予測コーディングの詳細」を参照してください。

モデルを作成する前に

予測コーディングモデルを作成するには、レビューセットに少なくとも 2,000 個の項目が必要です。
モデルを作成する前に、すべてのコレクションをレビューセットにコミットしてください。モデルの作成後にレビューセットに追加されたアイテムは処理されないため、モデルによって生成された予測スコアが割り当てられます。
テキストを含まないレビューセット内の項目は、モデルによって処理されたり、予測スコアが割り当てられたりすることはありません。テキストを含む項目は、コントロールセットまたはトレーニングセットに含まれます。

モデルを作成する

Microsoft Purview ポータルで電子情報開示 (Premium) ケースを開き、[ レビューセット ] タブを選択します。
レビューセットを開き、[ Analytics>Manage 予測コーディング (プレビュー)] を選択します。
[ 予測コーディングモデル (プレビュー)] ページで 、[ 新しいモデル] を選択します。
ポップアップページで、モデルの名前と説明 (省略可能) を入力します。
必要に応じて、信頼レベルとエラーのマージンに関連する詳細設定 (ポップアップページで [詳細オプション ] を選択) を構成できます。これらの設定は、コントロールセットに含まれる項目の数に影響します。 コントロールセットは、トレーニングプロセス中に使用され、トレーニングラウンド中に実行するラベル付けを使用して、モデルが項目に割り当てる予測スコアを評価します。 organizationに、ドキュメントレビューの信頼レベルとエラーの余白に関するガイドラインがある場合は、適切なボックスで指定します。それ以外の場合は、既定の設定を使用します。
[ 保存] を 選択してモデルを作成します。

システムがモデルを準備するまでに数分かかります。準備ができたら、トレーニングの最初のラウンドを実行できます。

モデルを作成した後の動作

モデルを作成した後、モデルの作成と準備中にバックグラウンドで次のものが発生します。

コントロールセットの項目数が計算されます。このサイズは、レビューセット内の項目の数と、信頼レベルとエラーの余白の設定に基づいています。コントロールセットの項目はランダムに選択され、コントロールセット項目として指定されます。システムには、トレーニングの最初のラウンドで設定されたコントロールから 10 個の項目が含まれています。
システムは、最初のトレーニングラウンドのトレーニングセットに含まれるレビューセットから 40 項目をランダムに選択します。そのため、トレーニングの第 1 ラウンドには、ラベル付け用の 50 項目 (トレーニングセットから 40 項目、コントロールセットから 10 項目) が含まれます。

次の手順

レビューセットのモデルを作成した後、次の手順は、調査に関連するコンテンツを特定するためにモデルを "教える" トレーニングラウンドを実行することです。詳細については、「予測コーディングモデルのトレーニング」を参照してください。

フィードバック

このページはお役に立ちましたか?

Last updated on 2026-01-30