テスト セットの作成 (データ マイニング ウィザード)
[テスト セットの作成] ページを使用すると、トレーニングに使用するデータの量、およびテスト セットとして使用するために予約するデータの量を指定できます。 マイニング構造を作成する際にデータをトレーニングとテストのセットに分割すると、後で作成するマイニング モデルの精度をより簡単に評価できるようになります。
テスト データの量を割合で指定することも、テストに使用するケースの数を制限する数値を指定することもできます。 テストに使用するケースの最大数と割合の両方を指定すると、両方の設定が使用され、テスト データセットには小さい方の数のケースが含められます。 既定では、データの 30% がテストに、70% がトレーニングに使用され、テスト ケースの最大数はありません。
既定では、Analysis Services で、パーティション分割の開始に使用される数値シードが生成されます。 このシードはマイニング構造の名前に基づきます。 マイニング構造の名前を変更してもパーティションが変わらないようにするには、マイニング構造の HoldoutSeed プロパティを設定してシードの値を指定します。 提示されたシードを変更する場合は、構造を再処理する必要があります。
テスト データまたはトレーニング データの量を後で変更するには、[プロパティ] ウィンドウを使用して、データ マイニング構造の HoldoutMaxCases プロパティおよび HoldoutMaxPercent プロパティを変更します。 ただし、変更を行った後、マイニング構造および関連するすべてのマイニング モデルを再処理する必要があります。 また、次の制限事項が適用されます。
データ マイニング構造のパーティション分割は、そのデータ マイニング構造が SQL Server 2008 に格納されている場合にのみサポートされます。 以前のバージョンの SQL Server Analysis Services では、マイニング構造のパーティション情報のキャッシュはサポートされません。
タイム シリーズ マイニング モデルに必要な Key Time 列がマイニング構造に含まれている場合、そのマイニング構造をパーティション分割することはできません。
入れ子になったテーブルに格納されている値を予測しようとしている場合、データをパーティション分割することはできません。
詳細情報 : 「テストおよび検証 (データ マイニング)」、「リレーショナル マイニング構造の作成」、「基本的なデータ マイニング チュートリアル」
オプション
[テスト用データの割合]
トレーニング セットとして使用するデータの割合を増減するには、上矢印および下矢印をクリックするか、テキスト ボックスに 0 ~ 100 の値を入力します。[テスト データセット内のケースの最大数]
テストに使用できるケースの数を制限する数値を入力します。データの実際のケース数よりも大きな数値を指定すると、すべてのケースが使用されます。
既定値は NULL です。 これは制限がないことを示します。
関連項目
参照
データ マイニング ウィザードの F1 ヘルプ (Analysis Services - データ マイニング)