テストセットの作成 (データマイニングウィザード)

[アーティクル]
05/07/2013

[テストセットの作成] ページを使用すると、トレーニングに使用するデータの量、およびテストセットとして使用するために予約するデータの量を指定できます。マイニング構造を作成する際にデータをトレーニングとテストのセットに分割すると、後で作成するマイニングモデルの精度をより簡単に評価できるようになります。

テストデータの量を割合で指定することも、テストに使用するケースの数を制限する数値を指定することもできます。テストに使用するケースの最大数と割合の両方を指定すると、両方の設定が使用され、テストデータセットには小さい方の数のケースが含められます。既定では、データの 30% がテストに、70% がトレーニングに使用され、テストケースの最大数はありません。

既定では、Analysis Services で、パーティション分割の開始に使用される数値シードが生成されます。このシードはマイニング構造の名前に基づきます。マイニング構造の名前を変更してもパーティションが変わらないようにするには、マイニング構造の HoldoutSeed プロパティを設定してシードの値を指定します。提示されたシードを変更する場合は、構造を再処理する必要があります。

テストデータまたはトレーニングデータの量を後で変更するには、[プロパティ] ウィンドウを使用して、データマイニング構造の HoldoutMaxCases プロパティおよび HoldoutMaxPercent プロパティを変更します。ただし、変更を行った後、マイニング構造および関連するすべてのマイニングモデルを再処理する必要があります。また、次の制限事項が適用されます。

データマイニング構造のパーティション分割は、そのデータマイニング構造が SQL Server 2008 に格納されている場合にのみサポートされます。以前のバージョンの SQL Server Analysis Services では、マイニング構造のパーティション情報のキャッシュはサポートされません。
タイムシリーズマイニングモデルに必要な Key Time 列がマイニング構造に含まれている場合、そのマイニング構造をパーティション分割することはできません。
入れ子になったテーブルに格納されている値を予測しようとしている場合、データをパーティション分割することはできません。

詳細情報 : 「テストおよび検証 (データマイニング)」、「リレーショナルマイニング構造の作成」、「基本的なデータマイニングチュートリアル」

オプション

[テスト用データの割合]
トレーニングセットとして使用するデータの割合を増減するには、上矢印および下矢印をクリックするか、テキストボックスに 0 ～ 100 の値を入力します。
[テストデータセット内のケースの最大数]
テストに使用できるケースの数を制限する数値を入力します。

データの実際のケース数よりも大きな数値を指定すると、すべてのケースが使用されます。

既定値は NULL です。これは制限がないことを示します。

次の方法で共有

テストセットの作成 (データマイニングウィザード)

オプション

関連項目

参照

その他のリソース

次の方法で共有

テスト セットの作成 (データ マイニング ウィザード)

オプション

関連項目

参照

その他のリソース

テストセットの作成 (データマイニングウィザード)