[アーティクル]
04/01/2012

モデリングフラグ (データマイニング)

SQL Server Analysis Services のモデリングフラグを使用すると、ケーステーブルで定義されているデータに関する追加情報をデータマイニングアルゴリズムに提供できます。アルゴリズムは、この情報を使用してより正確なデータマイニングモデルを作成できます。

モデリングフラグは、データマイニング拡張機能 (DMX) を使用してプログラムで定義するか、Business Intelligence Development Studio のデータマイニングデザイナーで定義することができます。DMX ステートメントでこれらのフラグを定義する方法の詳細については、「マイニングモデル列」を参照してください。

マイニング構造のレベルで定義されるモデリングフラグもあれば、マイニングモデル列のレベルで定義されるモデリングフラグもあります。たとえば、NOT NULL モデリングフラグはマイニング構造列で使用されます。マイニングモデル列でその他のモデリングフラグを定義できます。

次の一覧に、Analysis Services でサポートされているモデリングフラグを示します。特定のアルゴリズムでサポートされているモデリングフラグについては、各アルゴリズムのテクニカルリファレンストピックを参照してください。

NOT NULL
この属性列の値が NULL 値を含むことはないことを示します。モデルのトレーニング処理中に、Analysis Services がこの属性列に NULL 値を検出した場合、エラーが発生します。

MODEL_EXISTENCE_ONLY
列が、Missing および Existing の 2 つの状態を持つ列として扱われることを示します。値が NULL の場合は Missing として扱われます。

注
Missing はアルゴリズムによって使用される特殊な状態であり、列のテキスト値の "Missing" とは異なります。詳細については、「不足値 (Analysis Services - データマイニング)」を参照してください。

このモデリングフラグは、NULL 状態が暗黙的な意味を持ち、NOT NULL 状態の明示的な値はその列に値があるという事実ほど重要ではないような属性を示すために使用されるのが一般的です。たとえば [DateContractSigned] 列は、契約書が署名されなかった場合には NULL に、署名された場合には NOT NULL になります。したがって、契約書が署名されるかどうかの予測を目的とするモデルでは、MODEL_EXISTENCE_ONLY フラグを使用して、NOT NULL のケースの正確な日付の値は無視して、値が Missing のケースと Existing のケースの区別のみを行うことができます。

REGRESSOR
列が処理中にリグレッサとして使用される候補であることを示します。このフラグは、マイニングモデル列で定義され、連続する数値データ型の列にのみ適用できます。このフラグの使用の詳細については、このトピックの後半のセクションを参照してください。

注
サードパーティプラグインには、Analysis Services であらかじめ定義されているフラグに加えて他のモデリングフラグがある場合もあります。

モデリングフラグの表示と変更

データマイニングデザイナーでは、マイニング構造やマイニング列に関連付けられているモデリングフラグを、その構造またはモデルのプロパティを表示することによって表示および変更することができます。

構造列またはモデル列のモデリングフラグを表示または変更するには

BI Development Studio のソリューションエクスプローラーで、マイニング構造をダブルクリックします。
NOT NULL モデリングフラグを設定するには、[マイニング構造] タブをクリックします。

REGRESSOR フラグまたは MODEL_EXISTENCE_ONLY フラグを設定するには、[マイニングモデル] タブをクリックします。
表示または変更する列を右クリックし、[プロパティ] をクリックします。
新しいモデリングフラグを追加するには、[ModelingFlags] プロパティの横にあるテキストボックスをクリックし、使用するモデリングフラグのチェックボックスをオンにします。

その列のデータ型に合ったモデリングフラグのみが表示されます。

注

モデリングフラグを変更した後、モデルを再処理する必要があります。

注
モデリングフラグを変更した後、モデルを再処理する必要があります。

DMX を使用して、既存のマイニングモデルやマイニング構造で使用されているモデリングフラグを変更することはできません。ALTER MINING STRUCTURE ADD MINING MODEL 構文を使用して新しいマイニングモデルを作成する必要があります。

現在の構造でどのモデリングフラグが使用されているのかわからない場合は、次の構文を使用して、モデリングフラグを返すクエリを作成できます。

SELECT COLUMN_NAME, MODELING_FLAG
FROM $system.DMSCHEMA_MINING_STRUCTURE_COLUMNS
WHERE STRUCTURE_NAME = '<structure name>'

REGRESSOR モデリングフラグの使用

列に REGRESSOR モデリングフラグを設定すると、その列にリグレッサ候補が含まれていることがアルゴリズムに対して示されます。モデルで使用される実際のリグレッサはアルゴリズムによって決定されます。予測可能な属性をモデル化しないリグレッサ候補は破棄できます。

データマイニングウィザードを使用してモデルを作成すると、連続列である入力列のすべてにリグレッサ候補のフラグが付けられます。したがって、REGRESSOR フラグを明示的に設定していない列がモデルでリグレッサとして使用される場合もあります。

処理されたモデルで実際に使用されたリグレッサを特定するには、マイニングモデルのスキーマ行セットに対してクエリを実行します。以下に例を示します。

SELECT COLUMN_NAME, MODELING_FLAG
FROM $system.DMSCHEMA_MINING_columnS
WHERE MODEL_NAME = '<model name>'

注マイニングモデルを変更して、列のコンテンツの種類を連続から不連続に変更した場合は、マイニング列のフラグを手動で変更してからモデルを再処理する必要があります。

線形回帰モデルのリグレッサ

線形回帰モデルは、Microsoft デシジョンツリーアルゴリズムに基づいています。Microsoft 線形回帰アルゴリズムを使用していない場合でも、連続属性の回帰を表すツリーやノードがデシジョンツリーモデルに含まれることはあります。

連続列がリグレッサを表すことを指定する必要はありません。列に REGRESSOR フラグを設定しなくても、Microsoft デシジョンツリーアルゴリズムにより、データセットが意味のあるパターンを持つ領域に分割されます。違いは、このモデリングフラグを設定すると、ツリーのノードのパターンに合う a*C1 + b*C2 + ... という形式の回帰式をアルゴリズムが見つけようとするということです。残差の合計が計算され、偏差が大きすぎる場合には、ツリーが強制的に分割されます。

たとえば、Income を属性として使用して顧客の購入行動を予測する場合に、その列に REGRESSOR モデリングフラグを設定すると、アルゴリズムはまず、標準の回帰式を使用して Income の値を試します。偏差が大きすぎる場合はその回帰式が放棄され、ツリーが他の属性で分割されます。その後デシジョンツリーアルゴリズムは、分割後の各分岐で、Income をリグレッサとして使用できるかどうかを試します。

FORCE_REGRESSOR パラメーターを使用すると、アルゴリズムで特定のリグレッサが使用されるようにすることができます。このパラメーターは、デシジョンツリーアルゴリズムと線形回帰アルゴリズムで使用できます。

次の方法で共有

モデリングフラグ (データマイニング)

モデリングフラグの表示と変更

構造列またはモデル列のモデリングフラグを表示または変更するには

REGRESSOR モデリングフラグの使用

線形回帰モデルのリグレッサ

関連項目

参照

概念

その他の技術情報

その他のリソース

次の方法で共有

モデリング フラグ (データ マイニング)

モデリング フラグの表示と変更

構造列またはモデル列のモデリング フラグを表示または変更するには

REGRESSOR モデリング フラグの使用

線形回帰モデルのリグレッサ

関連項目

参照

概念

その他の技術情報

その他のリソース

モデリングフラグ (データマイニング)

モデリングフラグの表示と変更

構造列またはモデル列のモデリングフラグを表示または変更するには

REGRESSOR モデリングフラグの使用