モデルでリグレッサーとして使用する列の指定
線形回帰モデルでは、予測可能な属性の値が、データをできる限り推定回帰直線に近づけるように入力を組み合わせる式の結果として表されます。 このアルゴリズムでは、入力として使用できるのは数値だけであり、最適な入力が自動的に検出されます。
ただし、リグレッサーとして含める列を指定することもできます。その場合は、モデルに FORCE_REGRESSOR パラメーターを追加して、使用するリグレッサーを指定します。 この方法は、影響が小さすぎてモデルで検出されない場合にも意味を持つ属性や、確実に式に含まれるようにしたい属性がある場合に使用できます。
次の手順では、ニューラル ネットワークのチュートリアルで使用したのと同じサンプル データを使用して、単純な線形回帰モデルを作成する方法について説明します。 このモデルは必ずしも堅牢ではありませんが、データ マイニング デザイナーを使用して線形回帰モデルをカスタマイズする方法を示しています。
単純な線形回帰モデルを作成する方法
[SQL Server Data Tools (SSDT)] の [ソリューション エクスプローラー] で、[マイニング構造] を展開します。
Call Center.dmm をダブルクリックしてデザイナーで開きます。
[マイニング モデル] メニューの [新しいマイニング モデル]をクリックします。
アルゴリズムとして [Microsoft 線形回帰]を選択します。 名前として「 Call Center Regression」と入力します。
[マイニング モデル] タブで、列の使用方法を次のように変更します。 これ以外の列はすべて [無視]に設定します (まだ設定されていない場合)。
FactCallCenterIDKey
ServiceGradePredictOnly
Total OperatorsInput
AverageTimePerIssueInput
[マイニング モデル] メニューの [モデル パラメーターの設定]をクリックします。
パラメーター FORCE_REGRESSOR の [値] 列に、列の名前を入力します。次のように各かっこで囲み、コンマで区切って入力します。
[Average Time Per Issue],[Total Operators]
注意
このアルゴリズムでは、リグレッサーとして最適な列が自動的に検出されます。 リグレッサーを強制する必要があるのは、最終的な式に確実に含まれるようにしたい列がある場合だけです。
[マイニング モデル] メニューの [モデルの処理]をクリックします。
ビューアーでは、モデルが、回帰式を含む 1 つのノードとして表されます。 その式を マイニング凡例に表示したり、クエリを使用して式の係数を抽出したりすることもできます。
参照
Microsoft 線形回帰アルゴリズム
データ マイニング クエリ
Microsoft 線形回帰アルゴリズム テクニカル リファレンス
線形回帰モデルのマイニング モデル コンテンツ (Analysis Services - データ マイニング)