モデルでリグレッサーとして使用する列の指定

[アーティクル]
07/30/2013

線形回帰モデルでは、予測可能な属性の値が、データをできる限り推定回帰直線に近づけるように入力を組み合わせる式の結果として表されます。このアルゴリズムでは、入力として使用できるのは数値だけであり、最適な入力が自動的に検出されます。

ただし、リグレッサーとして含める列を指定することもできます。その場合は、モデルに FORCE_REGRESSOR パラメーターを追加して、使用するリグレッサーを指定します。この方法は、影響が小さすぎてモデルで検出されない場合にも意味を持つ属性や、確実に式に含まれるようにしたい属性がある場合に使用できます。

次の手順では、ニューラルネットワークのチュートリアルで使用したのと同じサンプルデータを使用して、単純な線形回帰モデルを作成する方法について説明します。このモデルは必ずしも堅牢ではありませんが、データマイニングデザイナーを使用して線形回帰モデルをカスタマイズする方法を示しています。

単純な線形回帰モデルを作成する方法

SQL Server データツール (SSDT) のソリューションエクスプローラーで、[マイニング構造] を展開します。
Call Center.dmm をダブルクリックしてデザイナーで開きます。
[マイニングモデル] メニューの [新しいマイニングモデル] をクリックします。
アルゴリズムとして [Microsoft 線形回帰] を選択します。名前として「Call Center Regression」と入力します。
[マイニングモデル] タブで、列の使用方法を次のように変更します。これ以外の列はすべて [無視] に設定します (まだ設定されていない場合)。

FactCallCenterID Key

ServiceGrade PredictOnly

Total Operators 入力

AverageTimePerIssue 入力
[マイニングモデル] メニューの [モデルパラメーターの設定] をクリックします。

パラメーター FORCE_REGRESSOR の [値] 列に、列の名前を入力します。次のように各かっこで囲み、コンマで区切って入力します。

[Average Time Per Issue],[Total Operators]

注
このアルゴリズムでは、リグレッサーとして最適な列が自動的に検出されます。リグレッサーを強制する必要があるのは、最終的な式に確実に含まれるようにしたい列がある場合だけです。

[マイニングモデル] メニューの [モデルの処理] をクリックします。

ビューアーでは、モデルが、回帰式を含む 1 つのノードとして表されます。その式をマイニング凡例に表示したり、クエリを使用して式の係数を抽出したりすることもできます。

次の方法で共有

モデルでリグレッサーとして使用する列の指定

単純な線形回帰モデルを作成する方法

関連項目

参照

概念

その他のリソース