Microsoft 線形回帰アルゴリズムは、依存変数と独立変数の間の線形関係を計算し、そのリレーションシップを予測に使用するのに役立つ Microsoft デシジョン ツリー アルゴリズムのバリエーションです。
リレーションシップは、一連のデータを最もよく表す線の数式の形式をとります。 たとえば、次の図の線は、データの線形表現として最適です。
図の各データ ポイントには、回帰直線からの距離に関連するエラーがあります。 回帰式の係数 a と b は、回帰直線の角度と位置を調整します。 回帰式は、すべてのポイントに関連付けられているエラーの合計が最小値に達するまで a と b を調整することで取得できます。
複数の変数を使用する他の種類の回帰と、回帰の非線形メソッドもあります。 ただし、線形回帰は、基になる要因の変化に対する応答をモデル化するために役立ち、よく知られている方法です。
例
線形回帰を使用して、2 つの連続する列間のリレーションシップを決定できます。 たとえば、線形回帰を使用して、製造データまたは売上データから傾向線を計算できます。 また、線形回帰を使用して、より複雑なデータ マイニング モデルを開発する前に、データ列間のリレーションシップを評価することもできます。
データ マイニング ツールを必要としない線形回帰を計算する方法は多数ありますが、このタスクに Microsoft 線形回帰アルゴリズムを使用する利点は、変数間で考えられるすべてのリレーションシップが自動的に計算され、テストされるということです。 最小二乗の解法など、計算方法を選択する必要はありません。 ただし、複数の要因が結果に影響を与えるシナリオでは、線形回帰によってリレーションシップが過度に単純化される可能性があります。
アルゴリズムのしくみ
Microsoft 線形回帰アルゴリズムは、Microsoft デシジョン ツリー アルゴリズムのバリエーションです。 Microsoft 線形回帰アルゴリズムを選択すると、アルゴリズムの動作を制約し、特定の入力データ型を必要とするパラメーターを使用して、Microsoft デシジョン ツリー アルゴリズムの特殊なケースが呼び出されます。 さらに、線形回帰モデルでは、最初のパスのリレーションシップを計算するためにデータセット全体が使用されますが、標準デシジョン ツリー モデルでは、データがより小さなサブセットまたはツリーに繰り返し分割されます。
線形回帰モデルに必要なデータ
線形回帰モデルで使用するデータを準備するときは、特定のアルゴリズムの要件を理解する必要があります。 これには、必要なデータの量と、データの使用方法が含まれます。 このモデルの種類の要件は次のとおりです。
1 つのキー列 各モデルには、各レコードを一意に識別する数値列またはテキスト列が 1 つ含まれている必要があります。 複合キーは使用できません。
予測可能な列 少なくとも 1 つの予測可能な列が必要です。 モデルには複数の予測可能な属性を含めることができますが、予測可能な属性は連続する数値データ型である必要があります。 データのネイティブ ストレージが数値の場合でも、datetime データ型を予測可能な属性として使用することはできません。
入力列 入力列には連続する数値データが含まれており、適切なデータ型が割り当てられている必要があります。
詳細については、「 Microsoft 線形回帰アルゴリズムテクニカル リファレンス」の「要件」セクションを参照してください。
線形回帰モデルの表示
モデルを探索するには、 Microsoft ツリー ビューアーを使用します。 線形回帰モデルのツリー構造は非常に単純であり、回帰式に関するすべての情報が 1 つのノードに含まれています。 詳細については、「 Microsoft ツリー ビューアーを使用したモデルの参照」を参照してください。
数式の詳細を知りたい場合は、 Microsoft 汎用コンテンツ ツリー ビューアーを使用して係数やその他の詳細を表示することもできます。
線形回帰モデルの場合、モデルコンテンツには、メタデータ、回帰式、および入力値の分布に関する統計が含まれます。 詳細については、「 線形回帰モデルのマイニング モデル コンテンツ (Analysis Services - データ マイニング)」を参照してください。
予測の作成
モデルが処理されると、結果は線形回帰式と共に統計のセットとして格納されます。これは、将来の傾向を計算するために使用できます。 線形回帰モデルで使用するクエリの例については、「 線形回帰モデルクエリの例」を参照してください。
マイニング モデルに対してクエリを作成する方法の一般的な情報については、「 データ マイニング クエリ」を参照してください。
Microsoft 線形回帰アルゴリズムを選択して線形回帰モデルを作成するだけでなく、予測可能な属性が連続する数値データ型の場合は、回帰を含むデシジョン ツリー モデルを作成できます。 この場合、アルゴリズムは、適切な分離ポイントが見つかるとデータを分割しますが、データの一部の領域では、代わりに回帰式が作成されます。 デシジョン ツリー モデル内の回帰ツリーの詳細については、「 デシジョン ツリー モデルのマイニング モデル コンテンツ (Analysis Services - データ マイニング)」を参照してください。
注釈
マイニング モデルを作成するための予測モデル マークアップ言語 (PMML) の使用はサポートされていません。
データ マイニング ディメンションの作成はサポートされていません。
ドリルスルーをサポートします。
OLAP マイニング モデルの使用をサポートします。
こちらもご覧ください
データ マイニング アルゴリズム (Analysis Services - データ マイニング)Microsoft 線形回帰アルゴリズム テクニカル リファレンス線形回帰モデル クエリの例線形回帰モデルのマイニング モデル コンテンツ (Analysis Services - データ マイニング)