次の方法で共有


Microsoft ロジスティック回帰アルゴリズム

ロジスティック回帰は、バイナリの結果をモデル化するために使用される、よく知られた統計的手法です。

統計研究には、さまざまな学習手法を使用して、さまざまなロジスティック回帰が実装されています。 Microsoft ロジスティック回帰アルゴリズムは、Microsoft ニューラル ネットワーク アルゴリズムのバリエーションを使用して実装されています。 このアルゴリズムは、ニューラル ネットワークの品質の多くを共有しますが、トレーニングが簡単です。

ロジスティック回帰の利点の 1 つは、アルゴリズムが非常に柔軟で、あらゆる種類の入力を受け取り、いくつかの異なる分析タスクをサポートしていることです。

  • 人口統計を使用して、特定の疾患のリスクなど、結果に関する予測を行います。

  • 結果に寄与する要因を調べて重み付けします。 たとえば、顧客がストアに繰り返し訪れる要因を特定します。

  • 多くの属性を持つドキュメント、電子メール、またはその他のオブジェクトを分類します。

類似の人口統計情報を共有し、Adventure Works 社から製品を購入するユーザーのグループについて考えてみましょう。 ターゲット製品の購入など、特定の結果に関連するデータをモデル化することで、人口統計情報がターゲット製品を購入する可能性にどのように寄与するかを確認できます。

アルゴリズムのしくみ

ロジスティック回帰は、一対の結果に対する複数の要因の寄与を決定するためのよく知られた統計的方法です。 Microsoft の実装では、変更されたニューラル ネットワークを使用して、入力と出力の関係をモデル化します。 出力に対する各入力の影響が測定され、完成したモデルでさまざまな入力が重み付けされます。 ロジスティック回帰という名前は、極端な値の影響を最小限に抑えるために、ロジスティック変換を使用してデータ曲線が圧縮されるという事実に由来します。 実装の詳細とアルゴリズムをカスタマイズする方法については、「 Microsoft ロジスティック回帰アルゴリズムテクニカル リファレンス」を参照してください

ロジスティック回帰モデルに必要なデータ

ロジスティック回帰モデルのトレーニングに使用するデータを準備するときは、必要なデータの量やデータの使用方法など、特定のアルゴリズムの要件を理解する必要があります。

ロジスティック回帰モデルの要件は次のとおりです。

1 つのキー列 各モデルには、各レコードを一意に識別する数値列またはテキスト列が 1 つ含まれている必要があります。 複合キーは使用できません。

入力列 各モデルには、分析で因子として使用される値を含む少なくとも 1 つの入力列が含まれている必要があります。 必要な数の入力列を含めることができますが、各列の値の数によっては、追加の列を追加すると、モデルのトレーニングにかかる時間が長くなる可能性があります。

少なくとも 1 つの予測可能な列 モデルには、連続する数値データを含む、任意のデータ型の予測可能な列が少なくとも 1 つ含まれている必要があります。 予測可能列の値は、モデルへの入力として扱うことも、予測にのみ使用するように指定することもできます。 入れ子になったテーブルは予測可能な列には使用できませんが、入力として使用できます。

ロジスティック回帰モデルでサポートされるコンテンツ タイプとデータ型の詳細については、「 Microsoft ロジスティック回帰アルゴリズムテクニカル リファレンス」の「要件」セクションを参照してください。

ロジスティック回帰モデルの表示

モデルを探索するには、Microsoft ニューラル ネットワーク ビューアーまたは Microsoft 汎用コンテンツ ツリー ビューアーを使用できます。

Microsoft ニューラル ネットワーク ビューアーを使用してモデルを表示すると、Analysis Services には、特定の結果に寄与する要因が重要度によってランク付けされて表示されます。 比較する属性と値を選択できます。 詳細については、「 Microsoft ニューラル ネットワーク ビューアーを使用したモデルの参照」を参照してください。

詳細を知りたい場合は、Microsoft 汎用コンテンツ ツリー ビューアーを使用してモデルの詳細を参照できます。 ロジスティック回帰モデルのモデル コンテンツには、モデルに使用されるすべての入力と予測可能な属性のサブネットワークを示す限界ノードが含まれています。 詳細については、「 ロジスティック回帰モデルのマイニング モデル コンテンツ (Analysis Services - データ マイニング)」を参照してください。

予測の作成

モデルのトレーニングが完了したら、モデルコンテンツに対するクエリを作成して回帰係数やその他の詳細を取得するか、モデルを使用して予測を行うことができます。

注釈

  • ドリルスルーはサポートされていません。 これは、マイニング モデル内のノードの構造が、必ずしも基になるデータに直接対応しているとは限らないためです。

  • データ マイニング ディメンションの作成はサポートされていません。

  • OLAP マイニング モデルの使用をサポートします。

  • マイニング モデルを作成するための予測モデル マークアップ言語 (PMML) の使用はサポートされていません。

こちらもご覧ください

ロジスティック回帰モデルのマイニング モデル コンテンツ (Analysis Services - データ マイニング)
Microsoft ロジスティック回帰アルゴリズムテクニカル リファレンス
ロジスティック回帰モデルクエリの例