次の方法で共有


クラスタリング モデルの探索 (基本的なデータ マイニング チュートリアル)

Microsoft クラスタリング アルゴリズムは、類似の特性を含むクラスターにケースをグループ化します。 これらのグループ化は、データの探索、データ内の異常の特定、予測の作成に役立ちます。

Microsoft クラスター ビューアーには、クラスタリング マイニング モデルの探索に使用する次のタブがあります。

[クラスター ダイアグラム] タブ

[クラスター ダイアグラム] タブには、マイニング モデル内のすべてのクラスターが表示されます。 クラスター間の線は "近さ" を表し、クラスターの類似度に基づいて網掛けされます。 各クラスターの実際の色は、変数の頻度とクラスター内の状態を表します。

[クラスター ダイアグラム] タブでモデルを探索するには

  1. [ マイニング モデル ビューアー] タブの上部にある [マイニング モデル ] リストを使用して、 TM_Clustering モデルに切り替えます。

  2. ビューアーの一覧で、Microsoft クラスター ビューアーを選択します。

  3. [ シェーディング変数 ]ボックスで、[ Bike Buyer]\(自転車購入者\) を選択します。

    既定の変数は Population ですが、モデル内の任意の属性に変更して、必要な属性を持つメンバーを含むクラスターを検出できます。

  4. [State]\(状態\) ボックスで 1 を選択して、自転車が購入されたケースを調べることができます。

    密度凡例は、[シェーディング変数] と [状態] で選択した属性状態ペアの密度を表します。 この例では、最も濃いシェーディングを持つクラスターが自転車購入者の割合が最も高いことがわかります。

  5. 最も濃い網かけでクラスターの上にマウスを置きます。

    ヒントには、属性を持つケースの割合 ( Bike Buyer = 1) が表示されます。

  6. 最も密度の高いクラスターを選択し、クラスターを右クリックし、[ クラスター 名の変更] を選択し、「 Bike Buyers High 」と入力して後で識別します。 OK をクリックします。

  7. 最も明るいシェーディング (および最も低い密度) を持つクラスターを見つけます。 クラスターを右クリックし、[クラスター名の変更] を選択し、「Bike Buyers Low」と入力しますOK をクリックします。

  8. Bike Buyers High クラスターをクリックし、ウィンドウの領域にドラッグすると、他のクラスターへの接続が明確に表示されます。

    クラスターを選択すると、このクラスターを他のクラスターに接続する行が強調表示され、このクラスターのすべてのリレーションシップを簡単に確認できます。 クラスターが選択されていない場合は、線の暗さによって、ダイアグラム内のすべてのクラスター間のリレーションシップの強さを確認できます。 シェーディングがライトまたは存在しない場合、クラスターはあまり似ていません。

  9. 弱いリンクを除外し、最も近いリレーションシップを持つクラスターを見つけるには、ネットワークの左側にあるスライダーを使用します。 Adventure Works Cycles マーケティング部門は、対象のメーリングを配信するための最適な方法を決定するときに、同様のクラスターを組み合わせることが必要になる場合があります。

[クラスター プロファイル] タブ

[ クラスター プロファイル] タブには、 TM_Clustering モデルの全体的なビューが表示されます。 [ クラスター プロファイル ] タブには、モデル内の各クラスターの列が含まれています。 最初の列には、少なくとも 1 つのクラスターに関連付けられている属性が一覧表示されます。 ビューアーの残りの部分には、各クラスターの属性の状態の分布が含まれています。 不連続変数の分布は、ヒストグラム バーの一覧に表示されるバーの最大数を持つ色付き バー として表示されます。 連続属性は、各クラスターの平均と標準偏差を表すひし形グラフと共に表示されます。

[クラスター プロファイル] タブでモデルを探索するには

  1. ヒストグラム バーを 5 に設定します。

    このモデルでは、5 は任意の 1 つの変数の状態の最大数です。

  2. もしマイニング凡例属性プロファイルの表示を邪魔している場合は、それを邪魔にならない場所に移動してください。

  3. [ Bike Buyers High ] 列を選択し、[ 人口 ] 列の右側にドラッグします。

  4. [ Bike Buyers Low ] 列を選択し、[ Bike Buyers High ] 列の右側にドラッグします。

  5. [ Bike Buyers High ] 列をクリックします。

    [変数] 列は、そのクラスターの重要度順に並べ替えられます。 列をスクロールして、Bike Buyer High クラスターの特性を確認します。 たとえば、通勤時間が短くなる可能性が高くなります。

  6. [Bike Buyers High] 列の [Age] セルをダブルクリックします。

    マイニング凡例には、より詳細なビューが表示され、これらの顧客の年齢範囲と平均年齢を確認できます。

  7. [ Bike Buyers Low ] 列を右クリックし、[ 列の非表示] を選択します。

[クラスターの特性] タブ

[ クラスター特性 ] タブでは、クラスターを構成する特性の詳細を確認できます。 すべてのクラスターの特性 ([クラスター プロファイル] タブなど) を比較する代わりに、一度に 1 つのクラスターを探索できます。 たとえば、[クラスター] リストから [Bike Buyers High] を選択すると、このクラスター内の顧客の特性を確認できます。 表示はクラスター プロファイル ビューアーとは異なりますが、結果は同じです。

holdoutseed の初期値を設定しない限り、モデルを処理するたびに結果が異なります。 詳細については、「HoldoutSeed 要素」を参照してください。

[クラスターの識別] タブ

[ クラスターの識別 ] タブを使用すると、1 つのクラスターを別のクラスターと区別する特性を調べることができます。 クラスター 1 の一覧から 1 つとクラスター 2 の一覧から 2 つのクラスターを選択すると、ビューアーはクラスター間の違いを計算し、クラスターを最も区別する属性の一覧を表示します。

[クラスターの識別] タブでモデルを調べるには

  1. [ クラスター 1 ] ボックスで、[ Bike Buyers High] を選択します。

  2. [ クラスター 2 ] ボックスで、[ Bike Buyers Low] を選択します。

  3. [ 変数] をクリックしてアルファベット順に並べ替えます。

    Bike Buyers Low クラスターと Bike Buyers High クラスターの顧客間のより大きな違いには、年齢、車の所有権、子供の数、地域などがあります。

他のマイニング モデルを調べるには、次のトピックを参照してください。

このレッスンの次の作業

Naive Bayes モデルの探索 (基本的なデータ マイニング チュートリアル)

レッスンの前のタスク

デシジョン ツリー モデルの探索 (基本的なデータ マイニング チュートリアル)

こちらもご覧ください

Microsoft クラスター ビューアーを使用してモデルを参照する
[クラスターの識別] タブ (マイニング モデル ビューアー)
[クラスター プロファイル] タブ (マイニング モデル ビューアー)
[クラスターの特性] タブ (マイニング モデル ビューアー)
[クラスター ダイアグラム] タブ (マイニング モデル ビューアー)