クラスタリング モデルのトレーニング
この記事では Azure Machine Learning デザイナーのコンポーネントについて説明します。
このコンポーネントを使用して、クラスタリング モデルをトレーニングします。
このコンポーネントは、K-Means Clustering (K-Means クラスタリング) コンポーネントを使用して既に構成済みのトレーニングされていないクラスタリング モデルを取得し、ラベル付きまたはラベルなしデータセットを使用してそのモデルをトレーニングします。 このコンポーネントは、予測に使用できるトレーニング済みモデルと、トレーニング データの各ケースに対するクラスター割り当てセットの両方を作成します。
注意
機械学習モデルをトレーニングするための汎用コンポーネントである モデルのトレーニング コンポーネントを使用して、クラスタリング モデルをトレーニングすることはできません。 これは、Train Model (モデルのトレーニング) が教師あり学習アルゴリズムでのみ動作するためです。 K 平均法と他のクラスタリング アルゴリズムは教師なし学習を可能にします。これは、アルゴリズムがラベルなしデータから学習できることを意味します。
クラスタリング モデルのトレーニングの使用方法
Train Clustering Model (クラスタリング モデルのトレーニング) コンポーネントをデザイナーの自分のパイプラインに追加します。 このコンポーネントは、Machine Learning コンポーネントの [トレーニング] カテゴリにあります。
K-Means Clustering (K-Means クラスタリング) コンポーネント、または互換性のあるクラスタリング モデルを作成する別のカスタム コンポーネントを追加し、クラスタリング モデルのパラメーターを設定します。
[Train Clustering Model]\(クラスタリング モデルのトレーニング\) の右側の入力にトレーニング データセットをアタッチします。
[Column Set]\(列セット\) で、クラスターの構築に使用するデータセットの列を選択します。 適切な特徴となる列を必ず選択してください。たとえば、一意の値を持つ ID やその他の列、またはすべて同じ値を持つ列は使用しないようにします。
ラベルが使用可能な場合は、特徴として使用することも、除外することもできます。
トレーニング データを新しいクラスター ラベルとともに出力する場合は、[Check for append or uncheck for result only]\(追加をチェックまたは結果のみをチェック解除\) オプションを選択します。
このオプションの選択を解除すると、クラスターの割り当てだけが出力されます。
パイプラインを送信するか、Train Clustering Model (クラスタリング モデルのトレーニング) コンポーネントをクリックして [選択した項目を実行] を選択します。
結果
トレーニングの完了後、次の作業を行います。
トレーニングされたモデルのスナップショットを保存するには、 [モデルのトレーニング] コンポーネントの右側のパネルにある [出力] タブを選択します。 [データセットの登録] アイコンを選んで、再利用可能なコンポーネントとしてモデルを保存します。
モデルからスコアを生成するには、「クラスターへのデータの割り当て」を使用します。
注意
トレーニング済みのモデルをデザイナーに配置する必要がある場合は、Score Model (モデルのスコア付け) ではなく、Assign Data to Clusters (クラスターへのデータの割り当て) が、推論パイプラインの Web Service Output (Web サービスの出力) コンポーネントの入力に接続されていることを確認してください。
次の手順
Azure Machine Learning で使用できる一連のコンポーネントを参照してください。