コンポーネント: クラスターへのデータの割り当て

[アーティクル]
06/01/2023

この記事では、Azure Machine Learning デザイナーの "クラスターへのデータの割り当て" コンポーネントを使用する方法について説明します。このコンポーネントでは、K-Means クラスタリング アルゴリズムでトレーニングされたクラスタリングモデルを介して予測を生成します。

Assign Data to Clusters (データのクラスターへの割り当て) コンポーネントは、新しい各データポイントの推定の割り当てを含むデータセットを返します。

クラスターへのデータの割り当てを使用する方法

Azure Machine Learning デザイナーで、以前にトレーニングしたクラスタリングモデルを見つけます。以下のいずれかの方法を使用して、クラスタリングモデルを作成およびトレーニングできます。
- K-Means Clustering (K-Means クラスタリング) コンポーネントを使用して K-Means クラスタリングアルゴリズムを構成し、データセットと Train Clustering Model (クラスタリングモデルのトレーニング) コンポーネント (この記事) を使用してモデルをトレーニングします。
- また、トレーニング済みの既存のクラスタリングモデルを、ワークスペースの [Saved Models]\(保存済みのモデル\) グループから追加することもできます。
トレーニング済みのモデルを Assign Data to Clusters (クラスターへのデータの割り当て) の左側の入力ポートにアタッチします。
新しいデータセットを入力としてアタッチします。

このデータセットでは、ラベルは省略可能です。一般に、クラスタリングは教師なしの学習方法です。事前にカテゴリを知ることは想定されていません。ただし、入力列はクラスタリングモデルのトレーニングで使用された列と同じである必要があり、同じでないとエラーが発生します。

ヒント

クラスター予測からデザイナーに書き込まれる列数を減らすには、[Select columns in the dataset]\(データセット内の列の選択\) を使用して列の一部を選択します。
結果 (クラスターの割り当て) を表示する列を含め、入力データセット全体を結果に含める場合は、 [Check for append or uncheck for result only]\(追加をチェックまたは結果のみをチェック解除\) チェックボックスをオンのままにします。

このチェックボックスをオフにすると、結果のみが返されます。このオプションは、Web サービスの一部として予測を作成するときに役立ちます。
パイプラインを送信します。

結果

データセット内の値を表示するには、コンポーネントを右クリックして [可視化] を選択します。または、コンポーネントを選択し、右側のパネルの [出力] タブに切り替え、 [Port outputs]\(ポートの出力\) 内のヒストグラムアイコンをクリックして結果を可視化します。

コンポーネント: クラスターへのデータの割り当て

クラスターへのデータの割り当てを使用する方法

結果

その他のリソース