구성 요소: 클러스터에 데이터 할당

이 문서에서는 Azure Machine Learning 디자이너에서 클러스터에 데이터 할당 구성 요소를 사용하는 방법을 설명합니다. 이 구성 요소는 K-평균 클러스터링 알고리즘을 사용하여 학습된 클러스터링 모델을 통해 예측을 생성합니다.

클러스터에 데이터 할당 구성 요소는 새로운 각 데이터 포인트에 대한 가능한 할당을 포함하는 데이터 세트를 반환합니다.

클러스터에 데이터 할당을 사용하는 방법

  1. Azure Machine Learning 디자이너에서 이전에 학습된 클러스터링 모델을 찾습니다. 다음 방법 중 하나를 사용하여 클러스터링 모델을 만들고 학습할 수 있습니다.

    • K-평균 클러스터링 구성 요소를 사용하여 K-평균 클러스터링 알고리즘을 구성한 다음, 데이터 세트 및 클러스터링 모델 학습 구성 요소(이 문서)를 사용하여 모델을 학습합니다.

    • 작업 영역의 저장된 모델 그룹에서 기존의 학습된 클러스터링 모델을 추가할 수도 있습니다.

  2. 클러스터에 데이터 할당의 왼쪽 입력 포트에 학습된 모델을 연결합니다.

  3. 새 데이터 세트를 입력으로 연결합니다.

    이 데이터 세트에서 레이블은 선택 사항입니다. 일반적으로 클러스터링은 자율 학습 방법입니다. 범주를 미리 알고 있어야 하는 것은 아닙니다. 그러나 입력 열은 클러스터링 모델을 학습하는 데 사용된 열과 동일해야 합니다. 그렇지 않으면 오류가 발생합니다.

    클러스터 예측에서 디자이너에 기록되는 열 수를 줄이려면 데이터 세트에서 열 선택을 사용하고 열 하위 집합을 선택합니다.

  4. 결과(클러스터 할당)를 표시하는 열을 포함하여 전체 입력 데이터 세트를 결과에 포함하려면 추가하려면 선택/결과만 출력하려면 선택 취소 확인란을 선택된 상태로 둡니다.

    확인란의 선택을 취소하면 결과만 반환됩니다. 이 옵션은 웹 서비스의 일부로 예측을 만드는 경우에 유용할 수 있습니다.

  5. 파이프라인을 제출합니다.

결과

  • 데이터 세트의 값을 보려면 구성 요소를 마우스 오른쪽 단추로 클릭하고 시각화를 선택합니다. 또는 구성 요소를 선택하고 오른쪽 패널에서 출력 탭으로 전환한 다음, 포트 출력에서 히스토그램 아이콘을 클릭하여 결과를 시각화합니다.