구성 요소: 클러스터에 데이터 할당

아티클
06/01/2023

이 문서에서는 Azure Machine Learning 디자이너에서 클러스터에 데이터 할당 구성 요소를 사용하는 방법을 설명합니다. 이 구성 요소는 K-평균 클러스터링 알고리즘을 사용하여 학습된 클러스터링 모델을 통해 예측을 생성합니다.

클러스터에 데이터 할당 구성 요소는 새로운 각 데이터 포인트에 대한 가능한 할당을 포함하는 데이터 세트를 반환합니다.

클러스터에 데이터 할당을 사용하는 방법

Azure Machine Learning 디자이너에서 이전에 학습된 클러스터링 모델을 찾습니다. 다음 방법 중 하나를 사용하여 클러스터링 모델을 만들고 학습할 수 있습니다.
- K-평균 클러스터링 구성 요소를 사용하여 K-평균 클러스터링 알고리즘을 구성한 다음, 데이터 세트 및 클러스터링 모델 학습 구성 요소(이 문서)를 사용하여 모델을 학습합니다.
- 작업 영역의 저장된 모델 그룹에서 기존의 학습된 클러스터링 모델을 추가할 수도 있습니다.
클러스터에 데이터 할당의 왼쪽 입력 포트에 학습된 모델을 연결합니다.
새 데이터 세트를 입력으로 연결합니다.

이 데이터 세트에서 레이블은 선택 사항입니다. 일반적으로 클러스터링은 자율 학습 방법입니다. 범주를 미리 알고 있어야 하는 것은 아닙니다. 그러나 입력 열은 클러스터링 모델을 학습하는 데 사용된 열과 동일해야 합니다. 그렇지 않으면 오류가 발생합니다.

팁

클러스터 예측에서 디자이너에 기록되는 열 수를 줄이려면 데이터 세트에서 열 선택을 사용하고 열 하위 집합을 선택합니다.
결과(클러스터 할당)를 표시하는 열을 포함하여 전체 입력 데이터 세트를 결과에 포함하려면 추가하려면 선택/결과만 출력하려면 선택 취소 확인란을 선택된 상태로 둡니다.

확인란의 선택을 취소하면 결과만 반환됩니다. 이 옵션은 웹 서비스의 일부로 예측을 만드는 경우에 유용할 수 있습니다.
파이프라인을 제출합니다.

결과

데이터 세트의 값을 보려면 구성 요소를 마우스 오른쪽 단추로 클릭하고 시각화를 선택합니다. 또는 구성 요소를 선택하고 오른쪽 패널에서 출력 탭으로 전환한 다음, 포트 출력에서 히스토그램 아이콘을 클릭하여 결과를 시각화합니다.

구성 요소: 클러스터에 데이터 할당

클러스터에 데이터 할당을 사용하는 방법

결과

추가 리소스