다음을 통해 공유


클러스터링 모듈

중요

Machine Learning Studio(클래식)에 대한 지원은 2024년 8월 31일에 종료됩니다. 해당 날짜까지 Azure Machine Learning으로 전환하는 것이 좋습니다.

2021년 12월 1일부터 새로운 Machine Learning Studio(클래식) 리소스를 만들 수 없습니다. 2024년 8월 31일까지는 기존 Machine Learning Studio(클래식) 리소스를 계속 사용할 수 있습니다.

ML Studio(클래식) 설명서는 사용 중지되며 나중에 업데이트되지 않을 수 있습니다.

이 문서에서는 클러스터링 모델 만들기를 지원하는 Machine Learning Studio(클래식)의 모듈에 대해 설명합니다.

참고

적용 대상: Machine Learning Studio(클래식) 전용

유사한 끌어서 놓기 모듈은 Azure Machine Learning 디자이너에서 사용할 수 있습니다.

클러스터링의 정의

기계 학습에서 클러스터링은 데이터 요소를 유사한 클러스터로 그룹화하는 방법입니다. 구분이라고도 합니다.

수년에 걸쳐 많은 클러스터링 알고리즘이 개발되었습니다. 거의 모든 클러스터링 알고리즘은 개별 항목의 기능을 사용하여 유사한 항목을 찾습니다. 예를 들어 클러스터링을 적용하여 인구 통계별로 비슷한 사람을 찾을 수 있습니다. 텍스트 분석과 함께 클러스터링을 사용하여 비슷한 주제나 감정으로 문장을 그룹화할 수 있습니다.

클러스터링을 비감독 학습 기술이라고 하는 이유는 레이블이 지정되지 않은 데이터에 사용될 수 있기 때문입니다. 실제로 클러스터링은 새 패턴을 검색하는 데 유용한 첫 번째 단계이며 데이터가 어떻게 구성될지 또는 항목이 어떻게 관련되는지에 대한 사전 지식이 거의 필요하지 않습니다. 클러스터링은 다른 더 많은 예측 알고리즘을 사용하여 분석하기 전에 데이터를 탐색하는 데 자주 사용됩니다.

클러스터링 모델을 만드는 방법

Machine Learning Studio(클래식)에서는 레이블이 지정된 데이터나 레이블이 지정되지 않은 데이터로 클러스터링을 사용할 수 있습니다.

  • 레이블이 지정되지 않은 데이터에서 클러스터링 알고리즘은 가장 가까운 데이터 요소를 결정하고 중앙 지점 또는 중심점 주위에 클러스터를 만듭니다. 그런 다음 클러스터 ID를 데이터 그룹에 대한 임시 레이블로 사용할 수 있습니다.

  • 데이터에 레이블이 있는 경우 레이블을 사용하여 클러스터 수를 구동하거나 레이블을 다른 기능으로 사용할 수 있습니다.

클러스터링 알고리즘을 구성한 후에는 클러스터링 모델 학습 또는 스윕 클러스터링 모듈을 사용하여 데이터를 학습시킵니다.

모델을 학습할 때 이 모델을 사용하여 새 데이터 포인트에 대한 클러스터 멤버 자격을 예측합니다. 예를 들어 클러스터링을 사용하여 구매 동작으로 고객을 그룹화한 경우 모델을 사용하여 새 고객의 구매 동작을 예측할 수 있습니다.

모듈 목록

클러스터링 범주에는 다음 모듈이 포함됩니다.

다른 클러스터링 알고리즘을 사용하거나 R을 사용하여 사용자 지정 클러스터링 모델을 만들려면 다음 항목을 참조하세요.

작동 중인 클러스터링의 예는 Azure AI 갤러리를 참조하세요.

알고리즘 선택에 대한 도움말은 다음 문서를 참조하세요.

참고 항목