일대다 다중 클래스
이 문서에서는 Azure Machine Learning 디자이너에서 일대다 다중 클래스 구성 요소를 사용하는 방법을 설명합니다. 목표는 일대다 방식을 사용하여 여러 클래스를 예측할 수 있는 분류 모델을 만드는 것입니다.
이 구성 요소는 결과가 연속 또는 범주 예측 변수에 의존하는 경우 세 개 이상의 가능한 결과를 예측하는 모델을 만드는 데 유용합니다. 이 메서드를 사용하면 여러 출력 클래스가 필요한 문제에 대해 이진 분류 메서드를 사용할 수도 있습니다.
일대다 모델에 대한 자세한 정보
일부 분류 알고리즘은 디자인에 따라 2개 이상의 클래스를 사용할 수 있도록 허용합니다. 기타 값은 두 값(이진 또는 2 클래스 모델) 중 하나로 가능한 결과를 제한합니다. 그러나 이진 분류 알고리즘도 다양한 전략을 통해 다중 클래스 분류 작업에 맞게 조정할 수 있습니다.
이 구성 요소는 여러 출력 클래스 각각에 대해 이진 모델을 만드는 일대다 메서드를 구현합니다. 구성 요소는 이진 분류 문제인 것처럼 보완(모델의 다른 모든 클래스)에 대해 개별 클래스에 대한 이러한 각 이진 모델을 평가합니다. 계산 효율성 외에도(분류자만 n_classes
필요함) 이 방법의 한 가지 이점은 해석성입니다. 각 클래스는 1개와 1개의 분류자만 나타내므로 해당 분류자를 검사하여 클래스에 대한 지식을 얻을 수 있습니다. 이는 다중 클래스 분류에 가장 일반적으로 사용되는 전략이며 공정한 기본 선택입니다. 그런 다음 구성 요소는 이러한 이진 분류자를 실행하고 신뢰도 점수가 가장 높은 예측을 선택하여 예측을 수행합니다.
기본적으로 이 구성 요소는 개별 모델의 앙상블을 만든 다음 결과를 병합하여 모든 클래스를 예측하는 단일 모델을 만듭니다. 모든 이진 분류자는 일대다 모델의 기준으로 사용할 수 있습니다.
예를 들어 2 클래스 지원 벡터 컴퓨터 모델을 구성하고 이를 일대다 다중 클래스 구성 요소에 대한 입력으로 제공한다고 가정해 보겠습니다. 구성 요소는 출력 클래스의 모든 멤버에 대해 2 클래스 지원 벡터 컴퓨터 모델을 만듭니다. 그런 다음, 일 대 모든 메서드를 적용하여 모든 클래스에 대한 결과를 결합합니다.
이 모듈에서는 sklearn의 OneVsRestClassifier를 사용하며 여기에서 세부 정보를 알아볼 수 있습니다.
일대다 다중 클래스 분류자 구성 방법
이 구성 요소는 여러 클래스를 분석하는 이진 분류 모델의 앙상블을 만듭니다. 이 구성 요소를 사용하려면 먼저 이진 분류 모델을 구성하고 학습시켜야 합니다.
이진 모델을 일대다 다중 클래스 구성 요소에 연결합니다. 그런 다음 레이블이 지정된 학습 데이터 세트와 함께 모델 학습을 사용하여 모델 앙상블을 학습시킵니다.
모델을 결합하면 일대다 다중 클래스는 여러 이진 분류 모델을 만들고 각 클래스에 대한 알고리즘을 최적화한 다음 모델을 병합합니다. 학습 데이터 세트에 여러 클래스 값이 있을 수 있더라도 구성 요소는 이러한 작업을 수행합니다.
디자이너에서 일대다 다중 클래스 구성 요소를 파이프라인에 추가합니다. 이 구성 요소는 분류 범주의 기계 학습 - 초기화에서 찾을 수 있습니다.
One-vs-All 다중 클래스 분류자에는 자체의 구성 가능한 매개 변수가 없습니다. 모든 사용자 지정은 입력으로 제공되는 이진 분류 모델에서 수행해야 합니다.
파이프라인에 이진 분류 모델을 추가하고 해당 모델을 구성합니다. 예를 들어 2클래스 지원 벡터 컴퓨터 또는 2클래스 향상된 의사 결정 트리를 사용할 수 있습니다.
파이프라인에 모델 학습 구성 요소를 추가합니다. 일대다 다중 클래스 출력인, 학습되지 않은 분류자 연결
학습 모델의 다른 입력에서 여러 클래스 값이 있는 레이블이 지정된 학습 데이터 세트를 연결합니다.
파이프라인을 제출합니다.
결과
학습을 완료한 후에는 모델을 사용하여 다중 클래스 예측을 만들 수 있습니다.
또는 레이블이 지정된 유효성 검사 데이터 세트에 대한 교차 유효성 검사를 위해 학습되지 않은 분류자를 교차 유효성 검사 모델에 전달할 수 있습니다.
다음 단계
Azure Machine Learning에서 사용 가능한 구성 요소 집합을 참조하세요.