2클래스 지원 벡터 머신 구성 요소

이 문서에서는 Azure Machine Learning 디자이너의 구성 요소에 대해 설명합니다.

이 구성 요소를 사용하여 지원 벡터 머신 알고리즘을 기반으로 하는 모델을 만듭니다.

SVM(Support Vector Machine)은 잘 연구된 감독 학습 방법의 클래스입니다. 이 특정 구현은 연속 또는 범주형 변수를 기반으로 두 가지 가능한 결과를 예측하는 데 적합합니다.

모델 매개 변수를 정의한 후에는 학습 구성 요소를 사용하고 레이블 또는 결과 열을 포함하는 태그가 지정된 데이터 세트를 제공하여 모델을 학습시킵니다.

Support Vector Machine 정보

지원 벡터 컴퓨터는 초기 기계 학습 알고리즘 중 하나이며, SVM 모델은 정보 검색에서부터 텍스트 및 이미지 분류에 이르기까지 여러 응용 프로그램에서 사용되었습니다. SVM은 분류 및 회귀 작업 모두에 사용할 수 있습니다.

이 SVM 모델은 레이블이 지정된 데이터가 필요한 감독 학습 모델입니다. 학습 과정에서 알고리즘은 입력 데이터를 분석하고 초평면이라는 다차원 기능 공간의 패턴을 인식합니다. 모든 입력 예시는 이 공간에서 포인트로 표현되며, 범주가 가능한 한 넓고 명확한 간격으로 분할되는 방식으로 출력 범주에 매핑됩니다.

예측을 위해 SVM 알고리즘은 새 예제를 한 범주 또는 다른 범주에 할당하고 동일한 공간에 매핑합니다.

구성 방법

이 모델 유형을 사용하여 분류자를 학습시키기 전에 데이터 집합을 정규화하는 것이 좋습니다.

  1. 파이프라인에 2클래스 지원 벡터 머신 구성 요소를 추가합니다.

  2. 트레이너 모드 만들기 옵션을 설정하여 모델을 학습시킬 방법을 지정합니다.

    • 단일 매개 변수: 모델을 어떻게 구성하려는지 아는 경우 특정 값 집합을 인수로 제공할 수 있습니다.

    • 매개 변수 범위: 최적의 매개 변수가 확실하지 않은 경우 모델 하이퍼 매개 변수 조정 구성 요소를 사용하여 최적의 매개 변수를 찾을 수 있습니다. 사용자는 특정 범위의 값을 제공하고 트레이너는 여러 설정 조합을 반복하여 최상의 결과를 생성하는 값의 조합을 결정합니다.

  3. 반복 횟수에 모델을 빌드할 때 사용된 반복 횟수를 나타내는 숫자를 입력합니다.

    이 매개 변수를 사용하면 학습 속도와 정확도 간의 균형을 제어할 수 있습니다.

  4. Lambda에 L1 정규화의 가중치로 사용할 값을 입력합니다.

    이 정규화 계수는 모델을 조정하는 데 사용할 수 있습니다. 값이 클수록 모델이 더 복잡해집니다.

  5. 학습 전에 기능을 정규화하려면 기능 정규화 옵션을 선택합니다.

    정규화를 적용하면 학습 전에 데이터 포인트가 평균의 중심에 있고 표준 편차의 1단위를 갖도록 크기가 조정됩니다.

  6. 단위 구체에 프로젝션 옵션을 선택하여 계수를 정규화합니다.

    값을 단위 공간에 프로젝션한다는 것은 학습 전에 데이터 포인트가 0의 중심에 있고 표준 편차의 1단위를 갖도록 크기가 조정됨을 의미합니다.

  7. 실행 간에 재현성을 보장하려면 난수 시드에서 시드로 사용할 정수 값을 입력합니다. 그러지 않으면 시스템 클록 값이 시드로 사용되어 실행 간에 약간 다른 결과를 초래할 수 있습니다.

  8. 레이블이 지정된 데이터 세트를 연결하고 모델을 학습시킵니다.

    • 트레이너 모드 만들기단일 매개 변수로 설정하는 경우 태그가 지정된 데이터 세트와 모델 학습 구성 요소를 연결합니다.

    • 트레이너 모드 만들기매개 변수 범위로 설정하는 경우 태그가 지정된 데이터 세트를 연결하고 모델 하이퍼 매개 변수 조정을 사용하여 모델을 학습시킵니다.

    참고

    모델 학습에 매개 변수 범위를 전달하는 경우 단일 매개 변수 목록의 기본값만 사용합니다.

    매개 변수 값의 단일 집합을 모델 하이퍼 매개 변수 조정 구성 요소에 전달하는 경우 각 매개 변수에 대한 설정 범위를 예상할 때 해당 값을 무시하고 학습자에 대한 기본값을 사용합니다.

    매개 변수 범위 옵션을 선택하고 임의 매개 변수의 단일 값을 입력하는 경우 다른 매개 변수가 값 범위에서 변경되더라도 지정한 단일 값은 스윕 전체에서 사용됩니다.

  9. 파이프라인을 제출합니다.

결과

학습 완료 후 다음이 수행됩니다.

  • 학습된 모델의 스냅샷을 저장하려면 출력 탭을 모델 학습 구성 요소의 오른쪽 패널에서 선택합니다. 데이터 세트 등록 아이콘을 선택하여 모델을 재사용 가능한 구성 요소로 저장합니다.

  • 모델을 채점에 사용하려면 모델 채점 구성 요소를 파이프라인에 추가합니다.

다음 단계

Azure Machine Learning에서 사용 가능한 구성 요소 집합을 참조하세요.