다중 클래스 로지스틱 회귀 구성 요소

이 문서에서는 Azure Machine Learning 디자이너의 구성 요소에 대해 설명합니다.

이 구성 요소를 사용하여 여러 값을 예측하는 데 사용할 수 있는 로지스틱 회귀 모델을 만들 수 있습니다.

로지스틱 회귀 분석을 사용한 분류는 감독 학습 방법이므로 레이블이 지정된 데이터 세트가 필요합니다. 모델 학습 등의 구성 요소에 대한 입력으로 모델과 레이블이 지정된 데이터 세트를 제공하여 모델을 학습합니다. 그런 다음, 학습된 모델을 사용하여 새로운 입력 예제의 값을 예측할 수 있습니다.

Azure Machine Learning에서는 이진 또는 이분 변수의 분류에 적합한 2클래스 로지스틱 회귀 구성 요소도 제공합니다.

다중 클래스 로지스틱 회귀 분석 정보

로지스틱 회귀 분석은 결과의 확률을 예측하는 데 사용되는 잘 알려진 통계 방법으로, 분류 작업에 널리 사용됩니다. 알고리즘은 데이터를 로지스틱 함수에 맞추는 방법으로 이벤트 발생 확률을 예측합니다.

다중 클래스 로지스틱 회귀 분석에서는 분류자를 사용하여 여러 결과를 예측할 수 있습니다.

다중 클래스 로지스틱 회귀 분석 구성

  1. 다중 클래스 로지스틱 회귀 구성 요소를 파이프라인에 추가합니다.

  2. 트레이너 모드 만들기 옵션을 설정하여 모델을 학습시키려는 방법을 지정합니다.

    • 단일 매개 변수: 원하는 모델 구성 방법을 알고 있는 경우 이 옵션을 선택하고 특정 값 세트를 인수로 제공합니다.

    • 매개 변수 범위: 최적 매개 변수를 잘 모르는 상태에서 매개 변수 스윕을 실행하려면 이 옵션을 선택합니다. 반복할 값의 범위를 선택하면 모델 하이퍼 매개 변수 튜닝이 제공된 설정의 가능한 모든 조합을 반복하여 최적 결과를 생성하는 하이퍼 매개 변수를 확인합니다.

  3. 최적화 허용 오차에서 최적화 프로그램 수렴의 임계값을 지정합니다. 반복 간의 개선 수준이 임계값보다 낮으면 알고리즘이 중지되며 현재 모델이 반환됩니다.

  4. L1 정규화 가중치, L2 정규화 가중치: 정규화 매개 변수 L1과 L2에 사용할 값을 입력합니다. 둘 다에 0이 아닌 값을 사용하는 것이 좋습니다.

    정규화는 극단적인 계수 값을 가진 모델에 페널티를 주어 과잉 맞춤을 방지하는 방법입니다. 정규화는 계수 값과 연결된 페널티를 가설의 오류에 추가하여 작동합니다. 극단적인 계수 값을 가진 정확한 모델이 더 많은 페널티를 받고, 더 보수적인 값이 있는 덜 정확한 모델이 더 적은 페널티를 받습니다.

    L1 및 L2 정규화가 미치는 영향과 사용 방법은 여러 가지가 있습니다. L1은 스파스 모델에 적용할 수 있으며 이는 고차원 데이터로 작업할 때 유용합니다. 한편, L2 정규화는 스파스가 아닌 데이터에 사용하는 것이 좋습니다. 이 알고리즘은 L1 및 L2 정규화 값의 선형 조합을 지원합니다. 즉, x = L1y = L2이면 ax + by = c는 정규화 요소의 선형 범위를 정의합니다.

    로지스틱 회귀 모델을 위해 L1 및 L2 요소의 여러 선형 조합이 고안되었습니다(예: 탄력적 망 정규화).

  5. 난수 시드: 실행할 때마다 결과를 반복할 수 있게 하려는 경우 알고리즘의 시드로 사용할 정수 값을 입력합니다. 그러지 않으면 시스템 클록 값이 시드로 사용되므로 동일한 파이프라인을 실행할 때 약간 다른 결과를 생성할 수 있습니다.

  6. 레이블이 지정된 데이터 세트를 연결하고 모델을 학습합니다.

    • 트레이너 모드 만들기단일 매개 변수로 설정하는 경우 태그가 지정된 데이터 세트와 모델 학습 구성 요소를 연결합니다.

    • 트레이너 모드 만들기매개 변수 범위로 설정하는 경우 태그가 지정된 데이터 세트를 연결하고 모델 하이퍼 매개 변수 조정을 사용하여 모델을 학습시킵니다.

    참고

    모델 학습에 매개 변수 범위를 전달하는 경우 단일 매개 변수 목록의 기본값만 사용합니다.

    매개 변수 값의 단일 집합을 모델 하이퍼 매개 변수 조정 구성 요소에 전달하는 경우 각 매개 변수에 대한 설정 범위를 예상할 때 해당 값을 무시하고 학습자에 대한 기본값을 사용합니다.

    매개 변수 범위 옵션을 선택하고 임의 매개 변수의 단일 값을 입력하는 경우 다른 매개 변수가 값 범위에서 변경되더라도 지정한 단일 값은 스윕 전체에서 사용됩니다.

  7. 파이프라인을 제출합니다.

다음 단계

Azure Machine Learning에서 사용 가능한 구성 요소 집합을 참조하세요.