2클래스 신경망 구성 요소

이 문서에서는 Azure Machine Learning 디자이너의 구성 요소에 대해 설명합니다.

이 구성 요소를 사용하여 두 개의 값만 포함된 대상을 예측하는 데 사용할 수 있는 신경망 모델을 만듭니다.

신경망을 사용한 분류는 지도 학습 방법이며 따라서 레이블 열을 포함하는 ‘태그가 지정된 데이터 세트’가 필요합니다. 예를 들어 이러한 신경망 모델을 사용하여 환자에게 특정 질병이 있는지 여부 또는 지정된 시간 내에 머신이가 실패할 가능성이 있는지 여부와 같은 이진 결과를 예측할 수 있습니다.

모델을 정의한 후에는 태그가 지정된 데이터 세트와 모델을 모델 학습을 위한 입력으로 제공하여 모델을 학습시킵니다. 그러면 학습된 모델을 사용하여 새 입력 값을 예측할 수 있습니다.

신경망에 대한 자세한 정보

신경망은 상호 연결된 레이어의 세트입니다. 입력은 첫 번째 레이어이며 가중치가 적용된 에지와 노드로 구성된 비순환 그래프에 의해 출력 레이어에 연결됩니다.

입력 및 출력 레이어 사이에 여러 개의 숨겨진 레이어를 삽입할 수 있습니다. 대부분의 예측 작업은 숨겨진 계층을 하나 또는 몇 개만 사용하여 쉽게 완료할 수 있습니다. 그러나 최근 연구에 따르면 여러 레이어가 있는 DNN(심층 신경망)이 이미지 또는 음성 인식과 같은 복잡한 작업에 효과적일 수 있습니다. 연속된 레이어는 더 깊은 의미 체계를 모델링하는 데 사용됩니다.

입력 및 출력 간의 관계는 입력 데이터의 신경망 학습에서 학습됩니다. 그래프의 방향은 숨겨진 레이어 및 출력 레이어를 통해 입력으로부터 진행됩니다. 레이어의 모든 노드는 가중치가 적용된 에지를 통해 다음 레이어의 노드에 연결됩니다.

특정 입력에 대한 네트워크 출력을 계산하기 위해 숨겨진 레이어의 각 노드 및 출력 레이어에서 값이 계산됩니다. 값은 이전 레이어에서 노드 값의 가중치가 적용된 합계를 계산하여 설정됩니다. 그러면 활성화 함수가 가중치가 적용된 합계에 적용됩니다.

구성 방법

  1. 2클래스 신경망 구성 요소를 파이프라인에 추가합니다. 이 구성 요소는 분류 범주의 기계 학습, 초기화에서 찾을 수 있습니다.

  2. 트레이너 모드 만들기 옵션을 설정하여 모델을 학습시키려는 방법을 지정합니다.

    • 단일 매개 변수: 모델을 구성하려는 방법을 이미 알고 있는 경우 이 옵션을 선택합니다.

    • 매개 변수 범위: 최적의 매개 변수가 확실하지 않은 경우 모델 하이퍼 매개 변수 조정 구성 요소를 사용하여 최적의 매개 변수를 찾을 수 있습니다. 사용자는 특정 범위의 값을 제공하고 트레이너는 여러 설정 조합을 반복하여 최상의 결과를 생성하는 값의 조합을 결정합니다.

  3. 숨겨진 레이어 사양의 경우 만들 네트워크 아키텍처의 유형을 선택합니다.

    • 완전히 연결된 사례: 다음과 같이 2클래스 신경망에 대해 정의된 기본 신경망 아키텍처를 사용합니다.

      • 숨겨진 레이어가 하나 있습니다.

      • 출력 계층은 숨겨진 계층에 완전히 연결되며 숨겨진 계층은 입력 계층에 완전히 연결됩니다.

      • 입력 레이어의 노드 수는 학습 데이터의 특성 수와 같습니다.

      • 사용자가 숨겨진 레이어의 노드 수를 설정합니다. 기본값은 100입니다.

      • 노드 수는 클래스 수와 동일합니다. 2클래스 신경망의 경우 이는 모든 입력이 출력 레이어의 두 노드 중 하나에 매핑되어야 함을 의미합니다.

  4. 학습 속도의 경우 수정하기 전에 각 반복에서 수행되는 단계의 크기를 정의합니다. 학습 속도 값이 크면 모델이 빠르게 수렴되지만 로컬 최소값이 과도해질 수 있습니다.

  5. 학습 반복 횟수에서는 알고리즘이 학습 사례를 처리해야 하는 최대 횟수를 지정합니다.

  6. 초기 학습 가중치 지름의 경우 학습 프로세스를 시작할 때 노드 가중치를 지정합니다.

  7. 모멘텀의 경우 이전 반복에서 노드를 학습하는 동안 적용할 가중치를 지정합니다.

  8. 예제 섞기 옵션을 선택하여 반복 간의 사례 순서를 섞습니다. 이 옵션의 선택을 취소하면 파이프라인을 실행할 때마다 정확히 동일한 순서로 사례가 처리됩니다.

  9. 난수 시드에 시드로 사용할 값을 입력합니다.

    동일한 파이프라인의 실행에서 반복성을 유지하려는 경우 시드 값을 지정하는 것이 좋습니다. 그러지 않으면 시스템 클록 값이 시드로 사용되므로 파이프라인을 실행할 때마다 약간 다른 결과가 발생할 수 있습니다.

  10. 레이블이 지정된 데이터 세트를 파이프라인에 추가하고 모델을 학습시킵니다.

    • 트레이너 모드 만들기단일 매개 변수로 설정하는 경우 태그가 지정된 데이터 세트와 모델 학습 구성 요소를 연결합니다.

    • 트레이너 모드 만들기매개 변수 범위로 설정하는 경우 태그가 지정된 데이터 세트를 연결하고 모델 하이퍼 매개 변수 조정을 사용하여 모델을 학습시킵니다.

    참고

    모델 학습에 매개 변수 범위를 전달하는 경우 단일 매개 변수 목록의 기본값만 사용합니다.

    매개 변수 값의 단일 집합을 모델 하이퍼 매개 변수 조정 구성 요소에 전달하는 경우 각 매개 변수에 대한 설정 범위를 예상할 때 해당 값을 무시하고 학습자에 대한 기본값을 사용합니다.

    매개 변수 범위 옵션을 선택하고 임의 매개 변수의 단일 값을 입력하는 경우 다른 매개 변수가 값 범위에서 변경되더라도 지정한 단일 값은 스윕 전체에서 사용됩니다.

  11. 파이프라인을 제출합니다.

결과

학습 완료 후 다음이 수행됩니다.

  • 학습된 모델의 스냅샷을 저장하려면 출력 탭을 모델 학습 구성 요소의 오른쪽 패널에서 선택합니다. 데이터 세트 등록 아이콘을 선택하여 모델을 재사용 가능한 구성 요소로 저장합니다.

  • 모델을 채점에 사용하려면 모델 채점 구성 요소를 파이프라인에 추가합니다.

다음 단계

Azure Machine Learning에서 사용 가능한 구성 요소 집합을 참조하세요.