다중 클래스 신경망 구성 요소

이 문서에서는 Azure Machine Learning 디자이너의 구성 요소에 대해 설명합니다.

이 구성 요소를 사용하여 여러 값이 포함된 대상을 예측하는 데 사용할 수 있는 신경망 모델을 만듭니다.

예를 들어 이러한 종류의 신경망은 숫자 또는 문자 인식, 문서 분류 및 패턴 인식과 같은 복잡한 Computer Vision 작업에 사용될 수 있습니다.

신경망을 사용하는 분류는 감독된 학습 방법이며 따라서 레이블 열을 포함 하는 태그가 지정된 데이터 집합이 필요합니다.

모델을 학습하기 위해 모델 및 태그가 지정된 데이터 집합을 학습 모델에 입력해서 제공할 수 있습니다. 그러면 학습된 모델을 사용하여 새로운 입력 예제를 위한 값을 예측할 수 있습니다.

신경망 정보

신경망은 상호 연결된 레이어 집합입니다. 입력은 첫 번째 레이어이며 가중치가 적용된 에지와 노드로 구성된 비순환 그래프에 의해 출력 레이어에 연결됩니다.

입력 및 출력 레이어 사이에 여러 개의 숨겨진 레이어를 삽입할 수 있습니다. 대부분의 예측 작업은 숨겨진 계층을 하나 또는 몇 개만 사용하여 쉽게 완료할 수 있습니다. 그러나 최근 연구에 따르면 여러 레이어가 있는 DNN(심층 신경망)이 이미지 또는 음성 인식과 같은 복잡한 작업에 효과적일 수 있습니다. 연속된 레이어는 더 깊은 의미 체계를 모델링하는 데 사용됩니다.

입력 및 출력 간의 관계는 입력 데이터의 신경망 학습에서 학습됩니다. 그래프의 방향은 숨겨진 레이어 및 출력 레이어를 통해 입력으로부터 진행됩니다. 레이어의 모든 노드는 가중치가 적용된 에지를 통해 다음 레이어의 노드에 연결됩니다.

특정 입력에 대한 네트워크 출력을 계산하기 위해 숨겨진 레이어의 각 노드 및 출력 레이어에서 값이 계산됩니다. 값은 이전 레이어에서 노드 값의 가중치가 적용된 합계를 계산하여 설정됩니다. 그러면 활성화 함수가 가중치가 적용된 합계에 적용됩니다.

다중 클래스 신경망 두성

  1. 디자이너에서 파이프라인에 다중 클래스 신경망 구성 요소를 추가합니다. 이 구성 요소는 분류 범주의 기계 학습, 초기화에서 찾을 수 있습니다.

  2. 트레이너 모드 만들기: 모델을 학습하는 방법을 지정하려면 이 옵션을 사용합니다.

    • 단일 매개 변수: 모델을 구성하려는 방법을 이미 알고 있는 경우 이 옵션을 선택합니다.

    • 매개 변수 범위: 최적 매개 변수를 잘 모르는 상태에서 매개 변수 비우기를 실행하려면 이 옵션을 선택합니다. 반복할 값의 범위를 선택하면 모델 하이퍼 매개 변수 튜닝이 제공된 설정의 가능한 모든 조합을 반복하여 최적 결과를 생성하는 하이퍼 매개 변수를 확인합니다.

  3. 숨겨진 레이어 사양: 만들 네트워크 구조의 유형을 선택합니다.

    • 완전히 연결된 경우: 기본 신경망 아키텍처를 사용하여 모델을 만들려면 이 옵션을 선택합니다. 다중 클래스 신경망 모델의 경우 기본값은 다음과 같습니다.

      • 숨겨진 레이어 하나
      • 이 출력 레이어는 숨겨진 레이어에 완전히 연결됩니다.
      • 이 숨겨진 레이어는 입력 레이어에 완전히 연결됩니다.
      • 입력 계층의 노드 수는 학습 데이터의 기능 수에 따라 결정됩니다.
      • 숨겨진 레이어의 노드 수는 사용자가 설정할 수 있습니다. 기본값은 100입니다.
      • 출력 계층의 노드 수는 클래스의 수에 따라 다릅니다.
  4. 숨겨진 노드 수: 이 옵션을 사용하면 기본 아키텍처에서 숨겨진 노드 수를 사용자 지정할 수 있습니다. 숨겨진 노드 수를 입력합니다. 기본값은 하나의 숨겨진 레이어에 100개의 노드가 포함됩니다.

  5. 학습 속도: 수정 전에 각 반복에서 수행되는 단계의 크기를 정의합니다. 학습 속도의 값이 클수록 모델이 더 빨리 수렴될 수 있지만 로컬 최소치를 과도하게 사용할 수 있습니다.

  6. 학습 반복 횟수: 알고리즘이 학습 사례를 처리해야 하는 최대 횟수를 지정합니다.

  7. 초기 학습 가중치 지름: 학습 프로세스를 시작할 때 노드 가중치를 지정합니다.

  8. 모멘텀: 이전 반복에서 노드를 학습하는 동안 적용할 가중치를 지정합니다.

  9. 예제 섞기: 반복하는 사이에 사례를 섞으려면 이 옵션을 선택합니다.

    이 옵션을 해제하면 파이프라인을 실행할 때마다 정확히 동일한 순서로 사례가 처리됩니다.

  10. 난수 시드: 동일한 파이프라인의 실행 간에 반복성을 보장 하려는 경우 시드로 사용할 값을 입력합니다.

  11. 모델을 학습시킵니다.

    • 트레이너 모드 만들기단일 매개 변수로 설정하는 경우 태그가 지정된 데이터 세트와 모델 학습 구성 요소를 연결합니다.

    • 트레이너 모드 만들기매개 변수 범위로 설정하는 경우 태그가 지정된 데이터 세트를 연결하고 모델 하이퍼 매개 변수 조정을 사용하여 모델을 학습시킵니다.

    참고

    모델 학습에 매개 변수 범위를 전달하는 경우 단일 매개 변수 목록의 기본값만 사용합니다.

    매개 변수 값의 단일 집합을 모델 하이퍼 매개 변수 조정 구성 요소에 전달하는 경우 각 매개 변수에 대한 설정 범위를 예상할 때 해당 값을 무시하고 학습자에 대한 기본값을 사용합니다.

    매개 변수 범위 옵션을 선택하고 임의 매개 변수의 단일 값을 입력하는 경우 다른 매개 변수가 값 범위에서 변경되더라도 지정한 단일 값은 스윕 전체에서 사용됩니다.

결과

학습 완료 후 다음이 수행됩니다.

  • 학습된 모델의 스냅샷을 저장하려면 출력 탭을 모델 학습 구성 요소의 오른쪽 패널에서 선택합니다. 데이터 세트 등록 아이콘을 선택하여 모델을 재사용 가능한 구성 요소로 저장합니다.

다음 단계

Azure Machine Learning에서 사용 가능한 구성 요소 집합을 참조하세요.