순열 기능 중요도

이 문서에서는 Azure Machine Learning 디자이너에서 순열 기능 중요도 구성 요소를 사용하여 데이터 세트에 대한 기능 중요도 점수 집합을 계산하는 방법을 설명합니다. 이러한 점수를 사용하여 모델에 사용할 최상의 기능을 결정할 수 있습니다.

이 구성 요소에서 기능 값은 한 번에 한 열을 임의로 섞은 값이 됩니다. 모델의 성능은 이전 및 이후에 여러 번 측정됩니다. 표준 메트릭 중 하나를 선택하여 성능을 측정할 수 있습니다.

구성 요소가 반환하는 점수는 순열 뒤 학습된 모델의 성능에서 변경을 나타냅니다. 중요한 기능은 일반적으로 순서 섞기 프로세스보다 더 중요하므로 중요도 점수가 높아집니다.

이 문서 순열 기능 중요도에서는 기계 학습의 순열 기능, 이론상의 해당 응용 프로그램에 대한 개요를 제공합니다.

순열 기능 중요도를 사용하는 방법

기능 점수 집합을 생성하려면 이미 학습된 모델 및 테스트 데이터 집합이 있어야 합니다.

  1. 순열 기능 중요도 구성 요소를 파이프라인에 추가합니다. 이 구성 요소는 기능 선택 범주에서 찾을 수 있습니다.

  2. 학습된 모델을 왼쪽 입력에 연결합니다. 모델은 회귀 모델 또는 분류 모델이어야 합니다.

  3. 오른쪽 입력에서 데이터 집합을 연결합니다. 모델 학습에 사용하는 데이터 집합과 다른 하나를 선택하기를 권합니다. 이 데이터 집합은 학습된 모델을 기준으로 점수를 매깁니다. 또한 기능 값이 변경된 후 모델을 평가하는 데 사용됩니다.

  4. 임의 초기값으로 임의 값의 초기값으로 사용할 값을 입력 합니다. 0(기본값)을 지정하면 시스템 클록에 따라 숫자가 생성됩니다.

    초기값은 선택 사항이지만 동일한 파이프라인의 실행 간에 재현 가능성을 원한다면 경우의 값을 제공해야 합니다.

  5. 성능 측정 메트릭의 경우 순열 후 모델 품질을 계산할 때 사용할 단일 메트릭을 선택합니다.

    Azure Machine Learning 디자이너는 분류 또는 회귀 모델을 평가하는지 여부에 따라 다음 메트릭을 지원합니다.

    • 분류

      정확도, 정밀도, 재현율

    • 회귀

      정밀도, 재현율, 평균 절대 오차, 제곱 평균 오차, 상대 절대 오차, 상대 제곱 오차, 결정 계수

    이러한 평가 메트릭 및 계산 방법에 대한 자세한 설명은 모델 평가를 참조하세요.

  6. 파이프라인을 제출합니다.

  7. 구성 요소는 기능 열 목록과 관련 점수를 출력합니다. 목록은 점수의 내림차순으로 순위가 매겨집니다.

기술 정보

순열 기능 중요도는 각 기능 열의 값을 한 번에 한 열 씩 임의로 변경하여 작동합니다. 그런 다음 모델을 평가합니다.

구성 요소에서 제공하는 순위는 필터 기반 기능 선택에서 얻는 순위와 다른 경우가 많습니다. 필터 기반 기능 선택은 모델을 생성하기 전에 점수를 계산합니다.

차이가 나는 이유는 순열 기능 중요도가 기능과 대상 값 간의 연결을 측정하지 않기 때문입니다. 대신 각 기능이 모델의 예측에 미치는 영향을 캡처합니다.

다음 단계

Azure Machine Learning에서 사용 가능한 구성 요소 집합을 참조하세요.