다음을 통해 공유


순열 기능 중요도

중요

Machine Learning Studio(클래식)에 대한 지원은 2024년 8월 31일에 종료됩니다. 해당 날짜까지 Azure Machine Learning으로 전환하는 것이 좋습니다.

2021년 12월 1일부터 새로운 Machine Learning Studio(클래식) 리소스를 만들 수 없습니다. 2024년 8월 31일까지는 기존 Machine Learning Studio(클래식) 리소스를 계속 사용할 수 있습니다.

ML Studio(클래식) 설명서는 사용 중지되며 나중에 업데이트되지 않을 수 있습니다.

학습된 모델과 테스트 데이터 집합에 제공된 기능 변수의 순열 기능 중요도 점수를 계산합니다.

범주: 기능 선택 모듈

참고

적용 대상: Machine Learning Studio(클래식) 전용

유사한 끌어서 놓기 모듈은 Azure Machine Learning 디자이너에서 사용할 수 있습니다.

모듈 개요

이 문서에서는 Machine Learning Studio(클래식)의 순열 기능 중요도 모듈을 사용하여 데이터 세트에 대한 기능 중요도 점수 집합을 계산하는 방법을 설명합니다. 이러한 점수를 사용하여 모델에 사용할 최상의 기능을 결정할 수 있습니다.

이 모듈에서는 기능 값이 한 번에 한 열씩 임의로 순서를 섞고 모델의 성능을 전후로 측정합니다. 성능을 측정하기 위해 제공되는 표준 메트릭 중 하나를 선택할 수 있습니다.

모듈이 반환하는 점수는 순열 뒤 학습된 모델의 변화를 나타냅니다. 중요한 기능은 일반적으로 순서 섞기 프로세스에 더욱 민감하므로 중요도 점수가 더 높아집니다.

이 문서에서는 순열 기능 중요도, 이론적 기반 및 기계 학습의 애플리케이션에 대한 일반적인 개요를 제공합니다. 순열 기능 중요도

순열 기능 중요도를 사용하는 방법

기능 점수 집합을 생성하려면 테스트 데이터 세트뿐만 아니라 이미 학습된 모델이 있어야 합니다.

  1. 실험에 순열 기능 중요 도 모듈을 추가합니다. 이 모듈은 기능 선택 범주에서 찾을 수 있습니다.

  2. 학습된 모델을 왼쪽 입력에 연결합니다. 모델은 회귀 모델 또는 분류 모델이어야 합니다.

  3. 오른쪽 입력에서 모델 학습에 사용되는 데이터 세트와 다른 데이터 세트를 연결합니다. 이 데이터 세트는 학습된 모델을 기반으로 점수를 매기고 기능 값이 변경된 후 모델을 평가하는 데 사용됩니다.

  4. 임의 시드의 경우 임의화에 시드로 사용할 값을 입력합니다. 0(기본값)을 지정하면 시스템 클록에 따라 숫자가 생성됩니다.

    시드 값은 선택 사항이지만 동일한 실험의 실행에서 재현성을 원하는 경우 값을 제공해야 합니다.

  5. 성능을 측정하기 위한 메트릭의 경우 순열 후 모델 품질을 계산할 때 사용할 단일 메트릭을 선택합니다.

    Machine Learning Studio(클래식)는 분류 또는 회귀 모델을 평가하는지 여부에 따라 다음 메트릭을 지원합니다.

    • 분류

      정확도, 정밀도, 재현율, 평균 로그 손실

    • 회귀

      전체 자릿수, 재현율, 평균 절대 오차, 제곱 평균 오차, 상대 절대 오차, 상대 제곱 오차, 결정 계수

    이러한 평가 메트릭 및 계산 방법에 대한 자세한 설명은 평가(Evaluate)를 참조하세요.

  6. 실험을 실행합니다.

  7. 모듈은 기능 열 목록과 관련 점수를 내림차순으로 순위가 매겨진 점수를 출력합니다.

Azure AI 갤러리에서 다음 샘플 실험을 참조하세요.

기술 정보

이 섹션에서는 자주 묻는 질문에 대한 구현 세부 정보, 팁 및 답변을 제공합니다.

다른 기능 선택 방법과 어떻게 비교하나요?

순열 기능 중요도는 각 기능 열의 값을 한 번에 하나의 열로 임의로 변경한 다음 모델을 평가하여 작동합니다.

순열 기능 중요도에서 제공하는 순위는 종종 모델을 만들기 전에 점수를 계산하는 필터 기반 기능 선택에서 얻는 순위와 다릅니다.

순열 기능 중요도는 기능과 대상 값 간의 연결을 측정하지 않고 각 기능이 모델의 예측에 미치는 영향을 캡처하기 때문입니다.

예상 입력

Name 유형 Description
학습된 모델 ILearner 인터페이스 학습된 분류 모델 또는 회귀 모델
테스트 데이터 데이터 테이블 기능 값 순열 후 모델의 점수를 매기고 평가하기 위한 테스트 데이터 집합

모듈 매개 변수

Name Type 범위 Optional 기본값 설명
무작위 초기값 정수 >=0 필수 0 난수 생성기 시드 값
성능 측정을 위한 메트릭 EvaluationMetricType 목록에서 선택 필수 분류 - 정확도 순열 후 모델의 가변성을 평가할 때 사용할 메트릭을 선택합니다.

출력

Name 유형 설명
기능 중요도 데이터 테이블 선택한 메트릭을 기반으로 기능 중요도 결과가 포함된 데이터 집합

예외

예외 설명
오류 0062 서로 다른 학습자 유형으로 두 모델을 비교하려고 하면 예외가 발생합니다.
오류 0024 데이터 세트에 레이블 열이 없으면 예외가 발생합니다.
오류 0105 모듈 정의 파일에서 지원되지 않는 매개 변수 유형을 정의하면 throw됩니다.
오류 0021 모듈에 전달된 데이터 세트 중 일부의 행 수가 너무 적으면 예외가 발생합니다.

참고 항목

기능 선택
필터 기반 기능 선택
주 구성 요소 분석