다음을 통해 공유


표시기 값으로 변환

중요

Machine Learning Studio(클래식)에 대한 지원은 2024년 8월 31일에 종료됩니다. 해당 날짜까지 Azure Machine Learning으로 전환하는 것이 좋습니다.

2021년 12월 1일부터 새로운 Machine Learning Studio(클래식) 리소스를 만들 수 없습니다. 2024년 8월 31일까지는 기존 Machine Learning Studio(클래식) 리소스를 계속 사용할 수 있습니다.

ML Studio(클래식) 설명서는 사용 중지되며 나중에 업데이트되지 않을 수 있습니다.

열의 범주 값을 지표 값으로 변환

범주: 데이터 변환/조작

참고

적용 대상: Machine Learning Studio(클래식)

유사한 끌어서 놓기 모듈은 Azure Machine Learning 디자이너에서 사용할 수 있습니다.

모듈 개요

이 문서에서는 Machine Learning Studio(클래식)에서 표시기 값으로 변환 모듈을 사용하는 방법을 설명합니다. 이 모듈의 목적은 범주 값이 포함된 열을 기계 학습 모델의 기능으로 더 쉽게 사용할 수 있는 일련의 이진 표시기 열로 변환하는 것입니다.

표시기 값으로 변환을 구성하는 방법

  1. 표시기 값으로 변환 모듈을 Machine Learning 실험에 추가하고 변환하려는 열이 포함된 데이터 세트에 연결합니다. 이 모듈은 조작 범주의 데이터 변환 아래에서 찾을 수 있습니다.

  2. 열 선택기를 사용하여 하나 이상의 범주 열을 선택합니다.

    선택한 열이 범주인지 확인하려면 실험에서 표시기 값으로 변환하기 전에 메타데이터 편집을 사용하여 대상 열을 범주로 표시합니다.

  3. 새 부울 열 출력하려면 범주 열 덮어쓰기 옵션을 선택합니다.

    기본적으로 이 옵션은 꺼져 있으므로 관련 표시기 열과 함께 원본인 범주 열을 볼 수 있습니다.

    덮어쓰기 옵션을 선택하는 경우 원본 열이 실제로 삭제되거나 수정되지는 않습니다. 대신 새 열이 생성되고 출력 데이터 세트에 표시되며 원본 열은 작업 영역에서 사용할 수 있는 상태로 유지됩니다. 원본 데이터를 확인해야 하는 경우 언제든지 열 추가 모듈을 사용하여 원본 열을 다시 추가할 수 있습니다.

  4. 실험을 실행합니다.

결과

예를 들어 서버에 실패 확률이 높거나 중간 또는 낮은지 여부를 나타내는 점수가 있는 열이 있다고 가정합니다.

서버 ID입니다. 실패 점수
10301 낮음
10302 중간
10303 높음

표시기 값으로 변환을 적용하면 레이블의 단일 열이 부울 값을 포함하는 여러 열로 변환됩니다.

서버 ID입니다. 실패 점수 - 낮음 실패 점수 - 보통 실패 점수 - 높음
10301 1 0 0
10302 0 1 0
10303 0 0 1

변환의 작동 방식은 다음과 같습니다.

  • 위험을 설명하는 실패 점수 열에는 세 가지 값(높음, 보통, 중간)만 가능하며 누락 값은 없습니다. 따라서 정확히 세 개의 새 열이 만들어집니다.

  • 새 표시기 열의 이름은 <원본 열> - <데이터 값> 패턴을 사용하여 원본 열의 열 제목과 값에 따라 지정됩니다.

  • 정확히 하나의 표시기 열에는 1, 다른 모든 표시기 열에는 0이 있어야 합니다. 각 서버에는 하나의 위험 등급만 있을 수 있기 때문입니다.

이제 세 개의 표시기 열을 기능으로 사용하고 다른 위험 수준과 연결된 다른 속성과의 상관 관계를 분석할 수 있습니다.

이 모듈의 사용 방법에 대한 예제를 보려면 Azure AI 갤러리를 참조하세요.

  • 유방암 탐지: 환자는 환자 ID 번호에 따라 그룹으로 범주화되고 지표 은 환자가 속한 그룹에 플래그를 지정하는 데 사용됩니다. 그런 후에 모델 점수를 매길 때 그룹 표시기를 사용합니다.

  • 직접 마케팅: 확률은 수학 적용 연산을 사용하여 상수와 비교되며, 점수가 상수 위 또는 아래에 있는지 여부를 나타내는 예/아니요 값은 새 표시기 열로 바꿉니다.

  • 네트워크 침입 검색: 로그 데이터는 Azure Storage에서 로드됩니다. 클래스 변수(예를 들어, 공격이 루트킷 또는 버퍼풀인 경우 설명)는 범주 열로 변환된 다음 여러 지표 값으로 확장됩니다.

기술 정보

이 섹션에는 구현 세부 정보, 팁, 자주 묻는 질문에 대한 답변이 포함되어 있습니다.

사용 팁

  • 범주로 표시된 열만 표시기 열로 변환할 수 있습니다. 이 오류가 표시되면 선택한 열 중 하나가 범주가 아닐 수 있습니다.

    오류 0056: 이름이 <열 이름>인 열이 허용되는 범주에 없습니다.

    기본적으로 대부분의 문자열 열은 문자열 기능으로 처리되므로 메타데이터 편집을 사용하여 명시적으로 범주로 표시해야 합니다.

  • 범주 열을 하나 이상 선택하지 않으면 오류가 표시됩니다.

  • 표시기 열로 변환할 수 있는 열 수에는 제한이 없습니다. 그러나 값의 각 열은 여러 표시기 열을 생성할 수 있으므로 한 번에 몇 개의 열만 변환하고 검토할 수 있습니다.

  • 열에 누락 값이 포함된 경우 누락된 범주에 대한 별도의 표시기 열이 생성되며 이름은 <원본 열> - 누락입니다.

  • 표시기 값으로 변환하는 열에 숫자가 포함된 경우 다른 기능 열처럼 범주로 표시되어야 합니다. 작업을 완료한 후에는 숫자를 불연속 값으로 처리합니다. 예를 들어 25~30 사이의 MPG 값이 있는 숫자 열이 있는 경우 각 불연속 값에 대해 새 표시기 열이 생성됩니다.

    Make 고속도로 mpg - 25 고속도로 mpg - 26 고속도로 mpg - 27 고속도로 mpg - 28 고속도로 mpg - 29 고속도로 mpg - 30
    알파 로미오 0 0 0 0 0 1

    막대한 수의 표시기 열을 가져오지 않도록 먼저 열의 값 수를 확인하고 데이터를 적절하게 bin 또는 정량화하는 것이 좋습니다.

예상 입력

Name 유형 설명
데이터 세트 데이터 테이블 범주 열이 포함된 데이터 집합입니다.

모듈 매개 변수

Name 범위 Type 기본값 설명
변환할 범주 열 모두 ColumnSelection 지표 행렬로 변환할 범주 열을 선택합니다.
범주 열 덮어쓰기 모두 부울 false True로 설정하면 선택한 범주 열을 덮어쓰고 그렇지 않으면 결과 표시기 행렬을 데이터 집합에 추가합니다.

출력

Name 유형 설명
결과 데이터 집합 데이터 테이블 표시기 행렬로 변환된 범주 열을 포함하는 데이터 집합입니다.

참고 항목

조작
데이터 변환
전체 모듈 목록