다음을 통해 공유


데이터 변환 - 크기 조정 및 축소

중요

Machine Learning Studio(클래식)에 대한 지원은 2024년 8월 31일에 종료됩니다. 해당 날짜까지 Azure Machine Learning으로 전환하는 것이 좋습니다.

2021년 12월 1일부터 새로운 Machine Learning Studio(클래식) 리소스를 만들 수 없습니다. 2024년 8월 31일까지는 기존 Machine Learning Studio(클래식) 리소스를 계속 사용할 수 있습니다.

ML Studio(클래식) 설명서는 사용 중지되며 나중에 업데이트되지 않을 수 있습니다.

이 문서에서는 숫자 데이터를 사용하는 데 도움이 되는 Machine Learning Studio(클래식)의 모듈에 대해 설명합니다. 기계 학습의 경우 일반적인 데이터 작업에는 숫자 값 클리핑, 범주화 및 정규화가 포함됩니다. 다른 모듈은 차원 감소를 지원합니다.

참고

적용 대상: Machine Learning Studio(클래식) 전용

유사한 끌어서 놓기 모듈은 Azure Machine Learning 디자이너에서 사용할 수 있습니다.

숫자 데이터 모델링

숫자 변수 정규화, 범주화 또는 재배포와 같은 작업은 기계 학습을 위한 데이터 준비의 중요한 부분입니다. 이 그룹의 모듈은 다음 데이터 준비 작업을 지원합니다.

  • 데이터를 다양한 크기 또는 배포의 bin으로 그룹화합니다.
  • 이상값을 제거하거나 값을 변경합니다.
  • 숫자 값 집합을 특정 범위로 정규화합니다.
  • 고차원 데이터 세트에서 기능 열의 압축 집합을 만듭니다.

모듈 목록

데이터 변환 - 크기 조정 및 축소 범주에는 다음 모듈이 포함됩니다.

  • 클립 값: 이상값을 검색한 다음 해당 값을 클리핑하거나 대체합니다.
  • Bin으로 데이터 그룹화: 숫자 데이터를 bin에 넣습니다.
  • 데이터 정규화: 데이터 세트 값을 표준 범위로 제한하도록 숫자 데이터의 크기를 조정합니다.
  • 주요 구성 요소 분석: 보다 효율적인 학습을 위해 차원성을 줄인 기능 집합을 계산합니다.

참고 항목