Azure Machine Learning 디자이너에 대한 알고리즘 및 구성 요소 참조

적용 대상: Python SDK azure-ai-ml v2(현재)

참고 항목

디자이너는 두 가지 형식의 구성 요소인 클래식 미리 빌드된 구성 요소 및 사용자 지정 구성 요소를 지원합니다. 이 두 가지 형식의 구성 요소는 호환되지 않습니다.

클래식 미리 빌드된 구성 요소는 주로 데이터 처리와 회귀 및 분류와 같은 기존 기계 학습 작업을 위해 미리 빌드된 구성 요소를 제공합니다. 이 형식의 구성 요소는 계속 지원되지만 새 구성 요소가 추가되지는 않습니다.

사용자 지정 구성 요소를 사용하면 고유의 코드를 구성 요소로 제공할 수 있습니다. 작업 영역에서 공유를 지원하고 Studio, CLI 및 SDK 인터페이스에서 원활한 작성을 지원합니다.

이 문서는 미리 빌드된 클래식 구성 요소에 적용됩니다.

이 참조 콘텐츠는 Azure Machine Learning 디자이너에서 사용할 수 있는 각 클래식 사전 설정 구성 요소에 대한 기술적 배경을 제공합니다.

각 구성 요소는 필요한 입력을 고려하여 독립적으로 실행되고 기계 학습 작업을 수행할 수 있는 코드 세트를 나타냅니다. 구성 요소는 특정 알고리즘을 포함하거나 누락된 값 대체 또는 통계 분석과 같이 기계 학습에서 중요한 작업을 수행할 수 있습니다.

알고리즘 선택에 대한 도움말은 다음을 참조하세요.

디자이너의 모든 파이프라인에서 특정 구성 요소에 대한 정보를 가져올 수 있습니다. 구성 요소 목록의 구성 요소 또는 구성 요소의 오른쪽 창에 마우스를 가져가면 구성 요소 카드에서 자세히 알아보기 링크를 선택합니다.

데이터 준비 구성 요소

기능 설명 구성 요소
데이터 입력 및 출력 클라우드 원본에서 파이프라인으로 데이터를 이동합니다. 파이프라인을 실행하거나 클라우드 저장소를 사용하여 파이프라인 간에 데이터를 교환하는 동안 결과 또는 중간 데이터를 Azure Storage나 SQL 데이터베이스에 씁니다. 수동으로 데이터 입력
데이터 내보내기
데이터 가져오기
데이터 변환 데이터 정규화 또는 범주화, 차원 감소 및 다양한 파일 형식 간의 데이터 변환과 같이 기계 학습에 고유한 데이터에 대한 작업입니다. 열 추가
행 추가
수학 연산 적용
SQL 변환 적용
누락 데이터 정리
클립 값
CSV로 변환
데이터 세트로 변환
표시기 값으로 변환
메타데이터 편집
Bin으로 데이터 그룹화
데이터 조인
데이터 정규화
파티션 및 샘플
중복 행 제거
SMOTE
열 변환 선택
데이터 세트에서 열 선택
데이터 분할
기능 선택 분석 모델을 빌드하는 데 사용할 관련된 유용한 기능의 하위 집합을 선택합니다. 필터 기반 기능 선택
순열 기능 중요도
통계 함수 데이터 과학과 관련된 다양한 통계 방법을 제공합니다. 데이터 요약

기계 학습 알고리즘

기능 설명 구성 요소
회귀 값을 예측합니다. 향상된 의사 결정 트리 회귀
의사 결정 포리스트 회귀
빠른 포리스트 분위수 회귀
선형 회귀
신경망 회귀
포아송 회귀
Clustering 데이터를 그룹화합니다. K-평균 클러스터링
분류 클래스를 예측합니다. 이진(2클래스) 또는 다중 클래스 알고리즘 중에서 선택합니다. 다중 클래스 향상된 의사 결정 트리
다중 클래스 의사 결정 포리스트
다중 클래스 로지스틱 회귀
다중 클래스 신경망
1과 모든 다중 클래스
1개와 다중 클래스 1개
2클래스 평균 퍼셉트론
2클래스 향상된 의사 결정 트리
2클래스 의사 결정 포리스트
2클래스 로지스틱 회귀
2클래스 신경망
2클래스 지원 벡터 컴퓨터

모델을 빌드하고 평가하기 위한 구성 요소

기능 설명 구성 요소
모델 학습 알고리즘을 통해 데이터를 실행합니다. 클러스터링 모델 학습
모델 학습
Pytorch 모델 학습
모델 하이퍼 매개 변수 조정
모델 점수 매기기 및 평가 학습된 모델의 정확도를 측정합니다. 변환 적용
클러스터에 데이터 할당
모델 교차 유효성 검사
모델 평가
이미지 모델 점수 매기기
모델 채점
Python 언어 코드를 작성하고 이를 구성 요소에 포함하여 Python을 파이프라인과 통합합니다. Python 모델 만들기
Python 스크립트 실행
R 언어 코드를 작성하고 이를 구성 요소에 포함하여 R을 파이프라인과 통합합니다. R 스크립트 실행
텍스트 분석 구조화된 텍스트와 구조화되지 않은 텍스트를 모두 사용하기 위한 특수한 계산 도구를 제공합니다. Word를 벡터로 변환
텍스트에서 N Gram 기능 추출
기능 해시
텍스트 전처리
지연된 Dirichlet 할당
Vowpal Wabbit 모델 점수 매기기
Vowpal Wabbit 모델 학습
Computer Vision 이미지 데이터 전처리 및 이미지 인식 관련 구성 요소입니다. 이미지 변환 적용
이미지 디렉터리로 변환
Init 이미지 변환
이미지 디렉터리 분할
DenseNet
ResNet
권장 권장 사항 모델을 빌드합니다. 추천 평가
SVD 추천 점수 매기기
넓고 깊은 추천 점수 매기기
SVD 추천 학습
와이드 및 딥 추천 학습
이상 감지 변칙 검색 모델을 빌드합니다. PCA 기반 변칙 검색
변칙 검색 모델 학습

웹 서비스

Azure Machine Learning 디자이너에서 실시간 추론에 필요한 웹 서비스 구성 요소에 대해 알아봅니다.

오류 메시지

Azure Machine Learning 디자이너에서 구성 요소를 사용하여 발생할 수 있는 오류 메시지 및 예외 코드에 대해 알아봅니다.

구성 요소 환경

디자이너의 모든 기본 제공 구성 요소는 Microsoft에서 제공하는 고정 환경에서 실행됩니다.

이전에 이 환경은 Python 3.6을 기반으로 했으며 이제 Python 3.8로 업그레이드되었습니다. 이 업그레이드는 기본 제공 구성 요소에 있는 것처럼 투명하고, Python 3.8 환경에서 자동으로 실행되며, 사용자의 조치가 필요 없습니다. 환경 업데이트는 구성 요소 출력에 영향을 미치고 실시간 유추에서 실시간 엔드포인트를 배포할 수 있습니다. 자세한 내용은 다음 섹션을 참조하세요.

구성 요소 출력은 이전 결과와 다릅니다.

Python 버전이 3.6에서 3.8로 업그레이드되면 기본 제공 구성 요소의 종속성도 그에 따라 업그레이드될 수 있습니다. 따라서 일부 구성 요소 출력이 이전 결과와 다를 수 있습니다.

Python 스크립트 실행 구성 요소를 사용하고 있으며 이전에 Python 3.6에 연결된 패키지를 설치한 경우 다음과 같은 오류가 발생할 수 있습니다.

  • "요구 사항을 충족하는 버전을 찾을 수 없습니다."
  • "일치하는 배포를 찾을 수 없습니다." 그런 다음, Python 3.8에 맞게 조정된 패키지 버전을 지정하고 파이프라인을 다시 실행해야 합니다.

실시간 유추 파이프라인 문제에서 실시간 엔드포인트 배포

이전에 완료된 실시간 유추 파이프라인에서 실시간 엔드포인트를 직접 배포하는 경우 오류가 발생할 수 있습니다.

권장 사항: 유추 파이프라인을 복제하고 다시 제출한 다음, 실시간 엔드포인트에 배포합니다.

다음 단계