모델 학습
중요
Machine Learning Studio(클래식)에 대한 지원은 2024년 8월 31일에 종료됩니다. 해당 날짜까지 Azure Machine Learning으로 전환하는 것이 좋습니다.
2021년 12월 1일부터 새로운 Machine Learning Studio(클래식) 리소스를 만들 수 없습니다. 2024년 8월 31일까지는 기존 Machine Learning Studio(클래식) 리소스를 계속 사용할 수 있습니다.
- ML Studio(클래식)에서 Azure Machine Learning으로 기계 학습 프로젝트 이동에 대한 정보를 참조하세요.
- Azure Machine Learning에 대한 자세한 정보.
ML Studio(클래식) 설명서는 사용 중지되며 나중에 업데이트되지 않을 수 있습니다.
감독 방식으로 분류 또는 회귀 모델 학습
모듈 개요
이 문서에서는 Machine Learning Studio(클래식)에서 모델 학습 모듈을 사용하여 분류 또는 회귀 모델을 학습하는 방법을 설명합니다. 학습은 모델을 정의하고 해당 매개 변수를 설정한 후에 수행되며 태그가 지정된 데이터가 필요합니다. 또한 모델 학습을 사용하여 기존 모델을 새 데이터로 다시 학습할 수 있습니다.
학습 프로세스 작동 방식
Machine Learning 기계 학습 모델을 만들고 사용하는 것은 일반적으로 3단계 프로세스입니다.
특정 알고리즘 유형을 선택하고 해당 매개 변수 또는 하이퍼 매개 변수를 정의하여 모델을 구성합니다. 다음 모델 유형 중 하나를 선택합니다.
레이블이 지정되고 알고리즘과 호환되는 데이터가 있는 데이터 세트를 제공합니다. 데이터와 모델을 모두 연결하여 모델을 학습합니다.
학습에서 생성하는 것은 데이터에서 학습된 통계 패턴을 캡슐화하는 특정 이진 형식인 iLearner입니다. 이 형식은 직접 수정하거나 읽을 수 없습니다. 그러나 Studio(클래식)의 다른 모듈에서는 이 학습된 모델을 사용할 수 있습니다.
모델의 속성을 볼 수도 있습니다. 자세한 내용은 결과 섹션을 참조하세요.
학습을 완료한 후 채점 모듈 중 하나와 학습된 모델을 사용하여 새 데이터에 대한 예측을 만듭니다.
참고
다른 특수 기계 학습 작업에는 다른 학습 방법이 필요하며 Studio(클래식)는 별도의 학습 모듈을 제공합니다. 예를 들어 이미지 검색, 클러스터링 및 변칙 분리는 모두 사용자 지정 학습 방법을 사용합니다. 학습 모델은 회귀 및 분류 모델에만 사용됩니다.
감독 및 감독되지 않는 교육
감독되거나 감독되지 않은 학습이라는 용어를 들었을 수 있습니다. 학습 모델을 사용하여 분류 또는 회귀 모델을 학습하는 것은 감독되는 기계 학습의 전형적인 예입니다. 즉, 패턴을 학습할 기록 데이터가 포함된 데이터 세트를 제공해야 합니다. 데이터에는 예측하려는 결과(레이블)와 관련 요소(변수)가 모두 포함되어야 합니다. 기계 학습 모델에는 결과를 가장 잘 예측하는 기능을 결정하기 위한 결과가 필요합니다.
학습 프로세스 중에 데이터는 결과를 기준으로 정렬되고 알고리즘은 통계 패턴을 추출하여 모델을 빌드합니다.
자율 학습은 결과를 알 수 없거나 알려진 레이블을 사용하지 않도록 선택했음을 나타냅니다. 예를 들어 클러스터링 알고리즘은 일반적으로 자율 학습 방법을 사용하지만 사용 가능한 경우 레이블을 사용할 수 있습니다. 또 다른 예는 LDA를 사용한 토픽 모델링입니다. 이러한 알고리즘에서는 모델 학습 을 사용할 수 없습니다.
팁
기계 학습을 새로운 기능으로 사용하시겠습니까? 이 자습서에서는 데이터를 가져오고, 알고리즘을 구성하고, 학습한 다음, 모델을 사용하는 프로세스를 안내합니다. 첫 번째 기계 학습 실험 만들기
모델 학습을 사용하는 방법
Machine Learning Studio(클래식)에서 분류 모델 또는 회귀 모델 모델을 구성합니다.
R 모델 만들기를 사용하여 만든 사용자 지정 모델을 학습시킬 수도 있습니다.
실험에 모델 학습 모듈을 추가합니다. 이 모듈은 Machine Learning 범주에서 찾을 수 있습니다. 학습을 확장한 다음 모델 학습 모듈을 실험으로 끌어옵니다.
왼쪽 입력에서 학습되지 않은 모드를 연결합니다. 모델 학습의 오른쪽 입력에 학습 데이터 세트를 연결합니다.
학습 데이터 세트는 레이블 열을 포함해야 합니다. 레이블이 없는 행은 무시됩니다.
레이블 열의 경우 열 선택기 시작을 클릭하고 모델이 학습에 사용할 수 있는 결과를 포함하는 단일 열을 선택합니다.
분류 문제의 경우, 레이블 열에는 범주형 값 또는 이산형 값이 포함되어야 합니다. 몇 가지 예로는 예/아니요 평가, 질병 분류 코드/이름 또는 소득 그룹이 있습니다. 비범주형 열을 선택하면 학습 중에 모듈에서 오류를 반환합니다.
회귀 문제의 경우, 레이블 열에는 응답 변수를 나타내는 숫자 데이터가 포함되어야 합니다. 이상적인 숫자 데이터는 연속 크기 조정을 나타냅니다.
예를 들어 신용 위험 점수, 하드 드라이브의 예상 고장 시간 또는 지정된 요일이나 시간에 콜 센터에서 받을 예상 통화 수 등입니다. 숫자 열을 선택하지 않으면 오류가 발생할 수 있습니다.
- 사용할 레이블 열을 지정하지 않으면 Machine Learning 데이터 세트의 메타데이터를 사용하여 적절한 레이블 열이 무엇인지 유추하려고 합니다. 잘못된 열을 선택하는 경우 열 선택기를 사용하여 수정합니다.
팁
열 선택기를 사용하는 데 문제가 있는 경우 해결 팁은 데이터 세트에서 열 선택 문서를 참조하세요. 여기에는 규칙 사용 및 이름별 옵션을 사용하기 위한 몇 가지 일반적인 시나리오와 팁이 설명되어 있습니다.
실험을 실행합니다. 많은 데이터가 있는 경우 시간이 걸릴 수 있습니다.
결과
모델을 학습한 후:
모델 매개 변수 및 기능 가중치를 보려면 출력을 마우스 오른쪽 단추로 클릭하고 시각화를 선택합니다.
다른 실험에서 모델을 사용하려면 모델을 마우스 오른쪽 단추로 클릭하고 모델 저장을 선택합니다. 모델 이름을 입력합니다.
이렇게 하면 모델을 실험의 반복 실행으로 업데이트되지 않는 스냅샷으로 저장합니다.
새 값을 예측하는 데 모델을 사용하려면 모델 채점 모듈에 새 입력 데이터와 함께 모델을 연결합니다.
관련 작업
모델 학습에서 지원되지 않는 모델 유형을 학습해야 하는 경우 다음과 같은 몇 가지 옵션이 있습니다.
R 스크립트를 사용하여 사용자 지정 점수 매기기 메서드를 만들거나 사용 가능한 여러 R 채점 패키지 중 하나를 사용합니다.
고유한 Python 스크립트를 작성하여 모델을 학습 및 채점하거나 기존 Python 라이브러리를 사용합니다.
변칙 검색 모델
- 변칙 검색 모델 학습 은 Studio(클래식)에서 변칙 검색 모듈을 지원합니다.
권장 사항 모델
모델에서 Machine Learning 제공된 Matchbox 권장 사항을 사용하는 경우 매치박스 추천 학습 모듈을 사용합니다.
시장 바구니 분석 또는 권장 사항에 다른 알고리즘을 사용하는 경우 R 스크립트 또는 Python 스크립트에서 학습 방법을 사용합니다.
클러스터링 모델
포함된 K-평균 알고리즘에 대해 학습 클러스터링 모델을 사용합니다.
다른 클러스터링 모델의 경우 R 스크립트 또는 Python 스크립트 모듈을 사용하여 모델을 구성하고 학습시킵니다.
예
기계 학습 실험에서 모델 학습 모듈을 사용하는 방법에 대한 예제는 Azure AI 갤러리에서 다음 실험을 참조하세요.
예상 입력
Name | 유형 | 설명 |
---|---|---|
학습되지 않은 모델 | ILearner 인터페이스 | 학습되지 않은 학습자입니다. |
데이터 세트 | 데이터 테이블 | 학습 데이터 |
모듈 매개 변수
Name | 범위 | Type | 기본값 | 설명 |
---|---|---|---|---|
레이블 열 | any | ColumnSelection | 레이블 또는 결과 열이 포함된 열을 선택합니다. |
출력
Name | 유형 | Description |
---|---|---|
학습된 모델 | ILearner 인터페이스 | 학습된 학습자입니다. |
예외
모든 모듈 오류 목록은 모듈 오류 코드를 참조하세요.
예외 | 설명 |
---|---|
오류 0032 | 인수가 숫자가 아니면 예외가 발생합니다. |
오류 0033 | 인수가 무한 값이면 예외가 발생합니다. |
오류 0083 | 학습에 사용되는 데이터 세트를 구체적 학습자 유형에 사용할 수 없으면 예외가 발생합니다. |
오류 0035 | 지정된 사용자나 항목에 대해 기능을 제공하지 않으면 예외가 발생합니다. |
오류 0003 | 하나 이상의 입력이 null이거나 비어 있으면 예외가 발생합니다. |
오류 0020 | 모듈에 전달된 데이터 세트 중 일부의 열 수가 너무 적으면 예외가 발생합니다. |
오류 0021 | 모듈에 전달된 데이터 세트 중 일부의 행 수가 너무 적으면 예외가 발생합니다. |
오류 0013 | 모듈로 전달된 학습자의 형식이 올바르지 않으면 예외가 발생합니다. |