기계 학습 모델
비고
자세한 내용은 텍스트 및 이미지 탭을 참조하세요.
기계 학습은 수학 및 통계를 기반으로 하기 때문에 기계 학습 모델에 대해 수학 측면에서 생각하는 것이 일반적입니다. 기본적으로 기계 학습 모델은 하나 이상의 입력 값을 기반으로 출력 값을 계산하는 함수 를 캡슐화하는 소프트웨어 애플리케이션입니다. 해당 함수를 정의하는 프로세스를 학습이라고 합니다. 함수가 정의되면 이 함수를 사용하여 추론이라는 프로세스에서 새 값을 예측할 수 있습니다.
학습 및 추론과 관련된 단계를 살펴보겠습니다.
학습 데이터는 과거 관찰로 구성됩니다. 대부분의 경우 관찰에는 관찰되는 항목의 관찰된 특성 또는 특징 과 예측하도록 모델을 학습하려는 항목의 알려진 값( 레이블이라고 함)이 포함됩니다.
수학 용어로는 약식 변수 이름 x를 사용하여 참조되는 기능과 y라고 하는 레이블이 자주 표시됩니다. 일반적으로 관찰은 여러 기능 값으로 구성되므로 x는 실제로 [x1,x2,x3,...]와 같이 벡터(여러 값이 있는 배열)입니다.
이를 명확히 하기 위해 앞에서 설명한 예제를 살펴보겠습니다.
- 아이스크림 판매 시나리오에서 우리의 목표는 날씨에 따라 아이스크림 판매 수를 예측할 수 있는 모델을 학습시키는 것입니다. 하루의 날씨 측정(온도, 강우, 풍속 등)은 기능 (x)이고, 매일 판매되는 아이스크림의 수는 레이블 (y)입니다.
- 의료 시나리오에서 목표는 환자가 임상 측정에 따라 당뇨병의 위험에 처해 있는지 여부를 예측하는 것입니다. 환자의 측정 (체중, 혈당 수준 등)은 특징 (x)이며 당뇨병의 가능성 (예 : 위험에 대한 1 , 위험하지 않은 경우 0 )은 라벨 (y)입니다.
- 남극 연구 시나리오에서는 물리적 특성에 따라 펭귄의 종을 예측하려고 합니다. 펭귄의 주요 측정값(지느러미 길이, 부리 너비 등)은 특징 (x)이며, 종(예: 아델리는 0, 젠투는 1, 친스트랩은 2)은 레이블 (y)입니다.
알고리즘은 데이터에 적용되어 기능과 레이블 간의 관계를 확인하고, y를 계산하기 위해 x에서 수행할 수 있는 계산으로 해당 관계를 일반화합니다. 사용되는 특정 알고리즘은 해결하려는 예측 문제의 종류에 따라 달라지지만(나중에 자세히 설명) 기본 원칙은 기능 값을 사용하여 레이블을 계산할 수 있는 함수에 데이터를 맞추 는 것입니다.
알고리즘의 결과는 알고리즘에서 파생된 계산을 함수로 캡슐화하는 모델입니다. f라고 하겠습니다. 수학 표기법:
y = f(x)
이제 학습 단계가 완료되었으므로 학습된 모델을 추론에 사용할 수 있습니다. 이 모델은 기본적으로 학습 프로세스에서 생성된 함수를 캡슐화하는 소프트웨어 프로그램입니다. 기능 값 집합을 입력하고 해당 레이블의 예측을 출력으로 받을 수 있습니다. 모델의 출력은 관찰된 값이 아니라 함수에 의해 계산된 예측이므로, 함수의 출력은 ŷ로 표시되는 경우가 많습니다(이는 "y-hat"으로 다소 유쾌하게 발음됩니다).