Microsoft Fabric 기계 학습 모델

기계 학습 모델은 특정 유형의 패턴을 인식하도록 학습된 파일입니다. 데이터 집합에 대해 모델을 학습하여 해당 데이터 집합으로 추론하고 학습하는 데 사용하는 알고리즘을 제공합니다. 모델을 학습시킨 후에는 이를 사용하여 이전에 표시되지 않았던 데이터를 추론하고 해당 데이터에 대해 예측할 수 있습니다.

MLflow에서 기계 학습 모델에는 여러 모델 버전이 포함될 수 있습니다. 여기에서 각 버전은 모델 반복을 나타낼 수 있습니다. 이 문서에서는 ML 모델과 상호 작용하여 모델 반복을 추적하고 비교하는 방법을 알아봅니다.

이 문서에서는 다음 방법을 알아봅니다.

Microsoft Fabric 기계 학습 모델 만들기
모델 버전 관리 및 추적
버전 간 모델 성능 비교
채점 및 추론을 위한 모델 적용

기계 학습 모델 만들기

Fabric UI에서 또는 MLflow API를 사용하여 프로그래밍 방식으로 기계 학습 모델을 만들 수 있습니다. MLflow에서 모델은 Apache Spark에서 일괄 처리 추론을 포함하여 다양한 다운스트림 도구에서 작동하는 표준 패키징 형식을 사용합니다. 이 형식은 다양한 다운스트림 도구가 이해할 수 있는 다양한 "맛"으로 모델을 저장합니다.

UI에서 기계 학습 모델을 만들려면 다음을 수행합니다.

기존 데이터 과학 작업 영역을 선택하거나 새 작업 영역을 만듭니다.
작업 영역을 통해 또는 만들기 단추를 사용하여 새 항목을 만듭니다.
1. 작업공간
  1. 작업 영역을 선택합니다.
  2. 새 항목선택합니다.
  3. 데이터분석 및 학습 아래에서 ML 모델 선택합니다.
2. 생성 버튼
  1. 세로 메뉴에서 생성을 선택하세요. ...에서 찾을 수 있습니다.
  2. 데이터 과학에서 ML 모델을 선택합니다.
모델을 만든 후 모델 버전을 추가하여 실행 메트릭 및 매개 변수를 추적할 수 있습니다. 기존 모델에 실험 실행을 등록하거나 저장합니다.

mlflow.register_model() API를 사용하여 제작 환경에서 직접 기계 학습 모델을 만들 수도 있습니다. 지정된 이름의 등록된 기계 학습 모델이 없는 경우 API는 자동으로 만듭니다.

import mlflow

model_uri = "runs:/{}/model-uri-name".format(run.info.run_id)
mv = mlflow.register_model(model_uri, "model-name")

print("Name: {}".format(mv.name))
print("Version: {}".format(mv.version))

기계 학습 모델 내 버전 관리

기계 학습 모델에는 간소화된 추적 및 비교를 위한 모델 버전 컬렉션이 포함되어 있습니다. 모델 내에서 데이터 과학자는 다양한 모델 버전을 탐색하여 기본 매개 변수 및 메트릭을 탐색할 수 있습니다. 또한 데이터 과학자는 모델 버전 간에 비교를 수행하여 최신 모델이 더 나은 결과를 얻을 수 있는지 여부를 식별할 수 있습니다.

메모

Fabric MLflow 3을 지원하면 mlflow.<flavor>.log_model(model, name="...") 사용하여 기록하는 모든 모델은 원본 실행, 매개 변수, 메트릭, 데이터 세트 및 환경에 연결된 LoggedModel 엔터티를 만듭니다. 실험 페이지에서 LoggedModel을 열고 새 ML 모델 또는 기존 모델의 새 버전으로 등록할 수 있습니다. 자세한 내용은 Fabric 데이터 과학의 MLflow 3 참조하세요.

기계 학습 모델 추적

기계 학습 모델 버전은 추적을 위해 등록된 개별 모델을 나타냅니다.

각 모델 버전에는 다음 정보가 포함됩니다.

재산	Description
생성 시간	모델 생성 날짜 및 시간입니다.
실행 이름	이 특정 모델 버전을 만드는 데 사용되는 실험 실행의 식별자입니다.
하이퍼 매개 변수	키-값 쌍으로 저장됩니다. 키와 값은 모두 문자열입니다.
Metrics	키-값 쌍으로 저장된 메트릭을 실행합니다. 값은 숫자입니다.
모델 스키마/서명	모델 입력 및 출력에 대한 설명입니다.
기록된 파일	모든 형식으로 기록된 파일입니다. 예를 들어 이미지, 환경, 모델 및 데이터 파일을 기록할 수 있습니다.
태그	실행에 연결된 키-값 쌍으로 표현된 사용자 지정 메타데이터입니다. 태그를 적용하는 방법을 알아봅니다.

기계 학습 모델에 태그 적용

모델 버전에 대한 MLflow 태그 지정을 사용하면 사용자가 MLflow 모델 레지스트리에 등록된 모델의 특정 버전에 사용자 지정 메타데이터를 연결할 수 있습니다. 키-값 쌍으로 저장된 이러한 태그는 모델 버전을 구성, 추적 및 구분하여 모델 수명 주기를 보다 쉽게 관리할 수 있도록 합니다. 태그를 사용하여 모델의 목적, 배포 환경 또는 기타 관련 정보를 표시하여 팀 내에서 보다 효율적인 모델 관리 및 의사 결정을 용이하게 할 수 있습니다.

이 코드는 Scikit-learn을 사용하여 RandomForestRegressor 모델을 학습시키고, MLflow를 사용하여 모델 및 매개 변수를 기록한 다음, 사용자 지정 태그를 사용하여 MLflow 모델 레지스트리에 모델을 등록하는 방법을 보여 줍니다. 이러한 태그는 프로젝트 이름, 부서, 팀 및 프로젝트 분기와 같은 유용한 메타데이터를 제공하므로 모델 버전을 보다 쉽게 관리하고 추적할 수 있습니다.

import mlflow.sklearn
from mlflow.models import infer_signature
from sklearn.datasets import make_regression
from sklearn.ensemble import RandomForestRegressor

# Generate synthetic regression data
X, y = make_regression(n_features=4, n_informative=2, random_state=0, shuffle=False)

# Model parameters
params = {"n_estimators": 3, "random_state": 42}

# Model tags for MLflow
model_tags = {
    "project_name": "grocery-forecasting",
    "store_dept": "produce",
    "team": "stores-ml",
    "project_quarter": "Q3-2023"
}

# Log MLflow entities
with mlflow.start_run() as run:
    # Train the model
    model = RandomForestRegressor(**params).fit(X, y)
    
    # Infer the model signature
    signature = infer_signature(X, model.predict(X))
    
    # Log parameters and the model
    mlflow.log_params(params)
    mlflow.sklearn.log_model(model, artifact_path="sklearn-model", signature=signature)

# Register the model with tags
model_uri = f"runs:/{run.info.run_id}/sklearn-model"
model_version = mlflow.register_model(model_uri, "RandomForestRegressionModel", tags=model_tags)

# Output model registration details
print(f"Model Name: {model_version.name}")
print(f"Model Version: {model_version.version}")

태그를 적용한 후 모델 버전 세부 정보 페이지에서 직접 볼 수 있습니다. 또한 언제든지 이 페이지에서 태그를 추가, 업데이트 또는 제거할 수 있습니다.

기계 학습 모델 비교 및 필터링

기계 학습 모델 버전의 품질을 비교하고 평가하려면 선택한 버전 간에 매개 변수, 메트릭 및 메타데이터를 비교할 수 있습니다.

기계 학습 모델을 시각적으로 비교

기존 모델 내에서 실행을 시각적으로 비교할 수 있습니다. 시각적 비교를 사용하면 여러 버전 간에 쉽게 탐색하고 정렬할 수 있습니다.

실행을 비교하려면 다음을 수행할 수 있습니다.

여러 버전이 포함된 기존 기계 학습 모델을 선택합니다.
보기 탭을 선택한 다음 모델 목록 보기로 이동합니다. 세부 정보 보기에서 직접 모델 목록을 보는 옵션을 선택할 수도 있습니다.
테이블 내의 열을 사용자 지정할 수 있습니다. 열 사용자 지정 창을 확장합니다. 여기에서 보려는 속성, 메트릭, 태그 및 하이퍼 매개 변수를 선택할 수 있습니다.
마지막으로 메트릭 비교 창에서 여러 버전을 선택하여 결과를 비교할 수 있습니다. 이 창에서 차트 제목, 시각화 유형, X축, Y축 등을 변경하여 차트를 사용자 지정할 수 있습니다.

MLflow API를 사용하여 기계 학습 모델 비교

데이터 과학자는 MLflow를 사용하여 작업 영역 내에 저장된 여러 모델 중에서 검색할 수도 있습니다. MLflow 설명서를 확인하여 모델 상호 작용을 위한 다른 MLflow API를 살펴보세요.

from pprint import pprint
from mlflow import MlflowClient

client = MlflowClient()
for rm in client.search_registered_models():
    pprint(dict(rm), indent=4)

기계 학습 모델 적용

데이터 집합에서 모델을 학습시킨 후에는 해당 모델을 생성해본 적이 없는 데이터에 적용하여 예측을 생성할 수 있습니다. 이 모델 사용 기술을 채점 또는 추론이라고 부릅니다.

Fabric 학습된 모델을 적용하기 위한 여러 가지 방법을 지원합니다.

일괄 처리 점수 매기기 Apache Spark를 사용하여 대규모 데이터 세트에 대규모로 모델을 적용합니다. 이는 기록 또는 예약된 데이터에 대한 예측을 생성하는 데 적합합니다.
실시간 점수 매기기 주문형 예측을 위해 엔드포인트에 모델을 배포합니다. 즉각적인 결과가 필요한 애플리케이션에 유용합니다.

모델 적용을 시작하려면 시나리오에 맞는 방법을 선택합니다.

배치 스코어링 시작

실시간 채점을 위한 모델 배포

피드백

이 페이지가 도움이 되었나요?

Last updated on 2026-05-15