MLflow 실험 시작

이 Notebook 컬렉션에서는 MLflow 실험 실행을 시작하고 실행하는 방법을 보여 줍니다.

MLflow 구성 요소

MLflow는 엔드투엔드 기계 학습 수명 주기를 관리하기 위한 오픈 소스 플랫폼입니다. MLflow에는 다음과 같은 세 가지 기본 구성 요소가 있습니다.

  • 추적
  • 모델
  • 프로젝트

MLflow 추적 구성 요소를 사용하면 다음 API를 사용하여 머신 모델 학습 세션(실행)을 기록하고 쿼리할 수 있습니다.

MLflow 실행은 기계 학습 모델 학습 프로세스와 관련된 매개 변수, 메트릭, 태그 및 아티팩트의 컬렉션입니다.

MLflow의 실험이란?

실험은 MLflow의 기본 조직 단위이며 모든 MLflow 실행은 실험에 속합니다. 각 실험을 통해 실행을 시각화, 검색 및 비교할 수 있을 뿐만 아니라 실행 아티팩트나 다른 도구에서 분석하기 위한 메타데이터를 다운로드할 수 있습니다. 실험은 Azure Databricks에서 호스팅하는 MLflow 추적 서버에서 유지 관리됩니다.

실험은 작업 영역 파일 트리에 있습니다. 폴더, Notebooks 및 라이브러리와 같은 다른 작업 영역 개체를 관리하는 데 사용하는 것과 동일한 도구를 사용하여 실험을 관리합니다.

MLflow 예제 Notebook

다음 Notebook에서는 MLflow 추적 API를 사용하여 MLflow 실행을 만들고 로그하는 방법과 실험 UI를 사용하여 실행을 보는 방법을 보여 줍니다. 이 Notebooks는 Python, Scala 및 R에서 사용할 수 있습니다.

Python 및 R Notebooks는 Notebooks 실험을 사용합니다. Scala Notebook은 Shared 폴더에 실험을 만듭니다.

참고 항목

Databricks Runtime 10.4 LTS ML 이상을 사용하면 Python Notebook에 대해 Databricks 자동 로깅 이 기본적으로 사용하도록 설정됩니다.