Share via


AutoML이란?

Databricks AutoML을 사용하면 기계 학습을 데이터 세트에 자동으로 적용할 수 있습니다. 사용자가 데이터 세트를 제공하고 예측 대상을 식별하면 AutoML은 모델 학습을 위한 데이터 세트를 준비합니다. 그 후 AutoML은 여러 모델을 만들고, 튜닝하고, 평가하는 평가판 세트를 수행하고 기록합니다. 모델을 평가한 후 AutoML은 결과를 표시하고 각 평가판 실행에 대한 소스 코드가 포함된 Python Notebook을 제공하므로 코드를 검토, 재현 및 수정할 수 있습니다. 또한 AutoML은 데이터 세트에 대한 요약 통계를 계산하고 나중에 검토할 수 있는 이 정보를 Notebook에 저장합니다.

회귀, 분류 및 예측 문제에 Databricks AutoML을 사용할 수 있습니다. Azure Databricks AutoML의 작동 방식에 대해 자세히 알아보세요.

요구 사항

  • Databricks Runtime 9.1 ML 이상. GA(일반 공급) 버전의 경우 Databricks Runtime 10.4 LTS ML 이상입니다.
    • 시계열 예측의 경우 Databricks Runtime 10.0 ML 이상.
    • Databricks Runtime 9.1 LTS ML 이상에서 AutoML은 AutoML 외부에서 유용한 구성 요소가 포함된 databricks-automl-runtime 패키지에 의존하며 AutoML 학습으로 생성된 Notebooks를 단순화하는 데도 도움이 됩니다. databricks-automl-runtimePyPI에서 사용할 수 있습니다.
  • Machine Learning용 Databricks Runtime에 미리 설치된 라이브러리 이외의 추가 라이브러리는 클러스터에 설치하면 안 됩니다.
    • 기존 라이브러리 버전에 대한 모든 수정(제거, 업그레이드 또는 다운그레이드)은 비호환성으로 인해 실행 실패를 초래합니다.
  • AutoML은 공유 액세스 모드 클러스터호환되지 않습니다.
  • AutoML에서 Unity 카탈로그사용하려면 클러스터 액세스 모드가 단일 사용자여야 하며 클러스터의 지정된 단일 사용자여야 합니다.

다음 단계