Azure Databricks를 사용하여 기계 학습 솔루션 구현

중급
데이터 과학자
Azure Databricks

Azure Databricks는 데이터 분석 및 기계 학습을 위한 클라우드 규모의 플랫폼입니다. 데이터 과학자와 기계 학습 엔지니어는 Azure Databricks를 사용하여 대규모 기계 학습 솔루션을 구현할 수 있습니다.

사전 요구 사항

이 학습 경로에서는 여러분이 Python을 이용해 데이터를 탐색하고 Scikit-Learn, PyTorch, TensorFlow 같은 일반 오픈 소스 프레임워크로 기계 학습 모델을 훈련한 경험이 있다고 가정합니다. 이 학습 경로를 시작하기 전에 기계 학습 모델 만들기 학습 경로를 먼저 완료하는 것이 좋습니다.

이 학습 경로의 모듈

Azure Databricks는 Apache Spark를 사용하여 데이터 분석을 위한 스케일링 가능한 플랫폼을 제공하는 클라우드 서비스입니다.

Azure Databricks는 Apache Spark를 기반으로 하며 데이터 엔지니어와 분석가가 Spark 작업을 실행하여 대규모로 데이터를 변환, 분석 및 시각화할 수 있도록 지원합니다.

기계 학습에는 데이터를 사용하여 예측 모델을 학습시키는 과정이 포함됩니다. Azure Databricks는 모델을 학습시키는 데 사용할 수 있는 널리 사용되는 여러 기계 학습 프레임워크를 지원합니다.

MLflow는 Azure Databricks에서 기본적으로 지원되는 기계 학습 수명 주기를 관리하기 위한 오픈 소스 플랫폼입니다.

하이퍼 매개 변수 튜닝은 기계 학습의 필수적인 부분입니다. Azure Databricks에서 Hyperopt 라이브러리를 사용하여 하이퍼 매개 변수를 자동으로 최적화할 수 있습니다.

Azure Databricks에서 AutoML을 사용하면 데이터에 대해 효과적인 기계 학습 모델을 구축하는 과정을 간소화할 수 있습니다.

딥 러닝은 신경망을 사용하여 복잡한 예측, 컴퓨터 비전, 자연어 처리, 기타 AI 워크로드에 사용하기 위한 매우 효과적인 기계 학습 모델을 학습시킵니다.

기계 학습은 데이터 기반의 의사 결정과 자동화를 가능하게 하지만, 실시간 인사이트를 얻기 위해 모델을 프로덕션에 배포하는 것은 어렵습니다. Azure Databricks는 대규모로 기계 학습 모델을 빌드, 학습, 배포하기 위한 통합 플랫폼을 제공함으로써 이러한 프로세스를 간소화하고 데이터 과학자와 엔지니어 간의 협업을 촉진합니다.