Azure Databricks에서 Apache Spark MLlib 사용
이 페이지에서는 Azure Databricks에서 MLlib를 사용하는 방법을 보여주는 예제 notebook을 제공합니다.
Apache Spark MLlib는 분류, 회귀, 클러스터링, 공동 작업 필터링, 차원 감소, 기본 최적화 기본 요소 등 일반적인 학습 알고리즘 및 유틸리티로 구성된 Apache Spark 기계 학습 라이브러리입니다. MLlib 기능에 대한 참조 정보에 대해 Azure Databricks는 다음 Apache Spark API 참조를 권장합니다.
R에서 Apache Spark MLlib를 사용하는 방법에 대한 자세한 내용은 R 기계 학습 설명서를 참조하세요.
이 Notebook에서는 Apache Spark MLlib 파이프라인 API를 사용해 이진 분류 애플리케이션을 빌드하는 방법을 설명합니다.
이 예제에서는 Apache Spark MLlib Pipelines API를 사용하여 의사 결정 트리의 다양한 애플리케이션을 보여줍니다.
이 Notebook은 의사 결정 트리로 분류를 수행하는 방법을 보여줍니다.
이 notebook에서는 MLlib 파이프라인을 사용하여 요일, 날씨, 계절 등의 정보로부터 자전거 대여 횟수(시간당)를 예측하기 위해 경사 부스팅 트리를 사용하여 회귀를 수행하는 방법을 보여드립니다.
이 Notebook에서는 사용자 정의 transformer를 만드는 방법에 대해 설명합니다.