Azure Databricks에서 Apache Spark MLlib 사용

이 페이지에서는 Azure Databricks에서 MLlib를 사용하는 방법을 보여 주는 예제 Notebook을 제공합니다.

Apache Spark MLlib는 분류, 회귀, 클러스터링, 공동 작업 필터링, 차원 감소, 기본 최적화 기본 요소 등 일반적인 학습 알고리즘 및 유틸리티로 구성된 Apache Spark 기계 학습 라이브러리입니다. MLlib 기능에 대한 참조 정보를 위해 Azure Databricks는 다음 Apache Spark API 참조를 권장합니다.

R에서 Apache Spark MLlib를 사용하는 방법에 대한 자세한 내용은 R 기계 학습 설명서를 참조하세요.

이진 분류 예제 Notebook

이 Notebook에서는 Apache Spark MLlib Pipelines API를 사용하여 이진 분류 애플리케이션을 빌드하는 방법을 보여 줍니다.

이진 분류 Notebook

전자 필기장 가져오기

의사 결정 트리 예제 Notebook

다음 예제에서는 Apache Spark MLlib Pipelines API를 사용하는 의사 결정 트리의 다양한 애플리케이션을 보여 줍니다.

의사 결정 트리

이러한 Notebook은 의사 결정 트리를 사용하여 분류를 수행하는 방법을 보여 줍니다.

숫자 인식을 위한 의사 결정 트리 Notebook

전자 필기장 가져오기

SFO 설문 조사를 위한 의사 결정 트리 Notebook

전자 필기장 가져오기

MLlib 파이프라인을 사용한 GBT 회귀

이 Notebook에서는 MLlib 파이프라인을 사용하여 그라데이션 강화 트리를 사용하여 회귀를 수행하여 요일, 날씨, 계절 등의 정보에서 자전거 대여 횟수(시간당)를 예측하는 방법을 보여 줍니다.

자전거 공유 회귀 Notebook

전자 필기장 가져오기

Apache Spark MLlib 파이프라인 및 구조적 스트리밍 예제

이 Notebook은 기록 데이터에 대해 Apache Spark MLlib 파이프라인을 학습시켜서 스트리밍 데이터에 적용하는 방법을 보여줍니다.

MLlib 파이프라인 구조적 스트리밍 Notebook

전자 필기장 가져오기

고급 Apache Spark MLlib Notebook 예제

이 Notebook에서는 사용자 지정 변환기를 만드는 방법을 보여 줍니다.

사용자 지정 변환기 Notebook

전자 필기장 가져오기