LightGBM이란?

LightGBM 은 오픈 소스, 분산된 고성능 그라데이션 부스팅(GBDT, GBRT, GBM 또는 MART) 프레임워크입니다. 이 프레임워크는 순위, 분류 및 기타 많은 기계 학습 작업을 위한 고품질 및 GPU 지원 의사 결정 트리 알고리즘을 만드는 것을 전문으로 합니다. LightGBM은 Microsoft의 DMTK 프로젝트의 일부입니다.

LightGBM의 장점

  • 구성성: LightGBM 모델을 기존 SparkML 파이프라인에 통합하고 일괄 처리, 스트리밍 및 서비스 워크로드에 사용할 수 있습니다.
  • 성능: Spark의 LightGBM은 Higgs 데이터 세트의 SparkML보다 10-30% 빠르며 AUC가 15% 증가합니다. 병렬 실험은 LightGBM이 특정 설정에서 학습을 위해 여러 컴퓨터를 사용하여 선형 속도 향상을 달성할 수 있음을 확인했습니다.
  • 기능: LightGBM은 의사 결정 트리 시스템을 사용자 지정하는 데 사용할 수 있는 다양한 튜닝 가능한 매개 변수를 제공합니다. Spark의 LightGBM은 분위수 회귀와 같은 새로운 유형의 문제도 지원합니다.
  • 플랫폼 간: Spark의 LightGBM은 Spark, PySpark 및 SparklyR에서 사용할 수 있습니다.

LightGBM 사용량

  • LightGBMClassifier: 분류 모델을 빌드하는 데 사용됩니다. 예를 들어 회사가 파산했는지 여부를 예측하기 위해 .를 사용하여 이진 분류 모델을 LightGBMClassifier빌드할 수 있습니다.
  • LightGBMRegressor: 회귀 모델을 빌드하는 데 사용됩니다. 예를 들어 주택 가격을 예측하기 위해 .를 사용하여 회귀 모델을 LightGBMRegressor빌드할 수 있습니다.
  • LightGBMRanker: 순위 모델을 빌드하는 데 사용됩니다. 예를 들어 웹 사이트 검색 결과의 관련성을 예측하기 위해 .를 사용하여 순위 모델을 LightGBMRanker빌드할 수 있습니다.