Hva er LightGBM?

LightGBM er et rammeverk med åpen kildekode, distribuert gradering med høy ytelse (GBDT, GBRT, GBM eller MART). Dette rammeverket spesialiserer seg på å opprette algoritmer av høy kvalitet og GPU-aktiverte beslutningstre for rangering, klassifisering og mange andre maskinlæringsoppgaver. LightGBM er en del av Microsofts DMTK-prosjekt .

Fordeler med LightGBM

  • Komponerbarhet: LightGBM-modeller kan innlemmes i eksisterende SparkML-datasamlebånd og brukes til batch, strømming og servering av arbeidsbelastninger.
  • Ytelse: LightGBM på Spark er 10–30 % raskere enn SparkML på Higgs-datasettet og oppnår en økning på 15 % i AUC. Parallelle eksperimenter har bekreftet at LightGBM kan oppnå en lineær hastighet ved hjelp av flere maskiner for opplæring i bestemte innstillinger.
  • Funksjonalitet: LightGBM tilbyr et bredt utvalg av tunable parametere, som man kan bruke til å tilpasse beslutningstresystemet. LightGBM på Spark støtter også nye typer problemer, for eksempel quantile regresjon.
  • Kryssplattform: LightGBM på Spark er tilgjengelig på Spark, PySpark og SparklyR.

LightGBM-bruk

  • LightGBMClassifier: brukes til å bygge klassifiseringsmodeller. Hvis du for eksempel vil forutsi om et firma går konkurs eller ikke, kan vi bygge en binær klassifiseringsmodell med LightGBMClassifier.
  • LightGBMRegressor: brukes til å bygge regresjonsmodeller. Hvis du for eksempel vil forutsi boligpris, kan vi bygge en regresjonsmodell med LightGBMRegressor.
  • LightGBMRanker: brukes til å bygge rangeringsmodeller. Hvis du for eksempel vil forutsi relevansen av søkeresultatene for nettstedet, kan vi bygge en rangeringsmodell med LightGBMRanker.