Was ist LightGBM?

LightGBM ist ein verteiltes Open-Source-Framework mit hochleistungsfähigem Gradient Boosting (GBDT, GBRT, GBM oder MART). Dieses Framework ist auf das Erstellen qualitativ hochwertiger und GPU-fähiger Entscheidungsstrukturalgorithmen zum Bewerten und Klassifizieren sowie für viele weitere Aufgaben in Bezug auf maschinelles Lernen spezialisiert. LightGBM ist Teil des DMTK-Projekts von Microsoft.

Vorteile von LightGBM

  • Kombinierbarkeit: LightGBM-Modelle können mit vorhandenen SparkML-Pipelines integriert und für Batch-, Streaming- und Bereitstellungsworkloads verwendet werden.
  • Leistung: LightGBM in Spark ist 10 bis 30 % schneller als SparkML im Higgs-Dataset und erreicht eine Erhöhung der AUC um 15 %. Parallele Experimente haben bestätigt, dass LightGBM eine lineare Beschleunigung erreichen kann, indem mehrere Computer für das Training in bestimmten Umgebungen verwendet werden.
  • Funktionalität: LightGBM bietet eine breite Palette von anpassbaren Parametern, die zum Einstellen des Entscheidungsstruktursystems verwendet werden können. LightGBM in Spark hilft auch bei neuen Arten von Problemen wie der Quantilregression.
  • Plattformübergreifend: LightGBM in Spark ist für Spark, PySpark und SparklyR verfügbar.

Verwenden von LightGBM

  • LightGBMClassifier: Wird zum Erstellen von Klassifizierungsmodellen verwendet. Um beispielsweise vorherzusagen, ob ein Unternehmen bankrott geht oder nicht, könnten Sie mit LightGBMClassifier ein binäres Klassifizierungsmodell erstellen.
  • LightGBMRegressor: Wird zum Erstellen von Regressionsmodellen verwendet. Um beispielsweise den Immobilienpreis vorherzusagen, könnten Sie mit LightGBMRegressor ein Regressionsmodell erstellen.
  • LightGBMRanker: Wird zum Erstellen von Bewertungsmodellen verwendet. Um beispielsweise die Relevanz von Websitesuchergebnissen vorherzusagen, könnten Sie mit LightGBMRanker ein Bewertungsmodell erstellen.