SynapseML の LightGBM の概要
LightGBM は、オープンソースの分散型の高性能勾配ブースティング (GBDT、GBRT、GBM、または MART) フレームワークです。 このフレームワークは、ランク付け、分類、およびその他の多くの機械学習タスク用の、高品質で GPU 対応のデシジョン ツリー アルゴリズムの作成に特化しています。 LightGBM は、Microsoft の DMTK プロジェクトの一部です。
LightGBM の利点
- 構成可能性: LightGBM モデルを既存の SparkML パイプラインに組み込み、バッチ、ストリーミング、ワークロードの処理に使用できます。
- パフォーマンス: Spark の LightGBM は、Higgs データセットで SparkML よりも 10 から 30% 高速であり、AUC の 15% の増加を達成します。 並列実験では、特定の設定でトレーニングに複数のマシンを使用することで、LightGBM が直線的な高速化を実現できることが確認されています。
- 機能: LightGBM は、デシジョン ツリー システムをカスタマイズするために使用できる、幅広い調整可能なパラメーターを提供します。 Spark 上の LightGBM では、分位点回帰などの新しい種類の問題もサポートされています。
- クロス プラットフォーム: Spark 上の LightGBM は、Spark、PySpark、SparklyR で使用できます。
LightGBM の用途
- LightGBMClassifier: 分類モデルを構築するために使用されます。 たとえば、会社が倒産するかどうかを予測するために、
LightGBMClassifier
を使用して二項分類モデルを構築できます。 - LightGBMRegressor: 回帰モデルの構築に使用されます。 たとえば、住宅価格を予測するために、
LightGBMRegressor
を使用して回帰モデルを構築できます。 - LightGBMRanker: ランク付けモデルを構築するために使用されます。 たとえば、Web サイトの検索結果の関連性を予測するために、
LightGBMRanker
を使用してランク付けモデルを構築できます。