SynapseML 中的 LightGBM 概觀
LightGBM 是開放原始碼、分散式、高效能漸層提升 (GBDT、GBRT、GBM 或 MART) 架構。 此架構專門建立高品質且已啟用 GPU 的判定樹演算法,以進行排名、分類,以及許多其他機器學習工作。 LightGBM 是Microsoft DMTK 專案的一部分。
LightGBM 的優點
- 可組合性:LightGBM 模型可以併入現有的SparkML管線,並用於批次、串流和提供工作負載。
- 效能:Spark 上的 LightGBM 比 Higgs 數據集上的 SparkML 快 10-30%,且 AUC 增加 15%。 平行實驗 已確認 LightGBM 可以使用多部機器在特定設定中定型,來達到線性加速。
- 功能:LightGBM 提供各種不同的 無法調整參數,可用來自定義其判定樹系統。 Spark 上的 LightGBM 也支援新類型的問題,例如分位數回歸。
- 跨平臺:Spark、PySpark 和 SparklyR 提供 Spark 上的 LightGBM。
LightGBM 使用方式
- LightGBMClassifier:用於建置分類模型。 例如,若要預測公司是否破產,我們可以使用
LightGBMClassifier
建置二元分類模型。 - LightGBMRegressor:用於建置回歸模型。 例如,若要預測房價,我們可以使用
LightGBMRegressor
建置回歸模型。 - LightGBMRanker:用於建置排名模型。 例如,若要預測網站搜尋結果的相關性,我們可以使用
LightGBMRanker
建置排名模型。
相關內容
意見反應
https://aka.ms/ContentUserFeedback。
即將登場:在 2024 年,我們將逐步淘汰 GitHub 問題作為內容的意見反應機制,並將它取代為新的意見反應系統。 如需詳細資訊,請參閱:提交並檢視相關的意見反應