Použití knihovny Apache Spark MLlib v Azure Databricks
Tato stránka obsahuje ukázkové poznámkové bloky, které ukazují, jak používat MLlib v Azure Databricks.
Apache Spark MLlib je knihovna strojového učení Apache Sparku, která se skládá z běžných algoritmů a nástrojů strojového učení, včetně klasifikace, regrese, clusteringu, filtrování založeného na spolupráci, snížení počtu dimenzí a základních primitiv optimalizace. Referenční informace o funkcích knihovny MLlib doporučuje Azure Databricks následující odkazy na rozhraní Apache Spark API:
- Průvodce programováním pro knihovnu MLlib
- Referenční informace k rozhraní Python API
- Referenční informace k rozhraní Scala API
- Rozhraní API Javy
Informace o použití knihovny Apache Spark MLlib z jazyka R najdete v dokumentaci k strojovému učení jazyka R.
Ukázkový poznámkový blok binární klasifikace
Tento poznámkový blok ukazuje, jak sestavit aplikaci binární klasifikace s využitím rozhraní API kanálů Apache Spark MLlib.
Poznámkový blok binární klasifikace
Ukázkové poznámkové bloky rozhodovacích stromů
Tyto příklady ukazují různá využití rozhodovacích stromů s využitím rozhraní API kanálů Apache Spark MLlib.
rozhodovací stromy
Tyto poznámkové bloky ukazují postup při provádění klasifikace s využitím rozhodovacích stromů.
Poznámkový blok rozhodovacích stromů pro rozpoznávání číslic
Poznámkový blok rozhodovacích stromů pro průzkum SFO
Regrese GBT s využitím kanálů MLlib
Tento poznámkový blok ukazuje využití kanálů MLlib k provedení regrese GBT pro predikci počtu pronájmů kol (za hodinu), a to na základě informací, jako jsou den v týdnu, počasí, sezóna atd.
Poznámkový blok regrese sdílení kol
Příklad rozšířeného poznámkového bloku Apache Spark MLlib
Tento poznámkový blok ukazuje, jak vytvořit vlastní transformátor.