Sdílet prostřednictvím


Použití knihovny Apache Spark MLlib v Azure Databricks

Tato stránka obsahuje ukázkové poznámkové bloky, které ukazují, jak používat MLlib v Azure Databricks.

Apache Spark MLlib je knihovna strojového učení Apache Sparku, která se skládá z běžných algoritmů a nástrojů strojového učení, včetně klasifikace, regrese, clusteringu, filtrování založeného na spolupráci, snížení počtu dimenzí a základních primitiv optimalizace. Referenční informace o funkcích knihovny MLlib doporučuje Azure Databricks následující odkazy na rozhraní Apache Spark API:

Informace o použití knihovny Apache Spark MLlib z jazyka R najdete v dokumentaci k strojovému učení jazyka R.

Ukázkový poznámkový blok binární klasifikace

Tento poznámkový blok ukazuje, jak sestavit aplikaci binární klasifikace s využitím rozhraní API kanálů Apache Spark MLlib.

Poznámkový blok binární klasifikace

Získat poznámkový blok

Ukázkové poznámkové bloky rozhodovacích stromů

Tyto příklady ukazují různá využití rozhodovacích stromů s využitím rozhraní API kanálů Apache Spark MLlib.

rozhodovací stromy

Tyto poznámkové bloky ukazují postup při provádění klasifikace s využitím rozhodovacích stromů.

Poznámkový blok rozhodovacích stromů pro rozpoznávání číslic

Získat poznámkový blok

Poznámkový blok rozhodovacích stromů pro průzkum SFO

Získat poznámkový blok

Regrese GBT s využitím kanálů MLlib

Tento poznámkový blok ukazuje využití kanálů MLlib k provedení regrese GBT pro predikci počtu pronájmů kol (za hodinu), a to na základě informací, jako jsou den v týdnu, počasí, sezóna atd.

Poznámkový blok regrese sdílení kol

Získat poznámkový blok

Příklad rozšířeného poznámkového bloku Apache Spark MLlib

Tento poznámkový blok ukazuje, jak vytvořit vlastní transformátor.

Poznámkový blok vlastního transformátoru

Získat poznámkový blok