Použití knihovny Apache Spark MLlib v Azure Databricks

Tato stránka obsahuje ukázkové poznámkové bloky, které ukazují, jak používat MLlib v Azure Databricks.

Apache Spark MLlib je knihovna strojového učení Apache Sparku, která se skládá z běžných algoritmů a nástrojů strojového učení, včetně klasifikace, regrese, clusteringu, filtrování založeného na spolupráci, snížení počtu dimenzí a základních primitiv optimalizace. Azure Databricks doporučuje pro referenční informace o funkcích knihovny MLlib následující odkazy na API Apache Spark:

Balíček pyspark.ml z knihovny Apache Spark MLlib se podporuje na bezserverových, standardních a vyhrazených výpočetních prostředcích.

Informace o použití knihovny Apache Spark MLlib z jazyka R najdete v dokumentaci k strojovému učení jazyka R.

Ukázkový poznámkový blok binární klasifikace

Tento poznámkový blok ukazuje, jak sestavit aplikaci binární klasifikace s využitím rozhraní API kanálů Apache Spark MLlib.

Poznámkový blok binární klasifikace

Pořiď si poznámkový blok

Ukázkové sešity pro rozhodovací stromy

Tyto příklady ukazují různá využití rozhodovacích stromů s využitím rozhraní API kanálů Apache Spark MLlib.

rozhodovací stromy

Tyto poznámkové bloky ukazují postup při provádění klasifikace s využitím rozhodovacích stromů.

Notebook rozhodovacích stromů pro rozpoznávání číslic

Pořiď si poznámkový blok

Poznámkový blok rozhodovacích stromů pro průzkum SFO

Pořiď si poznámkový blok

Regrese GBT s využitím kanálů MLlib

Tento poznámkový blok ukazuje využití kanálů MLlib k provedení regrese GBT pro predikci počtu pronájmů kol (za hodinu), a to na základě informací, jako jsou den v týdnu, počasí, sezóna atd.

Sešit regresní analýzy sdílení kol

Pořiď si poznámkový blok

Příklad rozšířeného poznámkového bloku Apache Spark MLlib

Tento poznámkový blok ukazuje, jak vytvořit vlastní transformátor.

Poznámkový blok vlastního transformátoru

Pořiď si poznámkový blok