Delen via


Apache Spark MLlib gebruiken in Azure Databricks

Deze pagina bevat voorbeeldnotebooks die laten zien hoe u MLlib gebruikt in Azure Databricks.

Apache Spark MLlib is de bibliotheek voor machine learning van Apache Spark die bestaat uit veelgebruikte leeralgoritmen en hulpprogramma's, zoals voor classificatie, regressie, clustering, gezamenlijke filterfuncties, dimensionaliteitsvermindering en onderliggende optimalisatieprimitieven. Voor referentie-informatie over MLlib-functies raadt Azure Databricks de volgende Apache Spark API-verwijzingen aan:

Zie de documentatie voor R voor meer informatie over het gebruik van Apache Spark MLlib van R .

Voorbeeldnotitieblok voor binaire classificatie

In dit notebook leert u hoe u een binaire classificatietoepassing bouwt met de Apache Spark MLlib Pipelines-API.

Notebook voor binaire classificatie

Notebook downloaden

Voorbeeldnotitieblokken voor beslissingsstructuren

Dit voorbeeld laat verschillende toepassingen van beslissingsstructuren zien met de Apache Spark MLlib Pipelines-API.

Beslissingsstructuren

Deze notebooks laten zien hoe u classificaties kunt uitvoeren met beslissingsstructuren.

Notebook over beslissingsstructuren voor digitale herkenning

Notebook downloaden

Notebook over beslissingsstructuren voor SFO-enquĂȘtes

Notebook downloaden

GBT-regressie met behulp van MLlib-pijplijnen

In dit notebook leert u hoe u MLlib-pijplijnen gebruikt om een regressie uit te voeren met behulp van structuren om het aantal fietsverhuren (per uur) te voorspellen op basis van informatie zoals de dag van de week, het weer, het seizoen, enzovoorts.

Notebook over regressie van fietsverhuur

Notebook downloaden

Voorbeeld van geavanceerd Apache Spark MLlib-notebook

In dit notebook leert u hoe een aangepaste transformator maakt.

Notebook voor aangepaste transformator

Notebook downloaden