Apache Spark MLlib gebruiken in Azure Databricks
Deze pagina bevat voorbeeldnotebooks die laten zien hoe u MLlib gebruikt in Azure Databricks.
Apache Spark MLlib is de bibliotheek voor machine learning van Apache Spark die bestaat uit veelgebruikte leeralgoritmen en hulpprogramma's, zoals voor classificatie, regressie, clustering, gezamenlijke filterfuncties, dimensionaliteitsvermindering en onderliggende optimalisatieprimitieven. Voor referentie-informatie over MLlib-functies raadt Azure Databricks de volgende Apache Spark API-verwijzingen aan:
Zie de documentatie voor R voor meer informatie over het gebruik van Apache Spark MLlib van R .
Voorbeeldnotitieblok voor binaire classificatie
In dit notebook leert u hoe u een binaire classificatietoepassing bouwt met de Apache Spark MLlib Pipelines-API.
Notebook voor binaire classificatie
Voorbeeldnotitieblokken voor beslissingsstructuren
Dit voorbeeld laat verschillende toepassingen van beslissingsstructuren zien met de Apache Spark MLlib Pipelines-API.
Beslissingsstructuren
Deze notebooks laten zien hoe u classificaties kunt uitvoeren met beslissingsstructuren.
Notebook over beslissingsstructuren voor digitale herkenning
Notebook over beslissingsstructuren voor SFO-enquĂȘtes
GBT-regressie met behulp van MLlib-pijplijnen
In dit notebook leert u hoe u MLlib-pijplijnen gebruikt om een regressie uit te voeren met behulp van structuren om het aantal fietsverhuren (per uur) te voorspellen op basis van informatie zoals de dag van de week, het weer, het seizoen, enzovoorts.
Notebook over regressie van fietsverhuur
Voorbeeld van geavanceerd Apache Spark MLlib-notebook
In dit notebook leert u hoe een aangepaste transformator maakt.