Apache Spark MLlib gebruiken in Azure Databricks
Deze pagina bevat voorbeeldnotebooks die laten zien hoe u MLlib gebruikt in Azure Databricks.
Apache Spark MLlib is de bibliotheek voor machine learning van Apache Spark die bestaat uit veelgebruikte leeralgoritmen en hulpprogramma's, zoals voor classificatie, regressie, clustering, gezamenlijke filterfuncties, dimensionaliteitsvermindering en onderliggende optimalisatieprimitieven. Voor referentie-informatie over MLlib-functies raadt Azure Databricks de volgende Apache Spark API-verwijzingen aan:
Zie de documentatie voor R voor meer informatie over het gebruik van Apache Spark MLlib van R .
In dit notebook leert u hoe u een binaire classificatietoepassing bouwt met de Apache Spark MLlib Pipelines-API.
Dit voorbeeld laat verschillende toepassingen van beslissingsstructuren zien met de Apache Spark MLlib Pipelines-API.
Deze notebooks laten zien hoe u classificaties kunt uitvoeren met beslissingsstructuren.
In dit notebook leert u hoe u MLlib-pijplijnen gebruikt om een regressie uit te voeren met behulp van structuren om het aantal fietsverhuren (per uur) te voorspellen op basis van informatie zoals de dag van de week, het weer, het seizoen, enzovoorts.
In dit notebook leert u hoe een aangepaste transformator maakt.