Usare Apache Spark MLlib in Azure Databricks
Questa pagina fornisce notebook di esempio che illustrano come usare MLlib in Azure Databricks.
Apache Spark MLlib è la libreria di Machine Learning di Apache Spark costituita da utilità e algoritmi di apprendimento comuni, tra cui classificazione, regressione, clustering, filtro collaborativo, riduzione della dimensionalità e primitive di ottimizzazione sottostanti. Per informazioni di riferimento sulle funzionalità di MLlib, Azure Databricks consiglia i riferimenti seguenti all'API Apache Spark:
- Guida alla programmazione di MLlib
- Informazioni di riferimento per l'API Python
- Informazioni di riferimento per l'API Scala
- API Java
Per informazioni sull'uso di Apache Spark MLlib da R, vedere la documentazione di R Machine Learning .
Notebook di esempio di classificazione binaria
Questo notebook illustra come creare un'applicazione di classificazione binaria usando l'API Pipelines di Apache Spark MLlib.
Notebook di classificazione binaria
Notebook di esempio di alberi delle decisioni
Questi esempi illustrano varie applicazioni degli alberi delle decisioni usando l'API Pipelines di Apache Spark MLlib.
Alberi delle decisioni
Questi notebook illustrano come eseguire le classificazioni con gli alberi delle decisioni.
Alberi delle decisioni per il notebook di riconoscimento delle cifre
Alberi delle decisioni per il notebook del sondaggio OFS
Regressione GBT con pipeline MLlib
Questo notebook illustra come usare le pipeline MLlib per eseguire una regressione usando alberi con boosting a gradienti per prevedere il numero di noleggi di biciclette (all'ora) da informazioni quali il giorno della settimana, il meteo, la stagione e così via.
Notebook di regressione per il bike sharing
Esempio avanzato di notebook MLlib di Apache Spark
Questo notebook illustra come creare un trasformatore personalizzato.
Notebook del trasformatore personalizzato
Commenti e suggerimenti
https://aka.ms/ContentUserFeedback.
Presto disponibile: Nel corso del 2024 verranno gradualmente disattivati i problemi di GitHub come meccanismo di feedback per il contenuto e ciò verrà sostituito con un nuovo sistema di feedback. Per altre informazioni, vedereInvia e visualizza il feedback per