Usare scikit-learn in Azure Databricks

Questa pagina fornisce esempi di come usare il pacchetto per eseguire il scikit-learn training di modelli di Machine Learning in Azure Databricks. scikit-learn è una delle librerie Python più diffuse per l'apprendimento automatico a nodo singolo ed è inclusa in Databricks Runtime e Databricks Runtime ML. Vedere Note sulla versione di Databricks Runtime per informazioni sulla versione della libreria scikit-learn inclusa nel runtime del cluster.

È possibile importare questi notebook ed eseguirli nell'area di lavoro di Azure Databricks.

Per altri notebook di esempio per iniziare rapidamente in Azure Databricks, vedere Esercitazioni: Introduzione a Ml.

Esempio di base con scikit-learn

Questo notebook offre una rapida panoramica del training del modello di Machine Learning in Azure Databricks. Usa il pacchetto per eseguire il scikit-learn training di un modello di classificazione semplice. Illustra anche l'uso di MLflow per tenere traccia del processo di sviluppo del modello e Hyperopt per automatizzare l'ottimizzazione degli iperparametri.

Notebook di classificazione scikit-learn

Ottenere il notebook

Esempio end-to-end con scikit-learn in Azure Databricks

Questo notebook usa scikit-learn per illustrare un esempio completo di caricamento di dati, training del modello, ottimizzazione degli iperparametri distribuiti e inferenza del modello. Illustra anche la gestione del ciclo di vita del modello usando MLflow Model Registry per registrare e registrare il modello.

Se l'area di lavoro è abilitata per Unity Catalog, usare questa versione del notebook:

Usare scikit-learn con l'integrazione di MLflow in Databricks (Catalogo Unity)

Ottenere il notebook

Se l'area di lavoro non è abilitata per Unity Catalog, usare questa versione del notebook:

Usare scikit-learn con l'integrazione di MLflow in Databricks

Ottenere il notebook