Creare e gestire soluzioni di Machine Learning con Azure Databricks

Intermedio
Data scientist
Databricks
Machine Learning

Azure Databricks è una piattaforma su scala cloud per analisi dei dati e Machine Learning. In questo percorso di apprendimento si apprenderà come usare Azure Databricks per esplorare, preparare e modellare i dati, nonché integrarli con Azure Machine Learning.

Prerequisiti

Questo percorso di apprendimento presuppone che si abbia esperienza nell'uso di Python per esplorare i dati ed eseguire il training di modelli di Machine Learning con framework open source comuni, ad esempio Scikit-Learn, PyTorch e TensorFlow. È consigliabile completare il percorso di apprendimento Creare modelli di Machine Learning prima di iniziare questo.

Moduli in questo percorso di apprendimento

Azure Databricks consente di creare soluzioni di elaborazione dati e Machine Learning altamente scalabili.

Per lavorare con i dati in Azure Databricks, è possibile usare l'oggetto dataframe.

Prima di usare i dati per eseguire il training di un modello di Machine Learning è importante prepararli in modo appropriato.

L'apprendimento automatico prevede l'uso di dati per eseguire il training di un modello predittivo. Azure Databricks supporta più framework di apprendimento automatico di uso comune che è possibile usare per eseguire il training dei modelli.

Quando si eseguono esperimenti di data science e apprendimento automatico su larga scala è possibile usare MLflow per tenere traccia delle esecuzioni e delle metriche degli esperimenti.

In Azure Databricks è possibile distribuire e gestire i modelli di Machine Learning di cui è stato eseguito il training.

Azure Machine Learning è una piattaforma cloud scalabile per il training, la distribuzione e la gestione di soluzioni di Machine Learning.

È possibile usare Azure Databricks per eseguire il training dei modelli di Machine Learning e distribuire i modelli di cui è stato eseguito il training negli endpoint di Azure Machine Learning.

In Azure Databricks è possibile automatizzare il processo di ottimizzazione degli iperparametri per identificare più facilmente il modello migliore.

In Azure Databricks si esegue il Deep Learning distribuito usando il framework open source Horovod oltre a TensorFlow, Keras e PyTorch.